LLM | 拾柒读库

Anthropic 说 AI 要自我进化了？让我们来聊一聊大模型真正的瓶颈

2026 年 6 月，Anthropic 发了一篇文章，题目叫《When AI builds itself》。文章说，Claude 现在能写超过 80% 的合并代码，工程师的人均产出涨了 8 倍。然后他们画了一条时间线：从“人写代码”到“AI 辅助写代码”再到“AI 自主写代码”，箭头指向一个终点——AI 能够完全自主地设计和训练自己的后继者。 ...

从编码到 AGI

这是一段关于大语言模型（LLM）原理与垂直场景应用的分享。本期内容从编码到 AGI 的演进之路大语言模型的基本原理垂直场景应用实践

从编码到 AGI

大语言模型的原理与垂直场景应用

大模型的推理能力

引言自 GPT3.5 引爆大模型概念以来，大家都期盼着 AGI1 的到来。但与此同时，当下各类大模型虽然依据 Scaling Law2，不断提升各方面的性能，但是关于模型的推理能力，总显得不足。甚至科研界针对大模型究竟是否可能具有推理能力，也争论不休。例如下列近期比较热烈的讨论： ...

编码的意义

导言伴随着大模型研究的推进和在应用中的实践，我们发现了一个现象——对于现有的 LLM 模型而言，一个好的编码可能会对其模型能力带来极大的助力。关于这方面的思考其实由来已久，早前在听闻“压缩即智能”的论断，以及相关的数学阐述时，就产生过一种奇妙的念头： ...

RAG 的数学理解

问题的定义探讨 RAG 之前，我们需要对我们要解决的问题做一个重新的理解。传统的 LLM 是一个语言的概率预测模型，它描述的是语言的自然分布概率，所以对于这样的模型，没有回答的答案哪个更好的说法，只有回答的答案哪个概率更高的描述。 ...