拾柒读库

谈一谈什么是幸福的工作

从雷军的年度演讲说起最近，小米的发布会上，雷军花了一个小时讲述小米造车的故事，又一次成了互联网的热点。当然，按照互联网成王败寇的准则，现在雷军身上的一切必将镀上一层光环，讲话中的每个做法，都会成为新的成功学标杆。所以在当下的时间点，每一种解读小米或雷军的成功之处的声音，都仿佛追逐热点的“苍蝇”，“很难评”。 ...

RAG 的数学理解

问题的定义探讨 RAG 之前，我们需要对我们要解决的问题做一个重新的理解。传统的 LLM 是一个语言的概率预测模型，它描述的是语言的自然分布概率，所以对于这样的模型，没有回答的答案哪个更好的说法，只有回答的答案哪个概率更高的描述。 ...

大模型对齐的数学理解

摘要 AI alignment，广义的 SFT 技术，因为其多种多样的实现方式，包括 continue learning、fine turing、LoRA、RLHF 等等，往往让大家对这个过程充满了好奇和憧憬，觉得似乎任何 NLP 的问题，只要拥有了神乎奇迹的 SFT 能力，就能从 pre-train model 进行进一步的提升，从而解决问题。 ...

UglyChain，面向开发者的大模型开发框架

最近的新玩具：UglyChain 先上链接：UglyChain ，文档：https://uglychain.uglyboy.cn 最近几个月都在开发这个项目。一方面是自己有更多的关于大模型开发的定制需求，需要更加底层的接触模型的接口，从零开始开发适合自己的脚手架对熟悉大模型应用有很大的帮助；另一方面也确实是因为当前主流的大模型开发框架，例如 LangChain，LlamaIndex 等工具对开发者并不友好，所有的功能都封装得太过，使得使用起来很不灵活，尤其是大模型这种常常遇到不可预期的错误的情况，很难定位和解决问题。 ...

Hugo + Reveal.js 后续

摘要上一篇介绍了如何在 Hugo 中使用 Reveal.js 进行 Slide 分享后，这段时间把自己历史的分享逐一迁移到博客上了。这个过程中，又发现了上次方案的一些问题，并做了很多细节的调整，整理如下： ...

Agent 使用指南

Agent 使用指南如何在真实世界中使用大模型？我说想开灯，大模型能帮我开灯吗？我们希望大模型能够直接的解决问题这样的使用方法现在被人们称为： Agent 简单应用：如何修复一个 json 串？错误做法：问大模型这个字符串哪里错了？写代码修复字符串正确做法： “Do not change the specific content, fix the json, directly return the repaired JSON, without any explanation and dialogue.” 什么情况下我们需要 Agent ？不需要的情况：操作简单，人可以快速解决；规则清晰，程序可以按规则解决；需要的情况：解决步骤繁琐，对于人来说是重复劳动；情况复杂，不容易梳理清楚对应的解决规则；场景举例 Github 的 Copilot MacOS 的 Copilot 软件自动运维 Yi 6B 的自动安装助手上网助手 $\dots$ 高级场景举例自动软件开发（GPT Engineer）自动会议纪要自动任务记录自动会议预定自动消息通知高级个人助理一切自动化流程中需要人工参与的部分解决复杂问题有哪些难点？解决复杂问题往往需要很多步骤；而且正确的步骤往往也也需要探索； Agent 需要能够正确的了解自己当前解决问题的进度；具体的步骤中，Agent 需要可以使用具体的工具；传统 Agent 的定义 Agent = LLM + planning + memory + tools 如何打造一个联网的 LLM ？ [Thought] 针对用户输入，让 LLM 判断应该从哪个搜索引擎用什么关键词获取结果； [Act] 获取搜索引擎在对应关键词下的搜索结果； [Obs] 具体返回的搜索结果； [Thought] 判断是否回答了用户的输入，如果没有，类似第一步，继续判断如何搜索；如何打造 Yi 6B 的自动安装助手如何打造 MacOS 的 Copilot 如何打造一个可以自动软件开发的 Agent 这件事需要产品做什么？找到适合的场景设计场景下的合理交互总结场景下的最佳实践(作为数据喂给模型就可以了) 扩展场景大模型还没有出现 Killer APP 是因为还没有懂 Agent 的产品经理 ...