Agent 使用指南

Agent 使用指南 如何在真实世界中使用大模型? 我说想开灯,大模型能帮我开灯吗? 我们希望大模型能够直接的解决问题 这样的使用方法现在被人们称为: Agent 简单应用:如何修复一个 json 串? 错误做法: 问大模型这个字符串哪里错了? 写代码修复字符串 正确做法: “Do not change the specific content, fix the json, directly return the repaired JSON, without any explanation and dialogue.” 什么情况下我们需要 Agent ? 不需要的情况: 操作简单,人可以快速解决; 规则清晰,程序可以按规则解决; 需要的情况: 解决步骤繁琐,对于人来说是重复劳动; 情况复杂,不容易梳理清楚对应的解决规则; 场景举例 Github 的 Copilot MacOS 的 Copilot 软件自动运维 Yi 6B 的自动安装助手 上网助手 $\dots$ 高级场景举例 自动软件开发(GPT Engineer) 自动会议纪要 自动任务记录 自动会议预定 自动消息通知 高级个人助理 一切自动化流程中需要人工参与的部分 解决复杂问题有哪些难点? 解决复杂问题往往需要很多步骤; 而且正确的步骤往往也也需要探索; Agent 需要能够正确的了解自己当前解决问题的进度; 具体的步骤中,Agent 需要可以使用具体的工具; 传统 Agent 的定义 Agent = LLM + planning + memory + tools 如何打造一个联网的 LLM ? [Thought] 针对用户输入,让 LLM 判断应该从哪个搜索引擎用什么关键词 获取结果; [Act] 获取搜索引擎在对应关键词下的搜索结果; [Obs] 具体返回的搜索结果; [Thought] 判断是否回答了用户的输入,如果没有,类似第一步,继续判断如何搜索; 如何打造 Yi 6B 的自动安装助手 如何打造 MacOS 的 Copilot 如何打造一个可以自动软件开发的 Agent 这件事需要产品做什么? 找到适合的场景 设计场景下的合理交互 总结场景下的最佳实践(作为数据喂给模型就可以了) 扩展场景 大模型还没有出现 Killer APP 是因为还没有懂 Agent 的产品经理 ...

2023-12-10 · 2 分钟 · 癸老师

RAG 技术

RAG 技术 检索增强的生成系统(Retrieve Augment Generation)简称 RAG。 原理是在大语言模型的基础上,辅助检索技术,让大语言模型能够获得与用户问题相关的更多上下文信息,使得的大语言模型可以: 降低幻觉出现概率 适应垂直场景应用 弥补数据实时性不足 一个典型 RAG 系统的架构 RAG 系统的核心技术要素 文档导入 文档切分 文档向量化 向量数据库选型 检索算法 文档排序 Prompt 生成 $\dots$ 市面上大部分的关于 RAG 的介绍都是类似上面的逻辑进行的,然后就顺利的将 某一种 RAG 的方法 变成了 通用 RAG 的框架,从而让我们迷失了 RAG 的真正价值。 ...

2023-11-23 · 3 分钟 · 癸老师

大语言模型原理分享

大语言模型原理分享 什么是大语言模型? 当我说了很多话之后,我马上要说 $\Box$ 数学公式描述 $w_1, w_2,\dots, w_{N}$ 是一个单词序列,这个序列的概率分布是: $$ p(w_{1},w_{2},\dots,w_{N})=\prod^N_{i=1}p(w_{i}|w_{1},w_{2},\dots,w_{i}) $$ 大语言模型能做什么? 大模型能记住它看到过的一切信息。 大模型对于已经看到过的信息,有一定的泛化能力(有限度的推广)。 大模型能达到怎样的泛化能力? 大模型可以涌现出智能吗? ...

2023-11-21 · 1 分钟 · 癸老师

大模型的计算能力

大语言模型的计算能力 LLM 的几个核心数学问题 N-GRAM 的计算能力问题 过参数化模型的统计学习问题 非凸的数值优化问题 对深度神经网络的数学理解 Transformer 算子的含义 fine-tuning 的数学含义 N-GRAM 的计算能力 大语言模型的基本范式: 假设 $w_1, w_2,\dots, w_{N}$ 是一个单词序列。我们可以按如下公式计算单词序列的概率: $$ p(w_{1},w_{2},\dots,w_{N})=\prod^N_{i=1}p(w_{i}|w_{1},w_{2},\dots,w_{i}) $$ ...

2023-11-20 · 4 分钟 · 癸老师

组织理论讲义

组织理论 组织背后的核心要素 员工没有主人翁意识,工作不积极,不加班; 不同部门不能很好的协同合作,总是互相指责,甚至拆台; 大家想法不统一,总也拧不成一股绳; 团队氛围不好,大家都是精致的利己主义者; 留不住好员工,优秀的人培养一阵子就要跳槽(创业)去了; 有哪些手段可以解决这些组织问题? 提升管理能力(领导能力、战略决策能力等) 调整组织架构、流程、制度(机制设计、利益分配) 优化战略目标的设定和拆解(KPI 考核) 组织文化建设(使命、愿景、价值观) 可这些“办法”总让人有些隔靴瘙痒 各种方案分属不同的领域,为何能解决同一类问题? 这些问题好像也没办法被解决,只能被改进; 难以定义一个组织“质量”指标,来衡量这些手段带来的改进程度 组织的本质是共情 组织是一群有共情的人尝试进一步获取共情信息的团体 ...

2022-10-15 · 5 分钟 · 癸老师

科学决策讲义

科学决策 如何做出正确的决策 什么是决策 想做的事情很多,但没有足够的资源全做,所以要进行优先级排序; 决策的基本原则: 找到主要矛盾,对方案做优先级排序; 当主要矛盾退化为次要矛盾时,重新针对新的主要矛盾重复上述过程; 北京簋街(著名的美食街)有一家麻辣小龙虾的店:通乐老店,经营多年,营收情况一直比较稳定(盈利)。请问它如果有 500w 的投资,想进一步的发展,你会采取怎样的策略? 研究特色小龙虾; 开发小龙虾以外的特色美食; 在簋街开分店(或扩大店面); 在簋街之外开分店; 以上都做尝试; 簋街的特色是麻辣小龙虾,绝大部分食客就是冲着麻辣小龙虾去的簋街; 簋街最大的小龙虾品牌是胡大和仔仔,都有至少 5~6 家分店,而且每家分店在高峰期都会排很长的队; 通乐老店的大众点评中高赞评价是:味道不错;相比于胡大和仔仔,最大的好处是不用排队,上菜快,停车方便; 大众点评的高赞菜,除麻辣小龙虾外,主要是:麻辣板筋、馋嘴蛙、麻辣蜗牛等麻辣的特色料理。 还有一些信息 小龙虾具有季节性; 簋街的地租明显高于簋街外临近区域的租金; 预制菜和直播(吃播)是当下年轻人中流行的方式; 簋街有一家“很久以前羊肉串”也非常的火,每天排队的人也很多; 启示 决策需要充分且必要的信息。 决策是一门科学: 不同的决策者能够根据具体情况(信息充分时),得出相同或相似的结论。 如果出现不同的决策,首先要看信息是否对齐且充分和必要,再看是否运用了科学的态度进行决策。 决策所需要的信息 市场和份额 ...

2022-04-27 · 4 分钟 · 癸老师