演讲者:
Lance (LangChain 创始工程师)
Peak (Manus 联合创始人 & 首席科学家)
- Lance
将大块信息(如工具输出)移出上下文,存到外部(如文件),仅保留引用。
通过总结(Summarization)、压缩(Compaction)或修剪(Pruning)来减少上下文长度。
在需要时,按需从外部存储中获取相关信息,重新注入上下文。
使用多 Agent 架构,每个 Agent 拥有独立的上下文窗口,分离关注点,防止干扰。
利用 KV Cache 等技术,避免重复计算共同的前缀,降低成本和延迟。
以上技术相互关联,需要在多个潜在冲突的目标之间找到完美平衡。
将上下文工程理解为一门精妙的艺术和科学,用恰当的信息填充上下文窗口以支持下一步操作。
- Lance (引用 Karpathy)
- Lance
- Lance
- Lance
"今天我想深入探讨一些我之前要么没有深入讨论,要么根本没有涉及的领域。我们会关注那些非共识的想法,因为探索它们往往会带来最大的启发。"
Peak
Manus 联合创始人 & 首席科学家
- Peak
- Peak
"不要通过共享内存来通信。相反,通过通信来共享内存。" - Go 语言社区
- Peak
- Peak
我们见到的最大飞跃并非来自添加更多花哨的管理层或巧妙的技巧,而是来自简化,来自移除不必要的技巧并更多地信任模型。
少构建,多理解。
- Peak
从真实场景出发,聚焦工具、记忆、模型、规划与安全的关键抉择。
--help
自行学习用法。grep
和 glob
,更快速直接。对于企业知识库等长期记忆场景,索引是必要的。grep
或按行读取,比 Markdown 更稳定。todo.md
范式,演进为由一个独立的 Planner Agent(Agent as Tool)进行更结构化的规划。