| 失效链接处理 |
|
GitHub 狂揽 4万+ Star!这个项目直接让你省下60–95%的Token 。。。
相关截图:
![]() 主要内容:
先说说:Token 到底烧在哪了?
如果你经常用 Claude Code、Cursor、Codex 这类 AI 编程助手,大概都有过这种体验:
搜一下代码,返回 100 条结果,一下子就是好几万 Token
读日志、查 Issue、跑工具,每一轮对话都在往上下文里堆东西
模型不仅要「读」你发过去的内容,还要「写」回复——两边都算钱
问题往往不在你的问题本身,而在工具输出、日志、RAG 检索结果、历史对话这些「背景噪音」。它们占了大头,但真正有用的可能只有一小部分。
Headroom 就是专门解决这个问题的。它在你的应用和 LLM 之间加了一层「压缩滤镜」:把要发给模型的内容先瘦身,模型该答对的还是答对,Token 却能少掉 60%~95%。
Headroom 是什么?
Headroom 是一个开源的 AI Agent 上下文压缩层,由 Tejas Chopra 发起,目前在 GitHub 上已有 4 万+ Star。
它压缩的对象包括:
工具调用返回的结果(比如代码搜索、文件读取)
日志和报错信息
RAG 检索到的文档片段
文件内容和对话历史
几个关键特点:
|


苏公网安备 32061202001004号
