Netflix 開源 Project Headroom 工具 助 AI 大幅降低 Token 用量與成本

分類: AI 新品報導   6/1/2026   Netflix


Netflix 資深工程師 Tejas Chopra 開發出一套名為 Project Headroom 的開源工具,能有效壓縮送進大型語言模型(LLM)的輸入內容,大幅減少 token 使用量,進而降低企業使用 AI 的成本。Netflix 已將該工具開源,供外界免費使用。Project Headroom 主要針對目前 AI 服務普遍採用的「token 計價」模式進行優化。許多企業在實際使用時,會不自覺將大量重複或冗餘的資料(如 JSON 格式、log 紀錄、metadata 等)送進模型,導致 token 消耗過高。Project Headroom 可在資料進入模型前進行壓縮,據稱最高能減少高達 90% 的無效 token。


內部使用已節省約 70 萬美元
Netflix 內部使用該工具後,據估計已釋放出約 2000 億個 token 的用量,換算下來約為 70 萬美元 的成本節省。Chopra 表示,開發這個工具的初衷是解決企業在大量使用 AI 時,容易因為 token 消耗過快而產生的成本壓力。

為了讓更多開發者與企業受惠,Netflix 決定將 Project Headroom 開源釋出。目前該工具已上傳至 GitHub,採用 Python 與 Node.js 實作,可作為代理層(proxy)使用,支援對話歷史壓縮、工具輸出優化、資料庫結構精簡等多種場景。

除了降低成本外,Project Headroom 也能帶來其他好處:

  • 減少上下文長度,可降低延遲(對語音應用特別有幫助)
  • 避免模型因輸入過多而出現「context rot」(上下文退化),進而提升回應品質
  • 間接減少 AI 運算所消耗的能源



目前已有不少開發者與企業開始關注這個工具,尤其是在 AI 使用成本持續上升的背景下,如何有效控管 token 用量,已成為許多公司的重要課題。

Project Headroom 的 GitHub 網址如下:

https://github.com/chopratejas/headroom

專案簡介:
目前 Star 數已超過 2000+
  • 作者:Tejas Chopra(Netflix 資深工程師)
  • 功能:壓縮送進 LLM 的 tool outputs、logs、files 以及 RAG chunks,可減少 60%~95% 的 token 用量,同時維持相同答案品質。
  • 支援形式:Library、Proxy、MCP Server


快速說明
這個工具可以作為 proxy 使用,在資料送進模型前進行壓縮,特別適合大量使用 Claude Code、Cursor、或自建 Agent 的開發者。目前已有多個外部專案在使用。
如果你需要,我可以幫你整理: