Google 推出 DiffusionGemma 開放實驗模型,文字生成速度提升 4 倍



Google DeepMind 於 2026 年 6 月 10 日正式發布 DiffusionGemma,這是 Google 第一款採用「擴散技術」(Diffusion)進行文字生成的開放實驗模型。與傳統自迴歸(Autoregressive)模型逐詞從左到右生成的方式不同,DiffusionGemma 可以一次生成整段文字,大幅提升推理速度。

DiffusionGemma 建立在 Gemma 4 系列與 Gemini Diffusion 研究之上,採用 26B Mixture-of-Experts(MoE)架構,推論時僅激活約 3.8B 參數。
其最大特色在於使用「擴散」機制進行文字生成:

  • 模型會先建立一個充滿隨機佔位符的「文字畫布」。
  • 透過多次迭代優化,逐步修正文字內容。
  • 具備雙向注意力(Bidirectional Attention),能同時考量整段文字的上下文。
  • 支援自我修正機制,可在生成過程中即時修復錯誤。
這種方式特別適合需要非線性處理的任務,例如程式碼補全、即時編輯、數學圖形推理等。

根據 Google 公布的數據,DiffusionGemma 在 GPU 上的推理速度最高可比傳統自迴歸模型快 4 倍。量化後的版本可在高階消費級 GPU(如 RTX 5090)上運行,VRAM 需求約 18GB。
Google 表示,該模型特別適合以下場景:

  • 本地端互動式應用
  • 即時程式碼生成與編輯
  • 低延遲的單用戶工作流程
不過,Google 也坦言,DiffusionGemma 在部分基準測試中的輸出品質仍略低於標準 Gemma 4 模型,因此建議在需要最高品質的應用中,仍優先使用傳統 Gemma 4。

DiffusionGemma 已正式開放,採用 Apache 2.0 授權,使用者可自由使用、修改與商業化。目前可在以下平台取得:

  • Hugging Face:google/diffusiongemma-26B-A4B-it
  • Google Cloud Model Garden
  • NVIDIA NIM
  • vLLM
  • llama.cpp(即將支援)
傳統大型語言模型大多採用自迴歸架構,一次只能生成一個 token,這在單一 GPU 的本地環境中效率較低。DiffusionGemma 則借鏡圖像生成領域的擴散模型概念,將文字生成轉為「平行處理整段文字」的模式。 Google 研究團隊指出,這種架構在互動式 coding、即時編輯,以及需要雙向上下文理解的任務上,具有明顯優勢。


相關文章:

《隨機鸚鵡的危險》論文與 Timnit Gebru 被 Google 解雇事件  [6/10/2026]
Google 推出 Agentic RAG 框架 提升企業 AI 回答準確度  [6/7/2026]
Google 正式釋出 Gemma 4 12B-it 多模態模型適合本地部署  [6/4/2026]
Google 鼓勵開發者善用 AI 加速 PostgreSQL 貢獻  [5/30/2026]
Google I/O 2026:Chrome 推出 15 項更新,邁向代理式網路時代  [5/20/2026]
[「擇法善思林之蘭室藏津」的緣起]
71歲翁為氣切女友「衝動」戒菸 成功擺脫52年菸癮
自然組錄取率達94%? 警專:整體錄取率48%、落實汰劣把關素質
饒慶鈴這招參與海峽論壇「對接簽約會」 官員:依法查處
中職》障礙不只600萬簽約金 吉力吉撈更為二軍底薪抱不平
誤認情敵狂追車還斜插擋去路 台中吃醋男搞烏龍遭送辦
藍白合跑新莊大拜拜 李四川:持續傳承宮廟文化、發揚光大
綠委提減列中正紀念堂廟門維護費 沈伯洋:錢要花在刀口上
水彩疊影創作 游雯珍展現十年心血的時空魅力
黃大煒夏威夷辭世!紀寶如聞噩耗悲嘆:生命太無常
PLG冠軍賽》卡總保證會有G7 回應領航猿迷航「如果我有答案我們就贏了」
蔣萬安赴星領獎!市府新聞稿與李光耀官網有落差 挨轟割稻尾
和順國中國樂團廟口開演 打造社區與校園共融
只有4個字卻看哭一票人 舒淇送別黃大煒藏深情
PLG冠軍賽》21分領先險花光是領航猿很強 許晉哲:開打前沒人看好我們
蔣萬安稱李光耀城市獎是建設成果 沈伯洋:來自扁馬郝柯政績累積
[擇法善思林之蘭室藏津]