DeepReinforce 推出開源 Agentic Coding 模型 Ornith-1.0

分類: AI 新品報導發布時間: 2026/06/28 19:00

由 DeepReinforce 團隊推出的 Ornith-1.0 是一系列專為 Agentic Coding（代理式程式設計）設計的開源大型語言模型，涵蓋從 9B 到 397B 的多種規模版本。該模型家族最核心的創新在於「自我搭建（Self-Scaffolding）」能力——模型不僅學習如何解決任務，還能同時學習生成任務專屬的 scaffold（引導框架），讓自己在強化學習過程中持續優化搜尋軌跡與解題品質。

主要特色與技術亮點

自我改善訓練框架：在 RL 訓練中，模型會先產生任務專屬的 scaffold，再根據該 scaffold 生成解決方案，最後將 reward 同時反饋給 scaffold 與 solution 兩個階段。
多規模版本：
- Ornith-1.0-9B（Dense，適合邊緣裝置）
- Ornith-1.0-31B（Dense）
- Ornith-1.0-35B（MoE，活躍參數約 3B）
- Ornith-1.0-397B（MoE 旗艦版）
強大基準表現：在 Terminal-Bench 2.1、SWE-Bench Verified、NL2Repo 等代理式程式設計基準上，表現優於同規模開源模型，甚至在部分任務上接近或超越 Claude Opus 4.7 等閉源模型。
防 Reward Hacking 機制：採用三層防護（不可變環境邊界、確定性監控、凍結 LLM 評審），有效降低模型作弊風險。
基於 Gemma 4 與 Qwen 3.5 進行後訓練，並採用非同步 Pipeline RL + 陳舊權重（staleness-weighted）優化訓練穩定性。

性能表現（部分亮點）

模型

Terminal-Bench 2.1

SWE-Bench Verified

特色

Ornith-1.0-9B

43.1%

69.4%

輕量、適合本地部署

Ornith-1.0-35B

高

MoE 效率佳

Ornith-1.0-397B

77.5%

82.4%

目前開源 Agentic Coding 最強之一

安裝與使用指南
Ornith-1.0 模型已上傳至 Hugging Face，支援多種推理框架。

1. 使用 Transformers（最簡單方式）

pip install "transformers>=5.8.1" torch

Pythonfrom transformers import AutoModelForCausalLM, AutoTokenizer 
 
model_name = "deepreinforce-ai/Ornith-1.0-9B" # 可換成 31B、35B、397B 
 
tokenizer = AutoTokenizer.from_pretrained(model_name) 
model = AutoModelForCausalLM.from_pretrained( 
 model_name, 
 dtype="auto", 
 device_map="auto" 
) 
 
messages = [ 
 {"role": "user", "content": "Write a Python function to check if a number is prime."} 
] 
 
inputs = tokenizer.apply_chat_template( 
 messages, 
 add_generation_prompt=True, 
 return_tensors="pt" 
).to(model.device) 
 
outputs = model.generate( 
 inputs, 
 max_new_tokens=512, 
 temperature=0.7, 
 do_sample=True 
) 
 
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

2. 使用 vLLM（推薦用於較大模型）

pip install vllm

vllm serve deepreinforce-ai/Ornith-1.0-35B --port 8000

3. 使用 GGUF 版本（適合本地低資源部署）
部分社群已提供 GGUF 量化版本，可使用 Ollama 或 llama.cpp 運行：

# 以 Ollama 為例 
ollama run hf.co/samuelchristlie/Ornith-1.0-9B-gguf

4. 使用 SGLang（高吞吐推理）

pip install sglang 
python -m sglang.launch_server --model-path deepreinforce-ai/Ornith-1.0-35B --port 30000

模型連結

官方集合：https://huggingface.co/collections/deepreinforce-ai/ornith-10
官方技術說明：https://deep-reinforce.com/ornith_1_0.html
聊天模板：各模型卡片中均提供 chat_template.jinja

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 中職》陳昱勛收到美聯球隊報價申請撤銷選秀報名

⊙ 這個庇護島又被撞！68歲男「切西瓜」提早左轉自撞路中庇護島

⊙ 美食地圖來了！全台《500碗》彰化29家上榜、5家連莊

⊙ 世足》「以和為貴」害伊朗出局？奧地利教頭駁斥陰謀論

⊙ 金曲37》A-Lin打敗歌王歌后奪年度歌曲親揭張震嶽親戚關係偷塞東西給他

⊙ 去年產創條例研發支出2540億抵減稅額492億創新高

⊙ 屏東縣淹水補助》50公分以上最高補助4.5萬元、以下1萬元

⊙ 沈伯洋推「家長版1999」 0-18歲育兒家庭1支電話解疑難雜症

⊙ 考量敵情變化迅速、平戰分野模糊國軍練兵三部曲強調唯「快」不破

⊙ 台南弱勢家庭住家遇雨漏水做工行善團助修繕

⊙ 指AI防洪預警應放入「台北通」柯文哲笑稱：推陳宥丞選市長算了

⊙ 劉至翰轉行賣輪胎！任行銷總監半年拚出亮眼成績：不是來拍照的

⊙ 王齊麟再次擔任「羽您有約」宣傳大使！活動報名費將全數捐贈清寒學生

⊙ 世足》南韓隊從「蜂蜜組」跌進淘汰深淵韓媒狠批：沒資格求別人幫忙

⊙ 參與新莊保元宮250週年遶境李四川：不分顏色、只拚建設

⊙ [擇法善思林之蘭室藏津]

市場快報

神腦年中慶開跑指定商品最高贈2500神腦幣 iPhone換電池最高省800元

燦坤3C家電年中慶開跑指定商品5折起滿額抽旅遊金

神腦國際攜手FutureDial打造全台首創手機健康管理中心

燦坤會員寵物卡週年慶寵物價商品54折起

BRITA 攜手《怪奇物語》女星米莉芭比布朗打造新世代喝水風潮

哈燒王 Hot3C

DeepReinforce 推出開源 Agentic Coding 模型 Ornith-1.0

分類: AI 新品報導發布時間: 2026/06/28 19:00

相關文章:

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 中職》陳昱勛收到美聯球隊報價申請撤銷選秀報名

⊙ 這個庇護島又被撞！68歲男「切西瓜」提早左轉自撞路中庇護島

⊙ 美食地圖來了！全台《500碗》彰化29家上榜、5家連莊

⊙ 世足》「以和為貴」害伊朗出局？奧地利教頭駁斥陰謀論

⊙ 金曲37》A-Lin打敗歌王歌后奪年度歌曲親揭張震嶽親戚關係偷塞東西給他

⊙ 去年產創條例研發支出2540億抵減稅額492億創新高

⊙ 屏東縣淹水補助》50公分以上最高補助4.5萬元、以下1萬元

⊙ 沈伯洋推「家長版1999」 0-18歲育兒家庭1支電話解疑難雜症

⊙ 考量敵情變化迅速、平戰分野模糊國軍練兵三部曲強調唯「快」不破

⊙ 台南弱勢家庭住家遇雨漏水做工行善團助修繕

⊙ 指AI防洪預警應放入「台北通」柯文哲笑稱：推陳宥丞選市長算了

⊙ 劉至翰轉行賣輪胎！任行銷總監半年拚出亮眼成績：不是來拍照的

⊙ 王齊麟再次擔任「羽您有約」宣傳大使！活動報名費將全數捐贈清寒學生

⊙ 世足》南韓隊從「蜂蜜組」跌進淘汰深淵韓媒狠批：沒資格求別人幫忙

⊙ 參與新莊保元宮250週年遶境李四川：不分顏色、只拚建設

⊙ [擇法善思林之蘭室藏津]

市場快報

哈燒王 Hot3C

DeepReinforce 推出開源 Agentic Coding 模型 Ornith-1.0

分類: AI 新品報導 發布時間: 2026/06/28 19:00

相關文章:

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 中職》陳昱勛收到美聯球隊報價 申請撤銷選秀報名

⊙ 這個庇護島又被撞！68歲男「切西瓜」提早左轉 自撞路中庇護島

⊙ 美食地圖來了！ 全台《500碗》彰化29家上榜、5家連莊

⊙ 世足》「以和為貴」害伊朗出局？ 奧地利教頭駁斥陰謀論

⊙ 金曲37》A-Lin打敗歌王歌后奪年度歌曲 親揭張震嶽親戚關係偷塞東西給他

⊙ 去年產創條例研發支出2540億 抵減稅額492億創新高

⊙ 屏東縣淹水補助》50公分以上最高補助4.5萬元、以下1萬元

⊙ 沈伯洋推「家長版1999」 0-18歲育兒家庭1支電話解疑難雜症

⊙ 考量敵情變化迅速、平戰分野模糊 國軍練兵三部曲強調唯「快」不破

⊙ 台南弱勢家庭住家遇雨漏水 做工行善團助修繕

⊙ 指AI防洪預警應放入「台北通」 柯文哲笑稱：推陳宥丞選市長算了

⊙ 劉至翰轉行賣輪胎！ 任行銷總監半年拚出亮眼成績：不是來拍照的

⊙ 王齊麟再次擔任「羽您有約」宣傳大使！活動報名費將全數捐贈清寒學生

⊙ 世足》南韓隊從「蜂蜜組」跌進淘汰深淵 韓媒狠批：沒資格求別人幫忙

⊙ 參與新莊保元宮250週年遶境 李四川：不分顏色、只拚建設

⊙ [擇法善思林之蘭室藏津]

相關新聞

相關新聞

市場快報

分類: AI 新品報導發布時間: 2026/06/28 19:00

⊙ 中職》陳昱勛收到美聯球隊報價申請撤銷選秀報名

⊙ 這個庇護島又被撞！68歲男「切西瓜」提早左轉自撞路中庇護島

⊙ 美食地圖來了！全台《500碗》彰化29家上榜、5家連莊

⊙ 世足》「以和為貴」害伊朗出局？奧地利教頭駁斥陰謀論

⊙ 金曲37》A-Lin打敗歌王歌后奪年度歌曲親揭張震嶽親戚關係偷塞東西給他

⊙ 去年產創條例研發支出2540億抵減稅額492億創新高

⊙ 考量敵情變化迅速、平戰分野模糊國軍練兵三部曲強調唯「快」不破

⊙ 台南弱勢家庭住家遇雨漏水做工行善團助修繕

⊙ 指AI防洪預警應放入「台北通」柯文哲笑稱：推陳宥丞選市長算了

⊙ 劉至翰轉行賣輪胎！任行銷總監半年拚出亮眼成績：不是來拍照的

⊙ 世足》南韓隊從「蜂蜜組」跌進淘汰深淵韓媒狠批：沒資格求別人幫忙

⊙ 參與新莊保元宮250週年遶境李四川：不分顏色、只拚建設