NVIDIA 釋出 0.6B Nemotron 3.5 ASR:純 CPU 即可即時轉錄 40 種語言



NVIDIA 近日正式推出 Nemotron 3.5 ASR(全名:Nemotron 3.5 ASR Streaming Multilingual 0.6B),這是一款僅有 6 億參數的開源串流自動語音辨識(ASR)模型。它能以單一 checkpoint 即時轉錄 40 種語言/地區變體,且支援純 CPU 運作,適合本地部署與 AI Agent 應用。


Nemotron 3.5 ASR 採用 Cache-Aware FastConformer + RNNT 架構,具備以下亮點:

  • 多語言支援:單一模型涵蓋 40 種語言/地區(包含英文、西班牙文、日文、繁體中文、簡體中文等),可透過語言 ID 提示(language prompt)或自動偵測切換。
  • 低延遲串流:端點延遲可低至 80ms,適合即時語音互動場景。
  • 內建功能:自動加上標點符號與大寫、支援 Word Boosting(特定詞彙優先辨識)、Speaker Diarization(說話者區分)。
  • 輕量高效:模型體積小,純 CPU 即可流暢運作,也能在 Apple Silicon 上良好執行。
  • 開源授權:採用 OpenMDW-1.1 授權,權重已上傳至 Hugging Face(nvidia/nemotron-3.5-asr-streaming-0.6b)。
相較於 Whisper 系列模型,Nemotron 3.5 ASR 在串流即時性上具有明顯優勢,適合需要低延遲語音輸入的本地 AI Agent 應用。

安裝與使用方式

1. 使用 NVIDIA NeMo 框架(推薦)

# 安裝 NeMo(含 ASR 相關依賴)

pip install "git+https://github.com/NVIDIA/NeMo.git@main#egg=nemo_toolkit[asr]" 

載入模型並進行轉錄:

Pythonimport nemo.collections.asr as nemo_asr 
 
# 載入模型 
asr_model = nemo_asr.models.ASRModel.from_pretrained( 
 model_name="nvidia/nemotron-3.5-asr-streaming-0.6b" 
) 
 
# 進行轉錄(支援串流與批次模式) 
transcriptions = asr_model.transcribe(["audio.wav"]) 
print(transcriptions) 

2. 部署為 OpenAI 相容 API 伺服器

Nemotron 3.5 ASR 可透過 NeMo 輕易包裝成 OpenAI 相容的語音轉文字端點(/v1/audio/transcriptions),方便與現有應用程式整合。

3. NVIDIA NIM(即將推出)

NVIDIA 預計透過 NIM(NVIDIA Inference Microservices) 提供更完整的部署方案,支援 gRPC 串流與多種硬體平台。

Nemotron 3.5 ASR 特別適合以下應用:

  • 本地語音 AI Agent:與 Nemotron 語言模型、TTS 模型結合,打造完整本地語音互動系統。
  • 即時會議記錄與字幕:低延遲串流特性適合線上會議、直播字幕。
  • 多語言客服與語音助理:單一模型支援多語言,降低部署複雜度。
  • 隱私優先應用:所有語音處理都在本地進行,資料不離開裝置。
  • 嵌入式與邊緣裝置:體積小、CPU 友好,適合部署在筆電或邊緣設備上。
與 Whisper 的比較

項目
Nemotron 3.5
ASRWhisper(大型模型)
參數量
0.6B
數十億至上百億
串流即時性
極佳(低延遲)
一般
多語言支援
單一模型支援 40 種
多模型或多語言混合
CPU 運作
優秀
需較高資源
標點與大寫
內建
需額外處理
開源與部署彈性

NVIDIA Nemotron 3.5 ASR 的推出,進一步降低了本地部署高品質串流語音辨識的門檻。其輕量、多語言、低延遲的特性,使其成為開發本地 AI Agent、語音助理與即時轉錄應用的強力選擇。
目前模型已可在 Hugging Face 免費下載,搭配 NeMo 框架即可快速上手。NVIDIA 也正積極推動與 LiveKit 等即時通訊框架的整合,預計後續將有更多實際應用案例出現。

官方資源:
Hugging Face 模型頁面:
https://huggingface.co/nvidia/nemotron-3.5-asr-streaming-0.6b


相關文章:

NVIDIA 挑戰 x86 霸權:NEX 平台能否重寫 Windows on ARM 命運?  [6/4/2026]
NVIDIA RTX Spark 超級晶片問世,個人 AI 代理時代來臨  [6/1/2026]
[「擇法善思林之蘭室藏津」的緣起]
中職》一向「腳慢」的董子恩單場2盜 後藤認為腳程並非重點
彰化奇景!溪州鄉老厝圍牆掛滿「珠寶」 竟是逾百顆蝴蝶蛹
中職》封王戰完全宰制!味全王牌無雙13K 飆破高懸27年紀錄
棒球》南韓高中左投拒洋基7000萬元簽約金 台灣青棒二刀流覺得不可思議
端午連假台中各大商圈單日狂湧5萬人 麗寶、高美濕地遊客如織
不下水的龍舟賽!屏東市陸上行舟 上百隊衝衝衝熱戰
世足》連兩戰遇對手烏龍球!美國不可思議地主靈氣擊敗澳洲晉級
中職》「兩年前給球迷印象只有唱歌…」鈴木駿輔前東家主場寫紀錄有感觸
棒球》投手陣容超華麗! U18亞青賽36人培訓名單亮牌
網球》詹皓晴諾丁漢女雙爭冠!攜手青山修子連3場逆轉勝
游泳》奧運蛙式金牌飆破自由式世界紀錄 美國女將道格拉絲超意外
棒球》台中小將射日成功 8月進軍美國小馬聯盟世界賽
白家綺婚宴超狂「伴娘、花童全自己生」 超正女兒現身驚豔全場
中職》兄弟啦啦隊成員驚傳遇持刀攻擊 球團發布聲明
中職》「0球」先發後振作!鈴木駿輔猛飆生涯首次1安打完封
[擇法善思林之蘭室藏津]