NVIDIA Nemotron音声・音楽確認済み

NVIDIAが音声認識AI「Nemotron 3.5 ASR」公開。40言語をリアルタイム文字起こし

NVIDIAが2026年6月6日、話し言葉を文字に変える音声認識AI「Nemotron 3.5 ASR」を公開しました。6億パラメータと小型ながら、40の言語・地域の音声を“その場で”リアルタイムに文字起こしできます。

  • 2026-06-06
  • 最終確認日 2026-06-23

NVIDIAが2026年6月6日、話し言葉を文字に変える音声認識AI「Nemotron 3.5 ASR」を公開しました。6億パラメータと小型ながら、40の言語・地域の音声を“その場で”リアルタイムに文字起こしできます。

NVIDIAが2026年6月6日、40の言語・地域をリアルタイム文字起こしできる音声認識AI「Nemotron 3.5 ASR」を公開しました。

何ができる?

Nemotron 3.5 ASRの要点
規模6億パラメータと小型で動かしやすい
対応40の言語・地域を“話している最中に”文字起こし
効率H100で従来方式の約17倍の同時処理

どう使える?

会議・授業の字幕や議事録、ライブ配信の同時字幕などに向きます。オープンウェイト公開なので自分の環境にも組み込めます。

注意

精度は言語や雑音で変わります。重要な用途では自分のデータで事前にテストしましょう。

why care

自分に関係ある?

会議・授業・配信の多言語リアルタイム字幕や議事録づくりが、軽い負荷でやりやすくなります。

source

出典

提供状況や価格は変わるため、最終判断は公式情報で確認します。

MarkTechPost / Hugging Faceを開く