arXiv（論文）検索・リサーチ確認済み

arXiv論文：LLVMの不具合修正AIを測るLLVM-Bench、実課題423件で解決率は最大21.99%

2026年7月1日投稿のarXiv論文は、LLVMコンパイラの不具合修正を測るLLVM-Benchを提案しました。423件の実タスクを用い、複数モデルを組み合わせるLLVM-Ensで最大21.99%の解決率を報告しています。

何を調べた論文？

LLVMの実課題423件を使い、LLMがコンパイラ不具合を直せるかを評価しました。

主な数字

課題数423件

評価環境LLVM-Gymで再現からテストまで自動化

最高LLVM-Ensで最大21.99%

AIの修正案は、ビルドとテストで確かめ、複数案から選ぶ運用が大切です。

この記事が役立ったら押してください

ニュースに出てきたAIやカテゴリに近い教材を優先しています。

広告（アフィリエイト）リンクを含みます。最新の内容・料金・在庫・条件は、リンク先の公式ページ・販売ページでご確認ください。

why care

AIコード修正の限界と、テスト自動化・複数案比較の重要性がわかる実務寄りの研究です。

source

提供状況や価格は変わるため、最終判断は公式情報で確認します。