研究論文(arXiv)検索・リサーチ確認済み

arXiv論文:AIがソースなしでプログラムを再実装するMirrorCode、最強モデルは25本中56%相当

MirrorCodeは、AIエージェントに既存プログラムの振る舞いだけを見せ、ソースコードなしで同じ機能を再実装させる長期コーディングベンチマークです。Unix工具、暗号、圧縮など25本を対象に、最強モデルは56%を記録しました。

  • 2026-06-29
  • 最終確認日 2026-07-01

MirrorCodeは、AIエージェントに既存プログラムの振る舞いだけを見せ、ソースコードなしで同じ機能を再実装させる長期コーディングベンチマークです。Unix工具、暗号、圧縮など25本を対象に、最強モデルは56%を記録しました。

MirrorCodeとは?

AIが既存プログラムの振る舞いだけを見て、ソースなしで同じ機能を再実装できるかを測るベンチマークです。

主な数字
対象25本のソフトウェア
最高成績全体で56%
費用例大規模1試行で2,600ドル・19日

注意点

大きな開発を任せるほど、検証テスト、費用上限、著作権やライセンス確認が欠かせません。

PR

AIをもっと深く学べる本

ニュースに出てきたAIやカテゴリに近い教材を優先しています。

広告(アフィリエイト)リンクを含みます。最新の内容・料金・条件は、各サービスの公式ページでご確認ください。

why care

自分に関係ある?

AI開発の能力は伸びていますが、大規模再実装には費用、検証、権利確認が必要です。仕様とテストの重要性が増します。

source

出典

提供状況や価格は変わるため、最終判断は公式情報で確認します。

arXivを開く