研究論文（arXiv）検索・リサーチ確認済み

arXiv論文：AIがソースなしでプログラムを再実装するMirrorCode、最強モデルは25本中56%相当

MirrorCodeは、AIエージェントに既存プログラムの振る舞いだけを見せ、ソースコードなしで同じ機能を再実装させる長期コーディングベンチマークです。Unix工具、暗号、圧縮など25本を対象に、最強モデルは56%を記録しました。

MirrorCodeとは？

AIが既存プログラムの振る舞いだけを見て、ソースなしで同じ機能を再実装できるかを測るベンチマークです。

主な数字

対象25本のソフトウェア

最高成績全体で56%

費用例大規模1試行で2,600ドル・19日

大きな開発を任せるほど、検証テスト、費用上限、著作権やライセンス確認が欠かせません。

この記事が役立ったら押してください

ニュースに出てきたAIやカテゴリに近い教材を優先しています。

広告（アフィリエイト）リンクを含みます。最新の内容・料金・条件は、各サービスの公式ページでご確認ください。

why care

AI開発の能力は伸びていますが、大規模再実装には費用、検証、権利確認が必要です。仕様とテストの重要性が増します。

source

提供状況や価格は変わるため、最終判断は公式情報で確認します。