OpenAI nag-launch ng crypto security tool pagkatapos ng ₱156.43M Moonwell bug
Nag-release ang OpenAI at Paradigm ng EVMbench noong Miyerkules, isang tool na nag-test sa kakayahan ng AI agents na ma-identify, i-patch, o i-exploit ang mga vulnerabilities sa smart contract. Ang release ay dumating ilang araw matapos ang isang bug sa AI-generated code na nagpawala sa mga users ng Moonwell ng ₱156.43 milyon ($2.7 milyon).
Nag-release ang OpenAI at Paradigm ng EVMbench noong Miyerkules, isang tool na nag-test sa kakayahan ng AI agents na ma-identify, i-patch, o i-exploit ang mga vulnerabilities sa smart contract. Matalas ang timing — ilang araw bago ang launch, nawala ang ₱156.43 milyon ($2.7 milyon) ng mga users ng Moonwell dahil sa bug sa AI-generated code.
Kinuha ng benchmark ang 120 vulnerabilities mula sa 40 naunang smart contract audits. Nag-contribute ang crypto venture capital firm na Paradigm ng mga vulnerability scenarios mula sa mga audits ng paparating nilang Tempo blockchain. Ang pinakabagong model ng OpenAI na GPT-5.3-Codex ay doble naman ang bilis ng GPT-5 pagdating sa pag-exploit ng vulnerabilities, at nag-score pa ng pinakamataas sa pag-patch ng mga ito.
Pero mas mahirap pala ang pag-detect ng mga problema kaysa sa pag-exploit. Naka-score ng pinakamataas na mean result ang Claude Opus 4.6 ng Anthropic sa pag-detect ng vulnerabilities, though sinabi ng OpenAI sa news release nila na lahat ng models ay below pa rin sa full coverage. Pinakamahusay ang performance ng AI agents kapag explicit ang objective: tuloy lang ang pag-drain ng funds hanggang maubos. Kumpara doon, mas mahina ang performance sa detect at patch tasks kasi minsan humihinto na ang agents pagkatapos makahanap ng isang issue, instead na i-audit ang buong codebase.
Nagpapakita ang Moonwell incident ng risk na involved. Sinabi ng isang software engineer sa protocol na ang code na yun ay pumasa pa sa audit ng crypto security firm na Halborn. May kasamang warning ang OpenAI sa EVMbench: hindi nakukuha ng tool ang tunay na challenge ng pag-secure ng smart contracts dahil sa limited sample ng vulnerabilities. Sinabi rin ng company na hindi nila mapagkakatiwalaang matukoy kung ang mga vulnerabilities na nahanap ng agent ay false positives. Nawala na ang $108 million sa mga protocols dahil sa hacks at exploits so far this year, base sa data ng DefiLlama noong Miyerkules ng gabi.
Ang artikulong ito ay isinulat batay sa ulat mula sa Dlnews.




