2026-02-19 03:15:26

🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #AI代理能夠檢測、修補並利用像以太坊這樣的EVM生態系統中的漏洞。該基準測試由40次審計中篩選出的120個高嚴重性漏洞構成，並包含與Tempo鏈相關的場景。測試結果顯示，GPT-5.3-Codex在「利用」模式下的得分為72.2%，而GPT-5為31.9%，但漏洞檢測和修補的覆蓋範圍仍不完整。#hack

#crypto

ETH-0.56%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人點讚了這條動態

留言

0/400

暫無留言

熱門話題