OpenAI heeft een benchmarkframework onthuld dat gericht is op het meten van hoe effectief AI-agents beveiligingskwetsbaarheden in crypto kunnen detecteren, beperken en zelfs exploiterenOpenAI heeft een benchmarkframework onthuld dat gericht is op het meten van hoe effectief AI-agents beveiligingskwetsbaarheden in crypto kunnen detecteren, beperken en zelfs exploiteren

OpenAI Laat AI-Agenten Tegen Elkaar Strijden om Smart Contracts te Red-Teamen

Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI heeft een benchmarkframework onthuld dat bedoeld is om te meten hoe effectief AI-agents beveiligingskwetsbaarheden in crypto smart contracts kunnen detecteren, beperken en zelfs exploiteren. Het project, getiteld "EVMbench: Evaluating AI Agents on Smart Contract Security," werd uitgebracht in samenwerking met Paradigm en OtterSec, twee organisaties met diepgaande expertise op het gebied van blockchainbeveiliging en investeringen. De studie beoordeelt AI-agents aan de hand van een samengestelde set van 120 potentiële zwakke punten uit 40 smart contract-audits, met als doel niet alleen detectie- en patchmogelijkheden te kwantificeren, maar ook het theoretische exploitatiepotentieel van deze agents in een gecontroleerde omgeving.

Belangrijkste conclusies

  • EVMbench test AI-agents tegen 120 kwetsbaarheden uit 40 smart contract-audits, met nadruk op kwetsbaarheden afkomstig uit open-source auditwedstrijden.
  • Van de geteste modellen leidde Anthropic's Claude Opus 4.6 met een gemiddelde detectiebeloning van $37.824, gevolgd door OpenAI's OC-GPT-5.2 met $31.623 en Google's Gemini 3 Pro met $25.112.
  • OpenAI positioneert de benchmark als een stap in de richting van het meten van AI-prestaties in "economisch betekenisvolle omgevingen," niet alleen speeltaken, waarbij de praktische implicaties voor aanvallers en verdedigers in het crypto-beveiligingslandschap worden benadrukt.
  • De onderzoekers merken op dat smart contracts miljarden dollars aan activa beveiligen, wat de strategische waarde van AI-enabled tooling voor zowel offensieve als defensieve activiteiten onderstreept.
  • Brancheobservators hebben deze ontwikkelingen gekoppeld aan bredere discussies over AI-gestuurde betalingen en de rol van stablecoins in dagelijkse transacties, waarbij grote executives een groeiend agentisch gebruik in de komende jaren voorspellen.
  • De context voor dergelijk werk wordt onderstreept door de crypto-beveiligingsincidentgegevens van 2025, die een voortdurende stroom van fondsen via kwetsbaarheden en aanvallen tonen, wat de vraag naar robuuste AI-enabled audit- en defensiemechanismen versterkt.

Detectiebeloningen voor AI-agents worden gedetailleerd beschreven in de OpenAI PDF die bij de studie hoort, waarin ook de evaluatiemethodologie en de scenario's worden beschreven die worden gebruikt om real-world smart contract-risico's te simuleren. De auteurs benadrukken dat hoewel AI-agents zijn geëvolueerd om een breed scala aan routinetaken te automatiseren, het beoordelen van hun prestaties in "economisch betekenisvolle omgevingen" essentieel is om te begrijpen hoe ze onder druk in productiesystemen zullen presteren.

OpenAI merkt op dat het verwacht dat agentische technologieën de reikwijdte van betalingen en afwikkeling zullen verbreden, inclusief stablecoins die worden gebruikt in geautomatiseerde workflows. De discussie rond AI-enabled betalingen strekt zich uit tot voorbij beveiligingstests tot de bredere vraag hoe autonome systemen zullen deelnemen aan dagelijkse financiële activiteiten. De eigen projecties van het bedrijf suggereren dat agentische betalingen gebruikelijker kunnen worden, waarbij AI-capaciteiten worden verankerd in praktische gebruikssituaties die alledaagse consententransacties raken.

Samen met de benchmarkresultaten heeft Circle CEO Jeremy Allaire publiekelijk voorspeld dat miljarden AI-agents binnen de komende vijf jaar met stablecoins zouden kunnen transacteren voor dagelijkse betalingen. Die visie snijdt een terugkerend thema in cryptokringen: het potentieel voor crypto om de native valuta van AI-agents te worden, een verhaal dat aanzienlijke aandacht heeft gekregen van brancheleiders en investeerders. Hoewel dergelijke voorspellingen speculatief blijven, is de onderliggende trend duidelijk—AI-automatisering beweegt van het lab naar de transactielaag, waar het zou kunnen hervormen hoe waarde over netwerken beweegt.

De studie komt op een moment waarop cryptobeveiliging een aanzienlijke risicofactor blijft voor investeerders. Het gegevenspunt over de aanval op cryptofondsen in 2025—waar aanvallers ongeveer $3,4 miljard buitmaakten—benadrukt de urgentie van verbeterde tooling en snellere, betrouwbaardere patchmechanismen. Het EVMbench-framework is deels gepositioneerd als een manier om te meten of AI-agents op schaal zinvol kunnen bijdragen aan defensieve capaciteiten, waarbij exploitatiemogelijkheden worden verminderd en dreigingsbeperking wordt versneld.

Om de benchmark te bouwen, maakten onderzoekers gebruik van 120 samengestelde kwetsbaarheden over 40 smart contract-audits, waarbij veel zwakke punten terug te voeren zijn op open-source audit-uitdagingen. OpenAI stelt dat de benchmark zal helpen de AI-vooruitgang bij te houden bij het herkennen en beperken van zwakke punten op contractniveau op schaal, en biedt een gestandaardiseerde manier om toekomstige AI-modellen te vergelijken naarmate ze evolueren. De studie biedt ook inzicht in hoe AI kan worden toegepast om risicobeoordeling te normaliseren over een breed scala aan smart contract-architecturen, in plaats van alleen te focussen op geïsoleerde gevallen.

Smart contracts zijn niet gebouwd voor mensen: Dragonfly

In een gelijktijdige thread op X beweerde Haseeb Qureshi, partner bij Dragonfly, dat crypto's belofte om eigendomsrechten en traditionele contracten te vervangen nooit is uitgekomen, niet omdat de technologie faalde, maar omdat het nooit is ontworpen met menselijke intuïtie in gedachten. Hij heeft de aanhoudende angst benadrukt die gepaard gaat met het ondertekenen van grote transacties in een omgeving waar drainer wallets en andere aanvalsvectoren een constante bedreiging blijven, in schril contrast met de relatief soepelere ervaring van traditionele bankoverschrijvingen.

Qureshi stelt dat de volgende fase van cryptotransacties mogelijk kan worden gemaakt door AI-gemedieerde, zelfrijdende wallets. Dergelijke wallets zouden risico's monitoren, complexe operaties beheren en autonoom reageren op bedreigingen namens gebruikers, waardoor mogelijk de wrijving en angst worden verminderd die grote overdrachten vandaag kenmerken.

De bredere conclusie uit deze thread is dat AI-agents een cruciale rol kunnen spelen bij het transformeren van hoe mensen omgaan met crypto—door te verschuiven van handmatige, foutgevoelige transacties naar geautomatiseerde, risicobewuste processen die kunnen schalen met adoptie. Naarmate AI-agents meer competentie beginnen te tonen bij het omgaan met beveiligingszorgen, kunnen gebruikers verbeterde betrouwbaarheid en veerkracht zien in gedecentraliseerde financiële workflows, zelfs terwijl de onderliggende technologieën blijven rijpen.

Wat te volgen

  • Publicatie en onafhankelijke replicatie van de volledige EVMbench-dataset over aanvullende AI-modellen en architecturen.
  • Bredere adoptie van AI-ondersteunde auditworkflows door auditors, exchanges en DeFi-projecten die hun beveiligingshouding willen versterken.
  • Verkenningen van agentische wallets en autonome betalingsstromen, inclusief regelgevende en nalevingsoverwegingen voor AI-beheerde activa.
  • Vervolgbenchmarks die meer AI-systemen vergelijken naarmate nieuwe versies worden uitgerold, waarbij verbeteringen in detectienauwkeurigheid en patchsnelheid worden gevolgd.

Bronnen & verificatie

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Crypto security losses in 2025 (reporting coverage): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi on AI and crypto UX (X post): https://x.com/hosseeb/status/2024136762424185208
  • China's AI lead and crypto implications (analysis): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw and AI bot developments in Polymarket coverage: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Belangrijke cijfers en volgende stappen

De EVMbench-studie toont aan dat large language models en gerelateerde AI-agents zinvol beveiligingswerk beginnen uit te voeren in de smart contract-ruimte, met duidelijk kwantificeerbare verschillen tussen modellen. Claude Opus 4.6's voorsprong in gemiddelde detectiebeloningen geeft aan dat bepaalde architecturen beter in staat kunnen zijn kwetsbaarheden binnen complexe contractlogica te detecteren en te beperken, terwijl anderen achterblijven, wat een spectrum aan capaciteiten biedt dat onderzoekers waarschijnlijk willen verfijnen. De opname van meerdere branchepartnerships in het project onderstreept de groeiende consensus dat AI-enabled beveiliging en geautomatiseerd risicobeheer essentieel kunnen worden om te schalen in gedecentraliseerde omgevingen.

Naarmate het veld evolueert, zullen waarnemers kijken naar hoe snel AI-agents kunnen overschakelen van detectie naar herstel, en of deze agents betrouwbaar kunnen werken in live systemen zonder nieuwe risico's te introduceren. Het gesprek over AI-gestuurde wallets en autonome betalingen raakt aan een bredere reeks vragen rond beveiligingsgovernance, gebruikerstoestemming en regelgevende afstemming. Als het traject dat OpenAI en zijn partners suggereren doorzet, kunnen AI-ondersteunde tools een kerncomponent worden van toekomstige crypto-infrastructuur, die zowel de risicocalculatie als de gebruikerservaring op betekenisvolle manieren verandert. De volgende ronde benchmarks, samen met real-world implementaties, zal helpen bepalen hoe snel deze visie zich materialiseert en welke waarborgen het moeten vergezellen.

Dit artikel werd oorspronkelijk gepubliceerd als OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts op Crypto Breaking News – uw vertrouwde bron voor crypto news, Bitcoin news en blockchain updates.

Marktkans
Smart Blockchain logo
Smart Blockchain koers(SMART)
$0.004384
$0.004384$0.004384
-2.20%
USD
Smart Blockchain (SMART) live prijsgrafiek
Disclaimer: De artikelen die op deze site worden geplaatst, zijn afkomstig van openbare platforms en worden uitsluitend ter informatie verstrekt. Ze weerspiegelen niet noodzakelijkerwijs de standpunten van MEXC. Alle rechten blijven bij de oorspronkelijke auteurs. Als je van mening bent dat bepaalde inhoud inbreuk maakt op de rechten van derden, neem dan contact op met service@support.mexc.com om de content te laten verwijderen. MEXC geeft geen garanties met betrekking tot de nauwkeurigheid, volledigheid of tijdigheid van de inhoud en is niet aansprakelijk voor eventuele acties die worden ondernomen op basis van de verstrekte informatie. De inhoud vormt geen financieel, juridisch of ander professioneel advies en mag niet worden beschouwd als een aanbeveling of goedkeuring door MEXC.