Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 Agenții AI ajung la un moment de revoluție în securitatea cibernetică.
În cea mai recentă lucrare a noastră:
🔓 CyberGym: Agenții AI au descoperit 15 zero-day în proiecte majore open-source
💰 BountyBench: Agenții AI au rezolvat sarcini de recompense pentru erori din lumea reală în valoare de zeci de mii de dolari
🤖 Autonom.
O schimbare crucială este în curs de desfășurare – agenții AI pot face acum în mod autonom ceea ce doar hackerii umani de elită puteau face înainte.

2/ 📡 Pentru a urmări această frontieră în accelerare, am lansat Observatorul de securitate cibernetică Frontier AI - o platformă deschisă pentru monitorizarea capacităților AI în sarcinile de securitate ofensivă și defensivă.
Invităm comunitățile AI și de securitate să colaboreze și să contribuie.
Pentru că ceea ce se măsoară, este asigurat.

3/ 🏋️ ♀️ CyberGym este un cadru de evaluare la scară largă care testează agenții AI pe 1.500+ vulnerabilități reale în 188 de proiecte majore de software open source.
Îi provoacă pe agenți să:
– Navigați în baze de cod mari, din lumea reală
– Reproduceți PoC-uri pentru CVE-uri reale
– Descoperiți vulnerabilități noi, necunoscute

4/ Informații cheie de la CyberGym:
⚙️ Agenții SOTA și LLM-urile au generat cu succes PoC-uri pentru până la ~18% din CVE-urile istorice
🚨 Mai izbitor: au descoperit 15 zile zero în sălbăticie

5/ 🐞 BountyBench evaluează agenții AI pe 25 de sisteme complexe din lumea reală și 40 de recompense pentru erori (în valoare de până la 30.000 USD+), acoperind 9 categorii OWASP Top 10.

6/ 💡 Informații cheie de la BountyBench:
– Agenții AI au rezolvat sarcini de recompense pentru erori în valoare de zeci de mii de dolari
– Codex CLI și Claude Code au excelat în patching (90% / 87,5%), vs în exploatare (32,5% / 57,5%)
– Agenții personalizați au avut performanțe mai uniforme în ambele: Exploit (40-67,5%), Patch (45-60%)

7/ Automatizarea infracțiunilor cibernetice a început.
Avem nevoie de o evaluare transparentă și riguroasă a acestor capacități – înainte ca acestea să depășească capacitatea noastră de a răspunde.
Acesta este doar începutul.
Site-uri web:
Hârtie:
#AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Colectăm informații de la cercetători și practicieni în domeniul inteligenței artificiale și securității cibernetice despre modul în care IA de frontieră va remodela peisajul securității cibernetice.
Perspectivele tale vor ajuta la informarea cercetării și a politicilor.
Alăturați-vă conversației 👉
9/ 🙏Mulțumiri uriașe pentru colaboratori:
Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench: @andystruct Daniel Ho @danboneh @percyliang și mulți studenți, inclusiv
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Observatorul de securitate cibernetică Frontier AI și co-autori ai cărții "Impactul Frontier AI asupra peisajului securității cibernetice": @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
De asemenea, apreciem sincer pe toți cei care au oferit feedback cu privire la munca noastră.
50,31K
Limită superioară
Clasament
Favorite