1/ 🔥 AI agenti dosahují průlomového okamžiku v kybernetické bezpečnosti. V naší nejnovější práci: 🔓 CyberGym: Agenti umělé inteligence objevili 15 zero-day ve velkých open-source projektech 💰 BountyBench: Agenti umělé inteligence vyřešili úkoly odměn za chyby v reálném světě v hodnotě desítek tisíc dolarů 🤖 Samostatně. Dochází ke klíčovému posunu – agenti umělé inteligence nyní mohou autonomně dělat to, co dříve mohli dělat pouze elitní lidští hackeři.
2/ 📡 Abychom mohli sledovat tuto zrychlující se hranici, spustili jsme Frontier AI Cybersecurity Observatory – otevřenou platformu pro sledování schopností AI napříč ofenzivními a defenzivními bezpečnostními úkoly. Zveme komunity zabývající se umělou inteligencí a bezpečností, aby spolupracovaly a přispívaly. Protože co se měří, to je zajištěno.
3/ 🏋️ ♀️ CyberGym je rozsáhlý hodnotící rámec, který testuje agenty umělé inteligence na 1 500+ skutečných zranitelností ve 188 hlavních projektech Open Source Software. Vyzývá agenty, aby: – Procházejte rozsáhlými reálnými kódovými základnami – Reprodukujte PoC pro skutečné CVE – Objevte nové, neznámé zranitelnosti
4/ Klíčové postřehy z CyberGym: ⚙️ Agenti SOTA a LLM úspěšně vygenerovali PoC až pro ~18 % historických CVE 🚨 Ještě pozoruhodnější je, že ve volné přírodě objevili 15 nultých dnů
5/ 🐞 BountyBench hodnotí agenty umělé inteligence na 25 reálných komplexních systémech a 40 odměnách za chyby (v hodnotě až 30 000 $+), které pokrývají 9 kategorií OWASP Top 10.
6/ 💡 Klíčové postřehy z BountyBench: – Agenti umělé inteligence vyřešili úkoly odměn za chyby v hodnotě desítek tisíc dolarů – Codex CLI a Claude Code excelovaly v záplatování (90 % / 87,5 %) oproti exploataci (32,5 % / 57,5 %) – Vlastní agenti si vedli rovnoměrněji v obou oblastech: Exploit (40–67,5 %), Patch (45–60 %)
7/ Automatizace kybernetických útoků začala. Potřebujeme transparentní a přísné vyhodnocení těchto schopností – dříve, než předběhnou naši schopnost reagovat. To je teprve začátek. Webové stránky: Papír: #AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Shromažďujeme poznatky od výzkumníků a odborníků v oblasti umělé inteligence a kybernetické bezpečnosti o tom, jak hraniční umělá inteligence přetvoří prostředí kybernetické bezpečnosti. Vaše perspektivy pomohou formovat výzkum a politiku. Zapojte se do konverzace 👉
9/ 🙏Velké poděkování spolupracovníkům: Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04 Bountybench: @andystruct Daniel Ho @danboneh @percyliang a mnoho studentů včetně @JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29. Frontier AI Cybersecurity Observatory a spoluautoři publikace "Frontier AI's Impact on the Cybersecurity Landscape": @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct Upřímně si také vážíme všech, kteří nám poskytli zpětnou vazbu na naši práci.
50,25K