Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 AI agenti dosahují průlomového okamžiku v kybernetické bezpečnosti.
V naší nejnovější práci:
🔓 CyberGym: Agenti umělé inteligence objevili 15 zero-day ve velkých open-source projektech
💰 BountyBench: Agenti umělé inteligence vyřešili úkoly odměn za chyby v reálném světě v hodnotě desítek tisíc dolarů
🤖 Samostatně.
Dochází ke klíčovému posunu – agenti umělé inteligence nyní mohou autonomně dělat to, co dříve mohli dělat pouze elitní lidští hackeři.

2/ 📡 Abychom mohli sledovat tuto zrychlující se hranici, spustili jsme Frontier AI Cybersecurity Observatory – otevřenou platformu pro sledování schopností AI napříč ofenzivními a defenzivními bezpečnostními úkoly.
Zveme komunity zabývající se umělou inteligencí a bezpečností, aby spolupracovaly a přispívaly.
Protože co se měří, to je zajištěno.

3/ 🏋️ ♀️ CyberGym je rozsáhlý hodnotící rámec, který testuje agenty umělé inteligence na 1 500+ skutečných zranitelností ve 188 hlavních projektech Open Source Software.
Vyzývá agenty, aby:
– Procházejte rozsáhlými reálnými kódovými základnami
– Reprodukujte PoC pro skutečné CVE
– Objevte nové, neznámé zranitelnosti

4/ Klíčové postřehy z CyberGym:
⚙️ Agenti SOTA a LLM úspěšně vygenerovali PoC až pro ~18 % historických CVE
🚨 Ještě pozoruhodnější je, že ve volné přírodě objevili 15 nultých dnů

5/ 🐞 BountyBench hodnotí agenty umělé inteligence na 25 reálných komplexních systémech a 40 odměnách za chyby (v hodnotě až 30 000 $+), které pokrývají 9 kategorií OWASP Top 10.

6/ 💡 Klíčové postřehy z BountyBench:
– Agenti umělé inteligence vyřešili úkoly odměn za chyby v hodnotě desítek tisíc dolarů
– Codex CLI a Claude Code excelovaly v záplatování (90 % / 87,5 %) oproti exploataci (32,5 % / 57,5 %)
– Vlastní agenti si vedli rovnoměrněji v obou oblastech: Exploit (40–67,5 %), Patch (45–60 %)

7/ Automatizace kybernetických útoků začala.
Potřebujeme transparentní a přísné vyhodnocení těchto schopností – dříve, než předběhnou naši schopnost reagovat.
To je teprve začátek.
Webové stránky:
Papír:
#AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Shromažďujeme poznatky od výzkumníků a odborníků v oblasti umělé inteligence a kybernetické bezpečnosti o tom, jak hraniční umělá inteligence přetvoří prostředí kybernetické bezpečnosti.
Vaše perspektivy pomohou formovat výzkum a politiku.
Zapojte se do konverzace 👉
9/ 🙏Velké poděkování spolupracovníkům:
Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench: @andystruct Daniel Ho @danboneh @percyliang a mnoho studentů včetně
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Frontier AI Cybersecurity Observatory a spoluautoři publikace "Frontier AI's Impact on the Cybersecurity Landscape": @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
Upřímně si také vážíme všech, kteří nám poskytli zpětnou vazbu na naši práci.
50,25K
Top
Hodnocení
Oblíbené