Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 Les agents de l’IA atteignent un moment de rupture en matière de cybersécurité.
Dans notre dernier travail :
🔓 CyberGym : des agents d’IA ont découvert 15 zero-day dans de grands projets open-source
💰 BountyBench : des agents de l’IA ont résolu des tâches réelles de bug bounty d’une valeur de dizaines de milliers de dollars
🤖 Façon autonome.
Un changement crucial est en cours : les agents d’IA peuvent désormais faire de manière autonome ce que seuls les pirates humains d’élite pouvaient faire auparavant.

2/ 📡 Pour suivre cette frontière qui s’accélère, nous avons lancé le Frontier AI Cybersecurity Observatory – une plate-forme ouverte pour surveiller les capacités de l’IA dans les tâches de sécurité offensives et défensives.
Nous invitons les communautés de l’IA et de la sécurité à collaborer et à contribuer.
Parce que ce qui est mesuré est sécurisé.

3/ 🏋️ ♀️ CyberGym est un cadre d’évaluation à grande échelle qui teste les agents d’IA sur 1 500+ vulnérabilités réelles à travers 188 grands projets de logiciels Open Source.
Il met les agents au défi de :
– Naviguer dans de grandes bases de code du monde réel
– Reproduire des PoC pour de vraies CVE
– Découvrir de nouvelles vulnérabilités inconnues

4/ Principales conclusions de CyberGym :
⚙️ Les agents SOTA et les LLM ont réussi à générer des PoC pour jusqu’à ~18 % des CVE historiques
🚨 Plus frappant encore : ils ont découvert 15 zero-day dans la nature

5/ 🐞 BountyBench évalue les agents d’IA sur 25 systèmes complexes du monde réel et 40 bug bounties (d’une valeur allant jusqu’à 30 000 $ +), couvrant 9 catégories du Top 10 de l’OWASP.

6/ 💡 Principales conclusions de BountyBench :
– Les agents de l’IA ont résolu des tâches de bug bounty d’une valeur de dizaines de milliers de dollars
– Codex CLI & Claude Code ont excellé dans le patching (90 % / 87.5 %), vs dans l’exploitation (32.5 % / 57.5 %)
– Les agents personnalisés ont fonctionné de manière plus uniforme dans les deux domaines suivants : Exploit (40 à 67,5 %), Correctif (45 à 60 %)

7/ L’automatisation de la cyberattaque a commencé.
Nous avons besoin d’une évaluation transparente et rigoureuse de ces capacités, avant qu’elles ne dépassent notre capacité de réponse.
Ce n’est que le début.
Sites Web :
Papier:
#AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Nous recueillons les points de vue de chercheurs et de praticiens de l’IA et de la cybersécurité sur la façon dont l’IA de pointe va remodeler le paysage de la cybersécurité.
Vos points de vue contribueront à éclairer la recherche et les politiques.
Joignez-vous à la conversation 👉
9/ 🙏Un grand merci aux collaborateurs :
Cybergym : @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench : @andystruct Daniel Ho @danboneh @percyliang et de nombreux étudiants, dont
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Frontier AI Cybersecurity Observatory et co-auteurs de « Frontier AI’s Impact on the Cybersecurity Landscape » : @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
Nous apprécions également sincèrement tous ceux qui ont fourni des commentaires sur notre travail.
50,3K
Meilleurs
Classement
Favoris