1/ 🔥 Os agentes de IA estão chegando a um momento inovador na segurança cibernética. Em nosso trabalho mais recente: 🔓 CyberGym: agentes de IA descobriram 15 zero-days em grandes projetos de código aberto 💰 BountyBench: agentes de IA resolveram tarefas de recompensa de bugs do mundo real no valor de dezenas de milhares de dólares 🤖 Autonomamente. Uma mudança crucial está em andamento – os agentes de IA agora podem fazer de forma autônoma o que apenas hackers humanos de elite podiam antes.
2/ 📡 Para rastrear essa fronteira acelerada, lançamos o Frontier AI Cybersecurity Observatory - uma plataforma aberta para monitorar os recursos de IA em tarefas de segurança ofensivas e defensivas. Convidamos as comunidades de IA e segurança a colaborar e contribuir. Porque o que é medido, é protegido.
3/ 🏋️ ♀️ CyberGym é uma estrutura de avaliação em larga escala que testa agentes de IA em 1.500+ vulnerabilidades reais em 188 grandes projetos de software de código aberto. Ele desafia os agentes a: – Navegue por grandes bases de código do mundo real – Reproduza PoCs para CVEs reais – Descubra vulnerabilidades novas e desconhecidas
4/ Principais insights da CyberGym: ⚙️ Agentes SOTA e LLMs geraram PoCs com sucesso para até ~18% dos CVEs históricos 🚨 Mais impressionante: eles descobriram 15 dias zero na natureza
5/ 🐞 O BountyBench avalia agentes de IA em 25 sistemas complexos do mundo real e 40 recompensas por bugs (no valor de até US$ 30.000+), cobrindo 9 categorias do OWASP Top 10.
6/ 💡 Principais insights do BountyBench: – Agentes de IA resolveram tarefas de recompensa de bugs no valor de dezenas de milhares de dólares – Codex CLI e Claude Code se destacaram em patches (90% / 87,5%), vs em exploração (32,5% / 57,5%) – Os agentes personalizados tiveram um desempenho mais uniforme em ambos: Exploit (40–67,5%), Patch (45–60%)
7/ A automação do ataque cibernético começou. Precisamos de uma avaliação transparente e rigorosa dessas capacidades - antes que elas ultrapassem nossa capacidade de resposta. Este é apenas o começo. Sítios Web: Papel: #AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Estamos reunindo insights de pesquisadores e profissionais de IA e segurança cibernética sobre como a IA de fronteira remodelará o cenário de segurança cibernética. Suas perspectivas ajudarão a informar pesquisas e políticas. Junte-se à conversa 👉
9/ 🙏Muito obrigado aos colaboradores: Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04 Bountybench: @andystruct Daniel Ho @danboneh @percyliang e muitos alunos, incluindo @JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29. Observatório de segurança cibernética da Frontier AI e coautores de "Frontier AI's Impact on the Cybersecurity Landscape": @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct Também agradecemos sinceramente a todos que forneceram feedback sobre nosso trabalho.
50,31K