Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 Os agentes de IA estão chegando a um momento inovador na segurança cibernética.
Em nosso trabalho mais recente:
🔓 CyberGym: agentes de IA descobriram 15 zero-days em grandes projetos de código aberto
💰 BountyBench: agentes de IA resolveram tarefas de recompensa de bugs do mundo real no valor de dezenas de milhares de dólares
🤖 Autonomamente.
Uma mudança crucial está em andamento – os agentes de IA agora podem fazer de forma autônoma o que apenas hackers humanos de elite podiam antes.

2/ 📡 Para rastrear essa fronteira acelerada, lançamos o Frontier AI Cybersecurity Observatory - uma plataforma aberta para monitorar os recursos de IA em tarefas de segurança ofensivas e defensivas.
Convidamos as comunidades de IA e segurança a colaborar e contribuir.
Porque o que é medido, é protegido.

3/ 🏋️ ♀️ CyberGym é uma estrutura de avaliação em larga escala que testa agentes de IA em 1.500+ vulnerabilidades reais em 188 grandes projetos de software de código aberto.
Ele desafia os agentes a:
– Navegue por grandes bases de código do mundo real
– Reproduza PoCs para CVEs reais
– Descubra vulnerabilidades novas e desconhecidas

4/ Principais insights da CyberGym:
⚙️ Agentes SOTA e LLMs geraram PoCs com sucesso para até ~18% dos CVEs históricos
🚨 Mais impressionante: eles descobriram 15 dias zero na natureza

5/ 🐞 O BountyBench avalia agentes de IA em 25 sistemas complexos do mundo real e 40 recompensas por bugs (no valor de até US$ 30.000+), cobrindo 9 categorias do OWASP Top 10.

6/ 💡 Principais insights do BountyBench:
– Agentes de IA resolveram tarefas de recompensa de bugs no valor de dezenas de milhares de dólares
– Codex CLI e Claude Code se destacaram em patches (90% / 87,5%), vs em exploração (32,5% / 57,5%)
– Os agentes personalizados tiveram um desempenho mais uniforme em ambos: Exploit (40–67,5%), Patch (45–60%)

7/ A automação do ataque cibernético começou.
Precisamos de uma avaliação transparente e rigorosa dessas capacidades - antes que elas ultrapassem nossa capacidade de resposta.
Este é apenas o começo.
Sítios Web:
Papel:
#AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Estamos reunindo insights de pesquisadores e profissionais de IA e segurança cibernética sobre como a IA de fronteira remodelará o cenário de segurança cibernética.
Suas perspectivas ajudarão a informar pesquisas e políticas.
Junte-se à conversa 👉
9/ 🙏Muito obrigado aos colaboradores:
Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench: @andystruct Daniel Ho @danboneh @percyliang e muitos alunos, incluindo
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Observatório de segurança cibernética da Frontier AI e coautores de "Frontier AI's Impact on the Cybersecurity Landscape": @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
Também agradecemos sinceramente a todos que forneceram feedback sobre nosso trabalho.
50,31K
Melhores
Classificação
Favoritos