Il dataset della Verifier Alliance ora ha oltre 8 milioni di contratti verificati! @ethereum ha una forte cultura della verifica, ma i dati sono isolati e difficili da accedere. Abbiamo aperto tutto in formato Parquet per ricercatori, analisti e ingegneri AI. Esplora lo schema e scarica il dataset👇
@SourcifyEth @blockscout @routescan_io A cosa serve questo dataset? - Test di compilatori - Identificazione di modelli di vulnerabilità nei contratti - Addestramento di modelli - Analisi dei dati dei contratti EVM ...molti altri casi d'uso che non sarebbero stati possibili senza un dataset aperto Riunito da @blockscout @routescan_io @SourcifyEth
Come appare il dato? VerA è un DB PostgreSQL in cui ogni verifica è un accoppiamento tra un "deployment" e una "compilation". I bytecode e le sorgenti sono deduplicati in tabelle separate. Vedi lo schema:
Il bytecode EVM è non strutturato. Pertanto, le "trasformazioni" segnano le modifiche ai valori dei dati necessarie per raggiungere un bytecode onchain da un bytecode ricompilato. Questo include immutabili, librerie, cborAuxdata, posizioni e valori di constructorArguments.
L'intero DB viene esportato quotidianamente in Parquet, un moderno formato di dati basato su colonne che è direttamente interrogabile. Vai alla documentazione e scopri come scaricare:
74,54K