<Dados são competitividade, não modelos> O núcleo da indústria de IA não é mais computação ou modelos, mas "dados de alta qualidade". Assim como a civilização humana foi avançada para o próximo nível através do petróleo no passado, a IA também precisa de um novo "combustível" para ir mais longe. Assim como antes e depois da Segunda Guerra Mundial, quando o petróleo foi usado como fonte de energia e material, a industrialização progrediu rapidamente. Agora, quem e como eles obtêm e processam dados determinarão a iniciativa na era da IA. Elon Musk também disse isso este ano. "Esgotámos toda a soma cumulativa do conhecimento humano na aprendizagem da inteligência artificial." É verdade que modelos como o GPT cresceram rapidamente, raspando dados públicos, como sites, livros, código e imagens. Mas agora, precisamos de uma nova forma de dados que seja protegida por direitos autorais ou que não exista. Por exemplo, em domínios como os veículos autónomos e a robótica, é necessário ir além do simples texto e necessitar de dados complexos baseados em múltiplos sensores que combinem câmaras, radar, lidar, etc., bem como dados de casos recolhidos em ambiente real, que não existem na web. O problema maior não está tanto na tecnologia, mas em "como combiná-la bem". Milhares de pessoas precisam coletar, rotular e atualizar dados em todo o mundo, e é difícil lidar com essa diversidade e escala com uma abordagem centralizada ao passado. Portanto, a indústria de IA está cada vez mais concordando que o método descentralizado é a resposta. É aqui que aparece "Poseidon (@psdnai)". O Poseidon não é apenas um armazém de dados, mas uma infraestrutura que alimenta dados reais, verifica-os e os refina em um conjunto de dados de treinamento que pode ser usado sem se preocupar com direitos autorais. Para usar uma analogia, Poseidon é uma "refinaria de petróleo". Ele pega dados brutos e os refina em combustível que a IA pode usar para aprender. Todo o processo vai e volta no @StoryProtocol. Regista de forma transparente quem forneceu os dados e quem os escreveu em que condições em cadeia. Aqueles que fornecem dados são bastante recompensados, e os desenvolvedores de IA podem usá-los com confiança. Acho que a Poseidon, que vai inovar na camada de dados, não GPUs ou modelos, pode ser o melhor exemplo de aplicação da tecnologia Web3 à indústria Web2.
Chris Dixon
Chris Dixon23/07/2025
Estamos entusiasmados em anunciar que estamos liderando uma rodada de investimento seed de $15M na Poseidon, que foi incubada pela @StoryProtocol e está a construir uma camada de dados descentralizada para coordenar a oferta e a procura de dados para o treinamento de IA. A primeira geração de modelos fundamentais de IA foi treinada com dados que pareciam ser um recurso efetivamente ilimitado. Hoje, os recursos mais acessíveis, como livros e websites, foram em grande parte esgotados, e os dados tornaram-se um fator limitante no progresso da IA. Grande parte dos dados que restam agora é de qualidade inferior ou está fora de alcance devido a proteções de propriedade intelectual. Para algumas das aplicações de IA mais promissoras — em robótica, veículos autónomos e inteligência espacial — os dados ainda nem existem. Agora, esses sistemas precisam de tipos inteiramente novos de informação: multi-sensoriais, ricos em casos extremos, capturados no mundo real. De onde virão todos esses dados do mundo físico? O desafio não é apenas técnico — é um problema de coordenação. Milhares de colaboradores devem trabalhar juntos de forma distribuída para obter, rotular e manter os dados físicos que a IA de próxima geração precisa. Acreditamos que nenhuma abordagem centralizada pode orquestrar de forma eficiente a criação e curadoria de dados que é necessária no nível de escala e diversidade exigido. Uma abordagem descentralizada pode resolver isso. @psdnai permite que os fornecedores coletem os dados que as empresas de IA precisam, garantindo a segurança da propriedade intelectual através da licença de IP programável da Story. Isso busca estabelecer uma nova base econômica para a internet, onde os criadores de dados são compensados de forma justa por ajudar as empresas de IA a impulsionar a próxima geração de sistemas inteligentes. A equipe da Poseidon, liderada pelo Cientista Chefe e Cofundador @SPChinchali, traz uma profunda experiência em infraestrutura de IA. Sandeep é professor na UT Austin, especializado em IA, robótica e sistemas distribuídos, com um doutorado em IA e sistemas distribuídos pela Stanford. O Chefe de Produto e Cofundador @sarickshah passou uma década como engenheiro de aprendizado de máquina, escalando produtos de IA para grandes empresas nos setores de serviços financeiros, telecomunicações e saúde. Estamos entusiasmados em apoiar a Poseidon em seu trabalho para resolver um dos gargalos mais críticos no desenvolvimento da IA.
2,48K