<數據是競爭力,而不是模型> AI產業的核心不再是計算或模型,而是「高質量數據」。。正如過去人類文明通過石油提升到一個新的水平一樣,人工智慧也需要一種新的“燃料”才能走得更遠。就像二戰前後,石油被用作能源和材料一樣,工業化進步迅速。現在,他們獲取和處理數據的物件和方式將決定人工智慧時代的主動權。 埃隆·馬斯克今年也說過這句話。“我們已經用盡了人類在人工智慧學習中知識的所有累積總和。”誠然,像GPT這樣的模型發展迅速,抓取了網站、書籍、代碼和圖像等公共數據。但現在,我們需要一種受版權保護或根本不存在的新形式的數據。 例如,在自動駕駛汽車和機器人等領域,需要超越簡單的文本,需要結合攝像頭、雷達、激光雷達等的基於多感測器的複雜數據,以及在真實環境中收集的案例數據,這些數據在網路上是不存在的。 更大的問題與其說是技術,不如說是“如何結合好”。全球成千上萬的人需要收集、標記和更新數據,而通過對過去的集中式方法很難處理這種多樣性和規模。因此,人工智慧行業越來越認同去中心化方法就是答案。 這就是「波塞冬 (@psdnai)」出現的地方。Poseidon 不僅僅是一個數據倉庫,而是一個基礎設施,它提供真實數據,對其進行驗證,並將其提煉成一個訓練數據集,可以使用而無需擔心版權問題。 打個比方,波塞冬是一座「煉油廠」。。它獲取原始數據並將其提煉成人工智慧可用於學習的燃料。整個過程在@StoryProtocol上來回進行。它透明地記錄了誰提供了數據以及誰在什麼條件下在鏈上寫入了數據。提供數據的人會得到公平的回報,人工智慧開發人員可以放心地使用它。 我認為 Poseidon 將在數據層進行創新,而不是 GPU 或模型,可能是將 Web3 技術應用於 Web2 行業的最好例子。
Chris Dixon
Chris Dixon2025年7月23日
我們很高興地宣布,我們正在主導Poseidon的1500萬美元種子輪融資,該項目由@StoryProtocol孵化,正在建立一個去中心化的數據層,以協調AI訓練數據的供需。 第一代AI基礎模型是基於看似無限的數據資源進行訓練的。如今,最易獲得的資源,如書籍和網站,已經基本耗盡,數據已成為AI進步的限制因素。 目前剩下的數據大多質量較低或因知識產權保護而無法使用。對於一些最有前景的AI應用——包括機器人、自動駕駛汽車和空間智能——所需的數據甚至尚不存在。現在這些系統需要全新的信息類型:多感官、富含邊緣案例、在自然環境中捕獲的數據。這些物理世界的數據將從何而來? 這個挑戰不僅僅是技術問題——這是一個協調問題。數千名貢獻者必須以分散的方式共同工作,以獲取、標記和維護下一代AI所需的物理數據。我們相信,沒有任何集中式的方法能夠有效地協調所需規模和多樣性的數據創建和管理。去中心化的方法可以解決這個問題。 @psdnai允許供應商收集AI公司所需的數據,同時通過Story的可編程知識產權許可確保知識產權安全。這旨在為互聯網建立一個新的經濟基礎,讓數據創作者能夠公平地獲得報酬,以幫助AI公司推動下一代智能系統的發展。 Poseidon的團隊由首席科學家兼聯合創始人@SPChinchali領導,擁有深厚的AI基礎設施專業知識。Sandeep是德克薩斯大學奧斯汀分校的教授,專注於AI、機器人和分佈式系統,擁有斯坦福大學的AI和分佈式系統博士學位。產品負責人兼聯合創始人@sarickshah在大型企業的金融服務、電信和醫療保健領域擔任機器學習工程師十年,負責擴展AI產品。 我們很高興能支持Poseidon解決AI發展中最關鍵的瓶頸之一。
2.47K