熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
自從 GPT-5 上線以來,我確實感覺自己像是在和一個 10 人以上的團隊合作。HVM4 才剛滿 1 個月,卻已經在各個方面超越了 HVM3。我們現在有一個原型的並行模式(是的,還有懶惰評估!)正在運行,並且預期會有加速效果。
請記住,平行模式是:
- 在 HVM1 上失效(那是懶惰的)
- 在 HVM2 上表現良好(但它是嚴格的)
- 從未在 HVM3 上實現過
擁有正確的平行 + 懶惰模式仍然是一個未解決的問題,但有了這個設置,我們終於快要達成了。
如果它有效,那意味著我們可以通過真正的線程評估來擴展 SupGen,這比我們目前正在進行的分片要快得多。
現在,再次說,擁有 256 台 Mac mini 是令人難過的,因為那是為分片優化的。那是 1024 個性能核心,分配到 256 個單位,每個單位有 4 個核心,16 GB 的內存。擁有真正的平行性,我們本可以選擇 Mac Studios。那麼,這真的值得嗎?
用同樣的錢,我們可以獲得 16 台 Studio,每台有 512 GB 的內存和 24 個性能核心。因此,雖然這使我們能夠充分利用真正的平行性,但這也意味著我們的總計算能力大約少了 3 倍。那麼,這值得嗎?
我其實不知道,但我們很快就會知道。也許我做出了正確的選擇(即使我擁有的信息不完整)
請記住,平行模式是:
- 在 HVM1 上失效(那是懶惰的)
- 在 HVM2 上表現良好(但它是嚴格的)
- 從未在 HVM3 上實現(Haskell 問題)
擁有正確的平行 + 懶惰模式仍然是一個未解決的問題,但有了這個設置,我們終於快要達成了。
如果它有效,那意味著我們可以通過真正的線程評估來擴展 SupGen,這比我們目前正在進行的分片要快得多。
現在,再次說,擁有 256 台 Mac mini 是令人難過的,因為那是為分片優化的。那是 1024 個性能核心,分配到 256 個單位,每個單位有 4 個核心,16 GB 的內存。擁有真正的平行性,我們本可以選擇 Mac Studios。那麼,這真的值得嗎?
用同樣的錢,我們可以獲得 16 台 Studio,每台有 512 GB 的內存和 24 個性能核心。因此,雖然這使我們能夠充分利用真正的平行性,但這也意味著我們的總計算能力大約少了 3 倍。那麼,這值得嗎?
我其實不知道,但我們很快就會知道。也許我做出了正確的選擇(即使我擁有不完整的信息)
@0xHP10 也寫一堆測試,並要求 AI 在每次小改動時運行這些測試。gpt-5 在自我修正(甚至學習和理解)失敗測試方面非常非常出色。
@0xHP10 也要寫好測試,並要求 AI 在每次小改動時運行這些測試。gpt-5 在根據失敗的測試進行自我修正(甚至學習)方面非常出色。
26.59K
熱門
排行
收藏