DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Kami dengan senang hati mengumumkan rilis dan open-source HunyuanImage 3.0 — model text-to-image open-source terbesar dan paling kuat hingga saat ini, dengan lebih dari 80 miliar total parameter, di mana 13 miliar diaktifkan per token selama inferensi. Efeknya benar-benar sebanding dengan model sumber tertutup andalan industri. 🚀🚀🚀 HunyuanImage 3.0 berasal dari model bahasa besar multimoda asli kami yang dikembangkan secara internal, dengan penyempurnaan dan pasca-pelatihan yang berfokus pada pembuatan teks-ke-gambar. Fondasi unik ini memberi model serangkaian kemampuan yang kuat: ✅Bernalar dengan pengetahuan dunia ✅Memahami perintah seribu kata yang kompleks ✅Hasilkan teks yang tepat dalam gambar Berbeda dari model pembuatan gambar arsitektur DiT tradisional, arsitektur MoE HunyuanImage 3.0 menggunakan pendekatan berbasis Transfusi untuk menggabungkan pelatihan Difusi dan LLM secara mendalam untuk satu sistem yang kuat. Dibangun di atas Hunyuan-A13B, HunyuanImage 3.0 dilatih pada kumpulan data besar: 5 miliar pasangan gambar-teks, bingkai video, data gambar-teks yang diselingi, dan 6 triliun token korpus teks. Pelatihan hibrida di seluruh generasi multimodal, pemahaman, dan kemampuan LLM ini memungkinkan model untuk mengintegrasikan banyak tugas dengan mulus. Baik Anda seorang ilustrator, desainer, atau kreator, ini dibuat untuk memangkas alur kerja Anda dari jam menjadi menit. HunyuanImage 3.0 dapat menghasilkan teks yang rumit, komik terperinci, emoji ekspresif, dan ilustrasi yang hidup dan menarik untuk konten pendidikan. Rilis saat ini hanya berfokus pada pembuatan teks-ke-gambar dan pembaruan di masa mendatang akan mencakup gambar-ke-gambar, pengeditan gambar, interaksi multi-putaran, dan banyak lagi. 👉🏻Coba sekarang: 🔗GitHub: 🤗Wajah Memeluk:

Teratas

Peringkat

Favorit