يسعدنا أن نعلن عن إصدار HunyuanImage 3.0 ومفتوح المصدر - أكبر وأقوى نموذج مفتوح المصدر لتحويل النص إلى صورة حتى الآن ، مع أكثر من 80 مليار معلمة إجمالية ، منها 13 مليارا يتم تنشيطها لكل رمز مميز أثناء الاستدلال. التأثير يمكن مقارنته تماما بالنموذج الرائد مغلق المصدر في الصناعة. 🚀🚀🚀 ينشأ HunyuanImage 3.0 من نموذج اللغة الكبيرة متعدد الوسائط الأصلي المطور داخليا ، مع التركيز على الضبط الدقيق والتدريب اللاحق على إنشاء تحويل النص إلى صورة. يمنح هذا الأساس الفريد النموذج مجموعة قوية من القدرات: ✅العقل مع المعرفة العالمية ✅فهم المطالبات المعقدة المكونة من ألف كلمة ✅إنشاء نص دقيق داخل الصور تختلف بنية MoE الخاصة ب HunyuanImage 3.0 عن نماذج توليد الصور التقليدية في بنية DiT ، وتستخدم نهجا قائما على نقل الدم للاقتران العميق بين الانتشار وتدريب LLM لنظام واحد قوي. تم بناء HunyuanImage 3.0 على Hunyuan-A13B ، وقد تم تدريبه على مجموعة بيانات ضخمة: 5 مليارات زوج من الصور والنص ، وإطارات الفيديو ، وبيانات نص الصورة المتشابكة ، و 6 تريليون رمز من مجموعات النص. يسمح هذا التدريب المختلط عبر إمكانات التوليد والفهم وإدارة الحقوق متعددة الوسائط للنموذج بدمج مهام متعددة بسلاسة. سواء كنت رساما أو مصمما أو منشئا ، فقد تم تصميم هذا لخفض سير عملك من ساعات إلى دقائق. يمكن ل HunyuanImage 3.0 إنشاء نص معقد ، ورسوم مصورة مفصلة ، ورموز تعبيرية معبرة ، ورسوم توضيحية حية وجذابة للمحتوى التعليمي. يركز الإصدار الحالي فقط على إنشاء النص إلى صورة وستشمل التحديثات المستقبلية تحويل الصورة إلى صورة وتحرير الصور والتفاعل متعدد الأدوار والمزيد. 👉🏻جربه الآن: 🔗جيت هب: 🤗معانق الوجه: