إن إضافة المنطق إلى إنشاء الصور أمر رائع جدا. يمكن لهذا النموذج - صورة Hunyuan 3 - القيام بأشياء مثل حل نظام المعادلات وتقديم دليل خطوة بخطوة. وهو مفتوح المصدر! أحب رؤيته. (كان الموجه مجرد معادلتين + اطلب الشرح)
Hunyuan
Hunyuan‏28 سبتمبر 2025
يسعدنا أن نعلن عن إصدار HunyuanImage 3.0 ومفتوح المصدر - أكبر وأقوى نموذج مفتوح المصدر لتحويل النص إلى صورة حتى الآن ، مع أكثر من 80 مليار معلمة إجمالية ، منها 13 مليارا يتم تنشيطها لكل رمز مميز أثناء الاستدلال. التأثير يمكن مقارنته تماما بالنموذج الرائد مغلق المصدر في الصناعة. 🚀🚀🚀 ينشأ HunyuanImage 3.0 من نموذج اللغة الكبيرة متعدد الوسائط الأصلي المطور داخليا ، مع التركيز على الضبط الدقيق والتدريب اللاحق على إنشاء تحويل النص إلى صورة. يمنح هذا الأساس الفريد النموذج مجموعة قوية من القدرات: ✅العقل مع المعرفة العالمية ✅فهم المطالبات المعقدة المكونة من ألف كلمة ✅إنشاء نص دقيق داخل الصور تختلف بنية MoE الخاصة ب HunyuanImage 3.0 عن نماذج توليد الصور التقليدية في بنية DiT ، وتستخدم نهجا قائما على نقل الدم للاقتران العميق بين الانتشار وتدريب LLM لنظام واحد قوي. تم بناء HunyuanImage 3.0 على Hunyuan-A13B ، وقد تم تدريبه على مجموعة بيانات ضخمة: 5 مليارات زوج من الصور والنص ، وإطارات الفيديو ، وبيانات نص الصورة المتشابكة ، و 6 تريليون رمز من مجموعات النص. يسمح هذا التدريب المختلط عبر إمكانات التوليد والفهم وإدارة الحقوق متعددة الوسائط للنموذج بدمج مهام متعددة بسلاسة. سواء كنت رساما أو مصمما أو منشئا ، فقد تم تصميم هذا لخفض سير عملك من ساعات إلى دقائق. يمكن ل HunyuanImage 3.0 إنشاء نص معقد ، ورسوم مصورة مفصلة ، ورموز تعبيرية معبرة ، ورسوم توضيحية حية وجذابة للمحتوى التعليمي. يركز الإصدار الحالي فقط على إنشاء النص إلى صورة وستشمل التحديثات المستقبلية تحويل الصورة إلى صورة وتحرير الصور والتفاعل متعدد الأدوار والمزيد. 👉🏻جربه الآن: 🔗جيت هب: 🤗معانق الوجه:
يمكنه أيضا توفير مخططات خطوة بخطوة تعمل بالفعل. هنا ، طلبت دليلا من خمس خطوات حول كيفية رسم بومة.
‏‎10.2‏K