Redenering toevoegen aan beeldgeneratie is best cool. Dit model - Hunyuan Image 3 - kan dingen doen zoals een systeem van vergelijkingen oplossen en een stapsgewijze handleiding geven. En het is open source! Geweldig om te zien. (prompt was gewoon de twee vergelijkingen + vraag om uit te leggen)
Hunyuan
Hunyuan7 uur geleden
We zijn enthousiast om de release en open-source van HunyuanImage 3.0 aan te kondigen — het grootste en krachtigste open-source tekst-naar-beeldmodel tot nu toe, met meer dan 80 miljard totale parameters, waarvan 13 miljard per token worden geactiveerd tijdens inferentie. Het effect is volledig vergelijkbaar met het vlaggenschip gesloten-source model van de industrie.🚀🚀🚀 HunyuanImage 3.0 is ontstaan uit ons intern ontwikkelde native multimodale grote taalmodel, met fine-tuning en post-training gericht op tekst-naar-beeld generatie. Deze unieke basis geeft het model een krachtige set mogelijkheden: ✅Redeneren met wereldkennis ✅Begrijpen van complexe, duizend-woord prompts ✅Nauwkeurig tekst genereren binnen afbeeldingen Verschillend van traditionele DiT-architectuur beeldgeneratiemodellen, gebruikt de MoE-architectuur van HunyuanImage 3.0 een transfusie-gebaseerde aanpak om diffusie en LLM-training diep te koppelen voor een enkel, krachtig systeem. Gebouwd op Hunyuan-A13B, is HunyuanImage 3.0 getraind op een enorme dataset: 5 miljard afbeelding-tekst paren, videokaders, door elkaar gemengde afbeelding-tekst data, en 6 biljoen tokens van tekstcorpora. Deze hybride training over multimodale generatie, begrip en LLM-capaciteiten stelt het model in staat om meerdere taken naadloos te integreren. Of je nu een illustrator, ontwerper of maker bent, dit is gebouwd om je workflow van uren naar minuten te verkorten. HunyuanImage 3.0 kan ingewikkelde tekst, gedetailleerde strips, expressieve emoji's en levendige, boeiende illustraties voor educatieve inhoud genereren. De huidige release richt zich uitsluitend op tekst-naar-beeld generatie en toekomstige updates zullen beeld-naar-beeld, beeldbewerking, multi-turn interactie en meer omvatten. 👉🏻Probeer het nu: 🔗GitHub: 🤗Hugging Face:
Het kan ook stapsgewijze diagrammen bieden die daadwerkelijk werken. Hier vroeg ik om een vijf stappen gids over hoe je een uil kunt schetsen.
4,45K