Temos o prazer de anunciar o lançamento e o código aberto do HunyuanImage 3.0 - o maior e mais poderoso modelo de texto para imagem de código aberto até o momento, com mais de 80 bilhões de parâmetros no total, dos quais 13 bilhões são ativados por token durante a inferência. O efeito é completamente comparável ao modelo de código fechado carro-chefe do setor. 🚀🚀🚀 O HunyuanImage 3.0 se origina de nosso modelo de linguagem grande multimodal nativo desenvolvido internamente, com ajuste fino e pós-treinamento focado na geração de texto para imagem. Essa base exclusiva fornece ao modelo um poderoso conjunto de recursos: ✅Raciocinar com conhecimento do mundo ✅Entenda prompts complexos de mil palavras ✅Gere texto preciso dentro de imagens Diferente dos modelos tradicionais de geração de imagens da arquitetura DiT, a arquitetura MoE do HunyuanImage 3.0 usa uma abordagem baseada em transfusão para acoplar profundamente o treinamento de difusão e LLM para um sistema único e poderoso. Construído no Hunyuan-A13B, o HunyuanImage 3.0 foi treinado em um enorme conjunto de dados: 5 bilhões de pares de imagem-texto, quadros de vídeo, dados de imagem-texto intercalados e 6 trilhões de tokens de corpora de texto. Esse treinamento híbrido em recursos multimodais de geração, compreensão e LLM permite que o modelo integre perfeitamente várias tarefas. Seja você um ilustrador, designer ou criador, ele foi desenvolvido para reduzir seu fluxo de trabalho de horas para minutos. O HunyuanImage 3.0 pode gerar textos intrincados, quadrinhos detalhados, emojis expressivos e ilustrações animadas e envolventes para conteúdo educacional. A versão atual se concentra exclusivamente na geração de texto para imagem e as atualizações futuras incluirão imagem para imagem, edição de imagem, interação de vários turnos e muito mais. 👉🏻Experimente agora: 🔗GitHub: 🤗Rosto abraçando: