Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Додати аргументацію до генерації зображень – це дуже круто.
Ця модель - Hunyuan Image 3 - може виконувати такі речі, як розв'язувати систему рівнянь і надавати покрокову інструкцію.
І це відкритий вихідний код! Люблю це бачити.
(підказка була просто два рівняння + прохання пояснити)


28 вер. 2025 р.
Ми раді оголосити про випуск і відкритий вихідний код HunyuanImage 3.0 — найбільшої та найпотужнішої моделі перетворення тексту в зображення з відкритим вихідним кодом на сьогоднішній день, з більш ніж 80 мільярдами загальних параметрів, з яких 13 мільярдів активуються на токен під час логічного висновку. Ефект можна порівняти з флагманською моделлю галузі із закритим вихідним кодом. 🚀🚀🚀
HunyuanImage 3.0 походить від нашої внутрішньо розробленої рідної мультимодальної великої мовної моделі, з тонким налаштуванням і пост-навчанням, зосередженим на генерації тексту в зображення. Ця унікальна основа наділяє модель потужним набором можливостей:
✅Розум зі світовими знаннями
✅Розуміння складних підказок, що складаються з тисячі слів
✅Створюйте точний текст на зображеннях
На відміну від традиційних моделей генерації зображень DiT, архітектура MoE HunyuanImage 3.0 використовує підхід, заснований на переливанні, для глибокого поєднання навчання Diffusion і LLM для єдиної, потужної системи. Побудований на Hunyuan-A13B, HunyuanImage 3.0 був навчений на величезному наборі даних: 5 мільярдів пар зображення-текст, відеокадри, перемежовані зображення-текстові дані та 6 трильйонів токенів текстових корпусів. Це гібридне навчання з урахуванням мультимодальної генерації, розуміння та можливостей LLM дозволяє моделі безперешкодно інтегрувати кілька завдань.
Незалежно від того, чи є ви ілюстратором, дизайнером або творцем, цей сервіс створений для того, щоб скоротити ваш робочий процес з годин до хвилин. HunyuanImage 3.0 може генерувати складний текст, деталізовані комікси, виразні емодзі та живі, захоплюючі ілюстрації для освітнього контенту.
Поточний випуск зосереджений виключно на генерації тексту в зображення, а майбутні оновлення включатимуть перетворення зображення на зображення, редагування зображень, багатоходову взаємодію тощо.
👉🏻Спробуйте зараз:
🔗GitHub:
🤗Обіймаюче обличчя:
Він також може надати покрокові схеми, які дійсно працюють.
Тут я попросив інструкцію з п'яти кроків про те, як намалювати сову.

10,18K
Найкращі
Рейтинг
Вибране