Během minuloměsíční konference NeurIPS 2025 si @agupta YC sedl s @krandiash, zakladatelem a generálním ředitelem Cartesia, aby vysvětlil, proč mohou být dnešní AI architektury zásadně omezené. Diskutují o tom, jak transformery fungují spíše jako systémy pro vyhledávání než jako systémy učení, kde zapadají nové přístupy k modelům a co může vyžadovat skutečná multimodální inteligence. Také se věnují, proč Cartesia začala s AI hlasem a jak výzkumné týmy proměňují hluboký výzkum v reálné produkty. 00:11 — Představujeme Cartesii 00:26 — Od výzkumu architektury k startupu 01:20 — Co vlastně znamená "architektonický výzkum" 02:18 — Proč transformátory narazily na strop 03:33 — Vysvětlení modelů státního prostoru 04:21 — Inteligence jako komprese 05:47 — Vyhledávání vs. abstrakce 06:41 — Hybridní architektury a budoucnost 07:13 — Proč si Cartesia vybrala hlasovou AI 08:25 — Co multimodalita vlastně znamená 09:20 — Audio jako recept na jiné modality 10:09 — Tokeny, reprezentace a signály učení 11:37 — Výukové reprezentace od začátku do konce 12:29 — Budova pro "průměrného člověka" 13:54 — Výzkum vs. realita produktu 15:18 — Jedna vize, nemilosrdně provedená 16:28 — Produkt jako pravdivé sérum pro výzkum 17:25 — Startupová gravitace platí i pro výzkum