Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tibor Blaho
OpenAI hat Sora 2 veröffentlicht, ihr neues hochmodernes Modell zur Video- und Audioerzeugung, und bezeichnet es als den GPT-3.5-Moment für Video
- Das Modell erzeugt Videos von bis zu 10 Sekunden Länge (Standard 9:16 vertikal) mit synchronisiertem Audio, einschließlich schwieriger physikalischer Simulationen, bei denen Fehler, die das Modell häufig macht, eher als Fehler des internen Agenten erscheinen, den Sora 2 implizit modelliert, anstatt als physikbrechende Fehler
- Cameos ermöglichen es den Nutzern, eine kurze einmalige Video- und Audioaufnahme zu machen, in der sie einen Verifizierungsatz vorlesen. Dann kann das Modell sie in jede von Sora erzeugte Umgebung mit genauer Erscheinung und Stimme einfügen, wobei nur sie entscheiden, wer ihr Cameo verwenden kann, und sie können den Zugriff widerrufen oder jedes Video, das es enthält, jederzeit entfernen, einschließlich Entwürfen, die von anderen Personen erstellt wurden
- Die App fungiert als soziale iOS-Plattform, die nicht für die verbrachte Zeit optimiert ist, sondern ausdrücklich darauf ausgelegt ist, die Erstellung und nicht den Konsum zu maximieren, wobei Inhalte von Personen, denen man folgt oder mit denen man interagiert, und Videos, von denen das Modell denkt, dass sie die eigenen Kreationen inspirieren, stark bevorzugt werden, mit Funktionen wie dem Remixen anderer Beiträge und Direktnachrichten, um Videos privat zu teilen
- Sicherheitsmaßnahmen umfassen eine begrenzte Einladungsausrollung, die Einschränkung von Bild-Uploads, die eine fotorealistische Person zeigen, das Blockieren aller Video-Uploads, keine Video-zu-Video-Transformation bei der Einführung, strengere Schutzmaßnahmen für Minderjährige mit standardmäßigen Scroll-Limits, C2PA-Metadaten und sichtbare Wasserzeichen auf allen Ausgaben sowie Bewertungen, die eine Effektivität von 95,1-99,7 % beim Blockieren unsicherer Inhalte zeigen
- Die erste Ausrollung umfasst die USA und Kanada mit Plänen zur Expansion, während das Vereinigte Königreich, die EU und Australien bei der Einführung nicht einbezogen sind, kostenlos verfügbar mit großzügigen Limits, jedoch unterliegt es den Rechenbeschränkungen, wobei die einzige geplante Monetarisierung die optionale Zahlung für zusätzliche Videos ist, wenn die Nachfrage die Rechenkapazität übersteigt. ChatGPT Pro-Nutzer erhalten Zugang zum hochwertigeren Sora 2 Pro-Modell, und eine API-Veröffentlichung ist für die Zukunft geplant.
61,24K
Hier sind meine Notizen von den TED-Vorträgen bei TEDAI Wien 2025 (26. September 2025)
Sitzung 1: Grundlagen
Walter Werzowa (Künstler, Royal Society of Arts Fellowship, Recording Academy), Olivier Oullier (Inclusive Brains, Biotech Dental, MBZUAI)
- Einführung - Orchester, Gehirn-Interface, DJ, Musiker - Aufführung, die Gehirnwellen durch KI in Musik übersetzt
Shaden Alshammari (Forscher, MIT)
- Chemisches Periodensystem als Inspiration für ein maschinelles Lernframework
- Periodensystem des maschinellen Lernens, das Algorithmen, Verteilungen und Ziel-Funktionen organisiert
- Ansatz des repräsentativen Lernens, der disparate Methoden verbindet
- Neuer Bildcluster-Algorithmus, der den 60 Jahre alten K-means-Cluster-Algorithmus verbessert
- R- und Q-Variablen, die reale Beziehungen (mit und ohne Annotation) und erlernte Beziehungen darstellen
- Periodensystemstruktur für Algorithmen des maschinellen Lernens, die Lücken für neue Methoden aufzeigt
- Überwachtes Lernsignal durch erlernte Repräsentationen
Lukasz Kaiser (Forscher, OpenAI)
- Selbstfahrende Autos - warum fahren sie nicht überall wie Taxifahrer?
- Warum ist KI zur Heilung von Krankheiten so schwierig? Maschinen müssen aus weniger Daten lernen
- Leistungsstärkere lernbare Modelle
- RNNs - Schnecke, die um die Wörter herumläuft
- Transformer - Schnecke, die einen Rucksack mit allen vorherigen Wörtern trägt
- Transformer lernen aus weniger Daten
- Denkmodelle/Denkende - tragen immer noch alle Wörter, produzieren aber auch ihre eigenen Wörter dazwischen (Testzeit), können rechnen und im Kontext denken
- Forscher - leistungsstarke Modelle + lernbare, beliebige Daten, beliebige Testzeit, Parallelität (nicht mehr sequenziell)
- Wissenschaftliche Entdeckungen, die nächste Art von Modellen
- Zeitrahmen - näher als weiter, Monate/ein Jahr, aber keine Jahrzehnte; keine sehr ferne Zukunft
- Überraschung, dass Transformer und Denkende so gut funktionierten
Oriol Vinyals (Co-Technischer Leiter für Gemini, Forschungs-VP, Google DeepMind)
- Wissenschaftler - Intelligenz lösen, um Wissenschaft voranzubringen und der Menschheit zu nützen
- "Was ich nicht erschaffen kann, verstehe ich nicht" (Feynman)
- Das Dilemma des Bauers - Wissenschaftler, die KI-Systeme schaffen, die sie ersetzen könnten
- Menschliche Verdrängung - Transformation, die alle betrifft, einschließlich Wissenschaftler
- Spezialisierte Werkzeuge - AlphaFold (Vorhersage der Proteinstruktur)
- Evolution der allgemeinen Systeme - letztes Jahr spezialisierte Modelle (AlphaProof, AlphaGeometry), dieses Jahr ein einzelnes allgemeines Modell (Deep Think)
- Deep Think - Goldmedaille bei IMO und ICPC
- KI-Wissenschaftler - internes Prototyp bei Google DeepMind für automatisierte wissenschaftliche Forschung
- Zentrale Frage - Wissenschaftler, der KI-Wissenschaftler baut, ersetzt er sich selbst?
Verity Harding (Gründerin, Direktorin & Autorin, Universität Cambridge & Formation Advisory)
- Ein weiteres Wettrüsten weltweit - KI
- Optimismus damals - globale KI, kollaborativ, globale Partnerschaften
- Kooperation und Zusammenarbeit wichen, als KI mächtiger wurde
- ChatGPT-Start
- Kombination von Faktoren, die zu einem schnellen Wandel führten
- Exportkontrollen, defensive Reden
- Zuerst musst du gewinnen - was würdest du tun, um zu gewinnen, wenn du nicht überleben kannst, um zu verlieren
- KI wird weitergehen, aber es gibt keine Ziellinie, die KI-Adoption ist nicht binär
- Alternatives Bild - es ist das Weltraumrennen (nicht das nukleare Rennen)
- "Wir kamen in Frieden für die gesamte Menschheit" (bewusste geopolitische Strategie der USA)
- Weltraum - Provinz aller Menschen, keine Massenvernichtungswaffen im Weltraum, niemand wird den Mond kolonisieren
- "Wir machen unsere Metaphern und dann machen unsere Metaphern uns"
- Lass uns über Führen sprechen, nicht über Gewinnen
- Rennen um die Weltherrschaft oder die neue Grenze
Tullio Ghi (MD, PhD, Agostino Gemelli Universitätskrankenhaus)
- Risiko von Komplikationen während der Geburt
- Entscheidung, welche Intervention zu verwenden ist, wenn die Sauerstoffversorgung während der Geburt beeinträchtigt ist (Vakuumextraktion, Kaiserschnitt), abhängig davon, wie weit das Baby gesunken ist
- Transperinealer Ultraschall, Messung des Kopf-Perineum-Abstands
- KI-basierte automatische Messung des Kopf-Perineum-Abstands
- Bewertung des Drehungsgrads und der Position des fetalen Kopfes im Geburtskanal
- 3 konvolutionale neuronale Netzwerke, die gleichzeitig arbeiten
- 2.154 Ultraschallbilder aus 16 Zentren weltweit, Gesamttrefferquote 94,5 % und 95,6 % Sensitivität

13,4K
Top
Ranking
Favoriten