Teure AI-Modelle stottern früher als gedacht

Teure AI-Modelle stottern früher als gedacht
Photo by Nahrizul Kadri / Unsplash

Eine Studie aus München kratzt am Lack der großen AI-Anbieter. Die Forscher fanden heraus, dass die meisten Modelle schon nach wenigen tausend Wörtern ins Straucheln geraten - von wegen Millionen Wörter verarbeiten... Das erinnert an Möchtegern-Marathonläufer, die schon nach der ersten Runde japsen.

Zeitgleich mischt Perplexity den Markt auf. Deren neues Recherche-Tool, das locker mit den teuren Enterprise-Lösungen mithalten kann, kostet weniger als der monatliche Kaffeeverbrauch eines Durchschnittsbürgers.

Viel Spaß beim Lesen und einen guten Start in den Montagmorgen wünscht,

Marcus Schuler


Studie enthüllt: AI-Modelle sind schlechter als ihr Ruf

Die künstliche Intelligenz gibt gerne an. Doch jetzt kommt die Quittung: Forscher der LMU München, des Munich Center for Machine Learning und von Adobe Research haben genauer hingeschaut. Ihr Urteil ist vernichtend.

a computer screen with a bunch of buttons on it
Photo by Levart_Photographer / Unsplash

Mit ihrem neuen Testverfahren "NoLiMa" (No Literal Matching) zeigen sie: Die bisherigen Erfolgsmeldungen der AI-Branche sind nicht sonderlich aussagekräftig. Statt Texte wirklich zu verstehen, spielen die Modelle bisher nur "Wort-Suchsel".

Die nackten Zahlen sind ernüchternd: Die meisten AI-Modelle verlieren schon bei 2.000 bis 8.000 Wörtern den Faden. OpenAIs o3-mini schafft bei 32.000 Wörtern nur noch 18,9 Prozent Genauigkeit. DeepSeeks R1 taumelt bei 20,7 Prozent. Selbst der Platzhirsch GPT-4o stürzt von stolzen 99,3 auf magere 69,7 Prozent ab.

Das Problem: Die bisherigen Tests waren so anspruchsvoll wie das Finden des eigenen Namens im Telefonbuch. NoLiMa zwingt die AI jetzt zum echten Textverständnis - so wie Menschen lesen.

Die Branche brüstet sich zwar mit immer längeren Kontextfenstern von bis zu 128.000 Tokens. Sobald aber echtes Verständnis gefragt ist, bricht alles zusammen. Die AI verhält sich wie ein Strg+F auf Steroiden - nur leider mit der Aufmerksamkeitsspanne eines Goldfisches.

Warum das wichtig ist:

  • Die Revolution der "langen Kontexte" entpuppt sich als Marketing-Blase
  • Wortsuche ist nicht gleich Verstehen - die AI ist noch weit vom menschlichen Leseverständnis entfernt
  • Auch modernste Modelle sind im Kern nur aufgemotzte Suchmaschinen

Read on, my dear:


Pizza statt Porsche: Perplexity mischt den AI-Markt auf

Während die großen AI-Anbieter monatlich Summen verlangen, die an einen Sportwagen erinnern, kommt Perplexity mit seinem neuen Deep Research Tool daher wie eine günstige Pizza-Lieferung.

Photo: Perplexity.ai

Für schlappe 20 Dollar im Monat gibt es 500 Recherche-Anfragen - das macht 4 Cent pro Suchanfrage.Das Beste daran: Billig heißt hier nicht schlecht. Mit 93,9% auf dem SimpleQA-Benchmark lässt Deep Research sogar Googles Gemini alt aussehen. In weniger als drei Minuten durchforstet das Tool Hunderte von Quellen. Da können die teuren Enterprise-Lösungen einpacken.

Die Unternehmen planen trotzdem, ihre AI-Budgets 2025 um durchschnittlich 3,4 Millionen Dollar aufzustocken. Das ist ungefähr so, als würde man einen Ferrari kaufen, während der Nachbar mit seinem Kleinwagen schneller durch den Stadtverkehr kommt.

Warum das wichtig ist:

  • Die alte Weisheit "Teuer = Besser" gilt in der AI-Welt nicht mehr - manchmal ist die Pizza eben doch besser als das 5-Gänge-Menü
  • Endlich können auch kleine Unternehmen und Privatpersonen AI-Tools nutzen, ohne ihr Sparschwein schlachten zu müssen
  • Die wahre Innovation liegt nicht in der Technik, sondern darin, sie für jedermann erschwinglich zu machen

Read on, my dear:


AI Photo of the Day

@richoddness via midjourney
@richoddness via midjourney
Prompt:
alien with glowing hieroglyphic tattoos. Menacing. Shiny. Clean. Polished.

AI- und Tech News


Giganten wollen Intel zerlegen

Der einstige Chip-Riese Intel könnte zerschlagen werden. Broadcom interessiert sich für die Design-Abteilung, während TSMC aus Taiwan die Produktionsanlagen ins Visier nimmt. Die Diskussion über eine mögliche Aufteilung des Silicon Valley-Urgesteins zeigt, wie tief der einstige Marktführer gefallen ist - auch wenn bisher noch keine konkreten Angebote eingegangen sind.

Walmart rüstet digital auf

Der US-Handelsriese Walmart macht mit Hightech Jagd auf Amazon. In allen Filialen kommen AI und Automatisierung zum Einsatz: Mitarbeiter prüfen Bestände per Smartphone, während Manager Schichtpläne in Minuten statt Stunden erstellen. Der Konzern will seine physische Präsenz - 90 Prozent aller Amerikaner leben keine 15 Kilometer von einer Filiale entfernt - mit digitaler Effizienz kombinieren.

Chinas Tech-Elite setzt auf DeepSeek

Der chinesische Internet-Gigant Tencent öffnet seine Weixin-Plattform für den AI-Newcomer DeepSeek. Das ist bemerkenswert, denn normalerweise setzen Tech-Konzerne lieber auf eigene Lösungen. Der Schritt kommt zu einem Zeitpunkt, an dem DeepSeek in den App-Stores ChatGPT bei den Downloads bereits überholt hat.

Apple peppt Vision Pro mit AI auf

Der iPhone-Konzern verpasst seiner 3500-Dollar-Datenbrille Vision Pro ein Update mit AI-Funktionen. Ab April können Nutzer mit AI-generierten Emojis spielen, Texte schreiben lassen und in einer Art digitalem Bilderspielplatz experimentieren. Außerdem wird es einfacher, das teure Gerät mit Freunden und Familie zu teilen - per iPhone lässt sich dann ein Gast-Modus aktivieren.


AI Tools

Diese Tools revolutionieren die Videoproduktion

Die Videoproduktion erlebt einen Umbruch: AI-Tools verwandeln jeden Keyboard-Besitzer in einen potenziellen Videoproduzenten. Diese Werkzeuge machen die Erstellung professioneller Inhalte so einfach wie das Schreiben eines Blogbeitrags.

Screen Shot runwayml

Synthesia: Erstellt AI-gesteuerte Talking-Head-Videos mit anpassbaren Avataren und Stimmen in verschiedenen Sprachen - allein durch Texteingabe.

Runway: Eine professionelle AI-Kreativsuite, die Videos per Text generiert, bearbeitet und transformiert - inklusive Motion-Tracking.

Lumen5: Verwandelt Blogbeiträge und Texte in Social-Media-Videos. Die AI wählt passende Bilder zum Text.

Pictory: Extrahiert automatisch die Highlights aus langen Videos und erstellt Kurzvideos mit automatischen Untertiteln und Branding.

InVideo: Templatebasierter Videoersteller mit AI-Funktionen für schnelle Text-zu-Video-Konvertierung und professionell aussehende Inhalte.

Adobe Premiere Pro (mit AI-Features): Professionelle Videobearbeitungssoftware, erweitert um AI-Tools für automatische Farbanpassung, Audiobereinigung und Schnitt.

Veed: Browserbasierter Videoeditor mit AI-Funktionen für Untertitel, Übersetzungen und Hintergrundgeräuschentfernung.

Magisto: Einfacher automatisierter Videoeditor, der Ihr Material analysiert und daraus geschliffene Videos mit AI-ausgewählter Musik und Übergängen erstellt.