🤖 Elite-Systeme scheitern an Kindergarten-Tests

Guten Morgen aus San Francisco,
Die KI-Elite erlebt gerade ihren "Ich kann nicht mal gerade laufen"-Moment. Der neue ARC-AGI-2 Benchmark enthüllt die nackte Wahrheit: OpenAIs Superhirn o3 schafft magere vier Prozent. Menschen lösen den Test im Halbschlaf mit 60 Prozent. 🎯
Während die KI schwächelt, krempelt OpenAI den Laden um. CEO Sam Altman überlässt das Tagesgeschäft Brad Lightcap - vermutlich um mehr Zeit fürs Grübeln über die Testergebnisse zu haben. 😅 Mark Chen wird Forschungschef, Julia Villagra kümmert sich ums Personal. Gerüchte über eine 40-Milliarden-Finanzspritze machen die Runde.
Apropos kluge Köpfe: Zwei Stuttgarter Entwickler mischen gerade den Markt für digitales Wissensmanagement auf. Ihr Startup Capacities.io verwandelt chaotische Notizen in ein strukturiertes Wissensnetzwerk - und das komplett bootstrapped, ohne VC-Millionen. Ein erfrischender Gegenentwurf zum Silicon Valley Hype. 🧠
Stay curious,
Marcus Schuler
Neue Tests entlarven KI-Schwächen

Die modernsten KI-Systeme versagen spektakulär bei einem neuen Intelligenztest. Die ARC Prize Foundation präsentierte heute ihren ARC-AGI-2 Benchmark - und der Absturz der KI-Elite könnte nicht deutlicher sein.
OpenAIs Vorzeige-System o3 erreicht magere vier Prozent. Ein durchschnittlicher Mensch schafft locker 60 Prozent. Der Test fordert simple Mustererkennungen, die für Menschen kinderleicht sind.
Die Kosten sprechen eine eigene Sprache: Während o3 pro Aufgabe 200 Dollar verbrennt, lösen Menschen die Tests für 17 Dollar. Effizienter geht's kaum.
Besonders peinlich: Die KI scheitert an Grundlagen wie dem Verstehen von Symbolen oder dem gleichzeitigen Anwenden mehrerer Regeln. Sie starrt auf die Muster wie ein Roboter auf einen Picasso.
Die Foundation reagiert mit Humor. Sie startet einen Wettbewerb: Erreiche 85 Prozent Genauigkeit für unter 50 Cent pro Aufgabe. Quasi unmöglich mit aktueller Technik.
Greg Kamradt, Leiter der Foundation, sieht einen Wendepunkt: "Diese Tests zeigen erstmals messbar die Grenzen künstlicher Intelligenz."
Die Ergebnisse erschüttern die Tech-Branche. Noch im Dezember 2024 prahlte OpenAI mit Durchbrüchen bei der künstlichen Intelligenz. Ihr System o3 knackte den vorherigen Benchmark mit 75,7 Prozent.

Der neue Test entlarvt diese Erfolge als Einbahnstraße. Die KI scheitert nicht an komplexen Aufgaben - sie versagt bei Basics. Sie erkennt zwar Muster, versteht aber deren Bedeutung nicht.
Die Foundation plant bereits den nächsten Schritt. Sie will die Ergebnisse öffentlich zugänglich machen. Jeder soll die Grenzen der KI selbst testen können.
Warum das wichtig ist:
- Die teuersten KI-Systeme scheitern an Aufgaben, die jeder Mensch im Vorbeigehen löst
- Rohe Rechenpower ersetzt keine echte Intelligenz - die Branche braucht neue Ideen
Read on, my dear:
- ARC PRIZE: ARC-AGI-2 + ARC Prize 2025 is Back
- ARC: ARC-AGI Leaderboard
KI Photo des Tages

Prompt:
a racing car in Paris 1930, white background text : minuit 37
Chinas KI-Champion macht Ernst: DeepSeek V3 fordert globale Elite heraus
DeepSeek mischt die globale KI-Szene auf. Das chinesische Labor veröffentlicht sein neuestes Sprachmodell V3 unter MIT-Lizenz - ein strategischer Schachzug, der die Branche elektrisiert.
Mit 641 GB geballter KI-Power zielt DeepSeek direkt auf die Weltspitze. Die Performance überrascht selbst KI-Veteranen: Auf dem M3 Ultra Mac Studio spuckt das Modell über 20 Token pro Sekunde aus.
Im Polyglot-Benchmark erreicht V3 beeindruckende 55% und jagt damit Claude Sonnet 3.7. Die 4-Bit-Quantisierung schrumpft das Modell auf schlanke 352 GB - Hochleistungs-KI für die gehobene Mittelklasse.
In China löst DeepSeek bereits eine Marktbereinigung aus. Etablierte Start-ups wie 01.ai, Zhipu und Moonshot werfen ihre ursprünglichen Geschäftsmodelle über Bord. Sie setzen nun auf DeepSeeks Technologie oder ziehen sich in Nischen zurück.
Das 160-köpfige Team aus Hangzhou beweist: Technologische Exzellenz schlägt aufgeblähte Organisationen. Während die Konkurrenz Milliarden verbrennt, konzentriert sich DeepSeek auf Forschung - und öffnet seine Technologie für alle.
Warum das wichtig ist:
- DeepSeek revolutioniert den KI-Markt zweifach: technologisch an der Spitze und strategisch mit Open Source
- Ein chinesisches Labor zeigt Silicon Valley, wie Innovation geht: schlank, fokussiert und offen für alle
Read on, my dear:
- Financial Times: Chinese AI start-ups overhaul business models after DeepSeek’s success
- Simon Willison’s Weblog: Chinese AI lab DeepSeek just released the latest version of their enormous DeepSeek v3 model
Besser prompten...
Heute: Nachhaltige Problemlösungen ♻️🗑️🙈
Entwickle einen praktischen Plan zur Plastikmüll-Reduzierung in der Stadt.
Dein Rahmen:
- 3 technische Lösungen
- 3 Ideen für Bürgerbeteiligung
- Zieldatum: 12 Monate
- Budget: 500.000 Euro
- Pilotstadt: 100.000 Einwohner
- Fokus: Schnelle Umsetzung, messbare Wirkung.
Warum das wichtig ist:
Ein guter Prompt braucht drei wesentliche Elemente. Diese helfen jedem, der eine Aufgabe lösen soll, sofort loszulegen.
- Ein gut strukturierter Prompt nennt als erstes das konkrete Ziel.
- Danach folgen messbare Rahmenbedingungen wie Zeit, Geld oder verfügbare Ressourcen.
- Der dritte Teil beschreibt das gewünschte Ergebnis.
Klare Grenzen zwingen zum kreativen Denken innerhalb realistischer Möglichkeiten. Sie verhindern ausufernde Wunschlisten und theoretische Konzepte. Stattdessen entstehen umsetzbare Lösungen.
Der Zeitrahmen spielt dabei eine besondere Rolle. Er zwingt dazu, die wichtigsten Hebel zu identifizieren. Nur wer die Zeit begrenzt, erhält schnell erste Ergebnisse. Diese lassen sich dann schrittweise verbessern.
OpenAI baut um: Altman konzentriert sich auf Produkte, COO erhält mehr Macht
OpenAI strukturiert sich radikal um. CEO Sam Altman übergibt das operative Geschäft an COO Brad Lightcap und fokussiert sich künftig auf Forschung und Produktentwicklung. Eine strategische Neuausrichtung, die das Unternehmen für die nächste Wachstumsphase rüsten soll.
Lightcap übernimmt die Expansion in neue Märkte und steuert Partnerschaften mit Tech-Giganten wie Microsoft und Apple. Mark Chen steigt zum Chief Research Officer auf und soll Forschung und Produktentwicklung verzahnen. Julia Villagra wird als Chief People Officer die globale Personalstrategie verantworten.
Die Umstrukturierung folgt einer turbulenten Phase. Mehrere Führungskräfte haben das Unternehmen verlassen, darunter Chief Scientist Ilya Sutskever und CTO Mira Murati. Einige Kritiker zweifeln öffentlich an OpenAIs Engagement für sichere KI-Entwicklung.
OpenAI verhandelt derzeit über eine Umwandlung in eine gewinnorientierte Public Benefit Corporation. Im Gespräch: Eine neue Finanzierungsrunde von 40 Milliarden Dollar bei einer Bewertung von 300 Milliarden Dollar.
Warum das wichtig ist:
- OpenAI transformiert sich vom KI-Labor zum Tech-Imperium - ein riskanter Balanceakt zwischen Innovation und Kontrolle
- Die Machtverschiebung zu Lightcap signalisiert: OpenAI will schneller wachsen, während Altman die technische Vision schärft
Read on, my dear:
OpenAI Firmenblog: Leadership updates
KI & Tech News
Berliner n8n gelingt KI-Coup: 60 Millionen für Fair-Code-Pionier
Das Berliner Startup n8n landet einen Volltreffer. Mit KI-gestützter Workflow-Automatisierung wächst der Umsatz in zwei Monaten um das Doppelte. Jetzt fließen 60 Millionen Euro frisches Kapital - bei 270 Millionen Bewertung.
Code That Started the AI Revolution Now Public
Google and the Computer History Museum have released the source code for AlexNet, the neural network that kicked off our current AI frenzy in 2012. While modern AI can write poetry and create art, this groundbreaking code just wanted to tell a school bus from a strawberry - and somehow that changed everything.
KI-Startup verbrennt 74 Millionen mit Fake-Logos und defekter Tech
Ein KI-Sales-Startup aus dem Valley macht alles falsch, was man falsch machen kann: gefälschte Kundenreferenzen, dysfunktionale Technologie und ein CEO, der um 3 Uhr morgens Slack-Terror verbreitet. TechCrunch enthüllt die bittere Wahrheit hinter der glänzenden 74-Millionen-Dollar-Fassade.
Ex-Meta-VP will das nächste Wiz bauen
Ein Phantom-Startup scheffelt 75 Millionen Dollar. Der Ex-Meta-VP Roi Tiger holt sich in Rekordzeit erst 20, dann 55 Millionen Dollar von den Wiz-Investoren. Das Produkt? Noch unsichtbar. Die Bewertung? Astronomisch. Der Zeitpunkt? Perfekt - eine Woche nach Googles 32-Milliarden-Deal für Wiz.
Security Copilot: Microsofts KI-Armee rückt aus
Microsoft schickt seine digitalen Sturmtruppen ins Feld: Der Security Copilot bekommt autonome KI-Agenten. Während überforderte IT-Teams in der Flut von Phishing-Mails und Sicherheitswarnungen ertrinken, patrouillieren künftig elf KI-Bots durch die digitalen Schützengräben.
Quantencomputer aus der Chipfabrik: PsiQuantum wagt Milliardenspiel
PsiQuantum geht einen überraschenden Weg: Statt exotischer Materialien nutzt das Startup bewährte Chiptechnik für Quantencomputer. BlackRock führt eine 750-Millionen-Finanzierung an und bewertet das Unternehmen mit 6 Milliarden Dollar - vor dem ersten funktionierenden Rechner.
Musk verliert Schlüsselfigur: Technikchef Wang wirft bei X hin
Haofei Wang, Kopf der Technik bei X, verlässt überraschend das Unternehmen. Der Manager galt als wichtige Brücke zwischen Musk und den Entwicklern. Sein Abgang trifft X in einer heiklen Phase: Musk widmet sich verstärkt xAI und Politik, während X noch immer auf seinen Durchbruch als Super-App wartet.
KI-Firmen buhlen um Trump: Plötzlich soll Regulierung verschwinden
Die KI-Elite macht eine 180-Grad-Wende. Vor einem Jahr flehten Tech-Bosse noch um strenge Regeln. Jetzt, unter Trump, wollen sie freie Bahn - und bekommen sie. Der Präsident hat KI zum Staatsauftrag im Wettlauf mit China erklärt, kommentiert die New York Times.
EU plant digitale Vollkontrolle: Anonyme SIM-Karten sollen verschwinden
Die EU will den letzten Hafen digitaler Anonymität sperren. Polens Ratspräsidentschaft fordert ein EU-weites Verbot anonymer Prepaid-SIM-Karten - im Namen der Sicherheit. Die eigentliche Gefahr? Der schleichende Tod digitaler Freiheit.
🚀 KI Profile: Die Unternehmen von Morgen

Capacities.io revolutioniert die Art, wie wir digitales Wissen organisieren - ein "Studio für den Geist", das Notizen in ein lebendiges Wissensnetzwerk verwandelt. Die von zwei deutschen Entwicklern gegründete Plattform verschmilzt die Leichtigkeit des Notierens mit der Kraft einer persönlichen Datenbank und baut damit die nächste Generation des digitalen Denkens. 🧠
Die Gründer ⚡
Steffen Bleher und Michael von Hohnhorst, zwei Computergenies von der Uni Stuttgart. Gründung 2020 aus persönlicher Frustration über unnatürliche digitale Werkzeuge. Remote-first Team mit Basis in Stuttgart. Aktuell unter 10 Mitarbeitenden, agil und fokussiert
Das Produkt 💎
Hybrid aus Notiz-App und strukturierter Datenbank. Intelligente Verknüpfung von Wissen durch Objekttypen und Backlinks. Clean, minimalistisches Design ohne Schnickschnack.
Offline-Modus und Cross-Platform-Support. KI-Assistant für smarte Wissensorganisation
Die Konkurrenz 🥊
Notion dominiert den Massenmarkt (30+ Mio. Nutzer)
Obsidian führt bei Local-First (1+ Mio. Nutzer)
Roam Research als Kultprodukt für Power-User
Capacities punktet durch Benutzerfreundlichkeit und strukturierte Flexibilität
Die Finanzierung 💪
100% bootstrapped und eigenfinanziert. Keine VCs oder externe Investoren. Nachhaltige Finanzierung durch Pro-Abonnements. Bewusste Entscheidung für Unabhängigkeit.
Die Zukunft ⭐⭐⭐⭐
Capacities steht an der Schwelle zum Durchbruch. Mit solidem Produktfundament, treuer Community und klarer Vision könnte das Startup die nächste Erfolgsgeschichte im PKM-Space werden.
Neue Features wie Calendar 2.0 und tiefere KI-Integration zeigen: Hier wächst die Zukunft des persönlichen Wissensmanagements. Die Unabhängigkeit von VC-Geldern ermöglicht fokussierte Innovation statt schnellem Wachstum.