KI-Wochenrückblick – KW 20/2026

Hallo zusammen,

diese Woche zeigt sich: KI entwickelt sich weg vom klassischen Chatbot hin zu Echtzeit-Systemen, Coding-Agenten und massiver Recheninfrastruktur. OpenAI stellt neue Sprachmodelle für die Realtime API vor – darunter ein Voice-System auf GPT-5-Niveau – und erklärt, wie Codex sicher in Unternehmen eingebettet wird. Anthropic sichert sich mit Colossus-1 über 220.000 Nvidia-GPUs. Google DeepMind zeigt, wie AlphaEvolve Algorithmen in Wissenschaft und Industrie optimiert. Und Thinking Machines Lab stellt ein Modell vor, das Audio, Video und Text gleichzeitig und in Echtzeit verarbeitet.

Die News der Woche

1 OpenAI: Neue Sprachmodelle für die Realtime API

Am 7. Mai hat OpenAI drei neue Modelle für die Realtime API vorgestellt: GPT-Realtime-2, GPT-Realtime-Translate und GPT-Realtime-Whisper. Damit können KI-Anwendungen Gespräche in Echtzeit führen, Sprache live übersetzen und laufend transkribieren. Besonders GPT-Realtime-2 fällt auf: OpenAI beschreibt es als Voice-System mit Reasoning auf GPT-5-Niveau. Sprach-KI wird damit nicht mehr nur als komfortable Eingabemethode verstanden, sondern als Schnittstelle für komplexe Aufgaben in Echtzeit.

→ OpenAI: Advancing voice intelligence with new models in the API

2 OpenAI: Wie Codex sicher in Unternehmen eingesetzt werden soll

OpenAI hat einen Beitrag veröffentlicht, der erklärt, wie Codex verantwortungsvoll in Entwicklungsprozesse eingebunden werden soll. Es geht um Sandboxing, Freigabeprozesse, Netzwerkregeln und eine spezielle Protokollierung von Agentenaktivitäten. Das zeigt: Coding-Agenten werden zunehmend produktiv eingesetzt, müssen aber technisch und organisatorisch klar begrenzt werden. Für Unternehmen betrifft das nicht nur Produktivität, sondern auch IT-Sicherheit, Compliance und Kontrolle über automatisierte Systeme.

→ OpenAI: Running Codex safely

3 Anthropic sichert sich die gesamte Rechenkapazität von Colossus-1

Am 6. Mai hat Anthropic eine Vereinbarung mit SpaceX angekündigt und erhält damit Zugriff auf die gesamte Rechenkapazität des Colossus-1-Rechenzentrums – mehr als 300 Megawatt und über 220.000 Nvidia-GPUs. Das macht deutlich: Der Wettbewerb um führende KI-Modelle wird längst nicht mehr nur über Software entschieden. Rechenleistung, Energie, Chips und Rechenzentren werden zu strategischen Ressourcen. Für die Branche ist das ein Signal, dass Infrastruktur zunehmend zum Differenzierungsmerkmal führender KI-Anbieter wird.

→ xAI: New Compute Partnership with Anthropic

4 Google DeepMind: AlphaEvolve skaliert in Wissenschaft und Industrie

Google DeepMind hat gezeigt, wie AlphaEvolve in verschiedenen Bereichen eingesetzt wird. Der Gemini-basierte Coding-Agent verbessert Algorithmen und wurde unter anderem in der Genomik, Quantenphysik, Logistik und Materialforschung angewendet. Besonders bemerkenswert: Beim Willow-Prozessor soll AlphaEvolve Schaltkreise mit deutlich geringerer Fehlerquote vorgeschlagen haben. Das zeigt, dass generative KI zunehmend selbst zum Werkzeug für Forschung und technische Optimierung wird – nicht nur für Textverarbeitung oder Kundenkommunikation.

→ Google DeepMind: AlphaEvolve – scaling impact across fields

5 Thinking Machines Lab: KI, die zuhört, sieht und reagiert – gleichzeitig

Am 11. Mai hat Thinking Machines Lab sogenannte Interaction Models vorgestellt. Diese Modelle verarbeiten Audio, Video und Text kontinuierlich und können in Echtzeit reagieren. Damit sollen KI-Systeme weg vom starren Frage-Antwort-Prinzip und hin zu echter Zusammenarbeit geführt werden: Eine KI könnte nicht nur auf eine abgeschlossene Eingabe warten, sondern während einer laufenden Situation zuhören, sehen, reagieren, unterbrechen oder parallel Werkzeuge nutzen. Laut dem Unternehmen schlägt das Modell dabei GPT-Realtime-2 in Interaktivitätstests.

→ Thinking Machines Lab: Interaction Models