Mercury 2: Das KI-Modell, das mit Diffusion denkt

Mercury 2: Das KI-Modell, das mit Diffusion denkt

Inception Labs hat mit Mercury 2 ein KI-Modell vorgestellt, das eine völlig neue Architektur nutzt: Statt klassischer Transformer-Technologie setzt es auf Diffusion – die gleiche Technik, die auch Bildgeneratoren wie Midjourney antreibt.

Das Ergebnis ist beeindruckend: Mercury 2 ist laut den Entwicklern das schnellste Reasoning-Modell auf dem Markt. Bei komplexen Denkaufgaben erreicht es die Qualität von OpenAIs o1, aber in einem Bruchteil der Zeit.

Wie funktioniert das? Bei klassischen LLMs wird Token für Token generiert – jedes Wort muss nacheinander "ausgedacht" werden. Diffusion-Modelle arbeiten anders: Sie starten mit Rauschen und verfeinern das Ergebnis schrittweise, aber parallel.

Für Entwickler könnte das ein Game-Changer sein: Schnelleres Reasoning bedeutet billigere API-Kosten und responsivere Anwendungen. Wer schon mal Minuten auf eine o1-Antwort gewartet hat, weiß, wie frustrierend langsames Denken sein kann.

Die KI-Branche beobachtet Mercury 2 genau. Wenn sich der Diffusion-Ansatz bewährt, könnte das die Art, wie wir KI-Modelle bauen, grundlegend verändern. OpenAI, Anthropic und Google müssten ihre Architekturen überdenken.

Noch ist Mercury 2 ein Newcomer. Aber in der KI-Welt kann sich das Blatt schnell wenden – und wer hätte vor zwei Jahren gedacht, dass Diffusion-Modelle nicht nur Bilder, sondern auch Gedanken generieren könnten?