Die Feedback-Schleife ist alles

Ein KI-Modell, das selbstständig programmiert, ist nicht der interessante Teil. Der interessante Teil ist, was passiert, nachdem es den Code generiert hat. Wie schnell kann das Modell erkennen, ob der Code korrekt ist? Wie eng ist die Feedback-Schleife zwischen Generierung und Validierung?

Diese Schleife bestimmt alles. Sie bestimmt, ob das Modell seine eigene Ausgabe iterieren kann. Sie bestimmt, ob ein Mensch der Ausgabe ohne manuelle Prüfung vertrauen kann. Sie bestimmt, in welchen Domänen KI-Coding tatsächlich funktioniert.

Die Geschwindigkeit der Schleife ist nicht einheitlich. Sie folgt einem Spektrum. Und das Spektrum wird durch eine einfachere Wahrheit bestimmt: KI ist text-nativ.

Backend-Code ist Text. API-Antworten sind Text. Datenbankschemata sind Text. Die gesamte Domäne ist in Zeichenketten repräsentiert, die ein Sprachmodell lesen, generieren und validieren kann, ohne jemals sein natives Medium zu verlassen. Selbst wenn Backend CLI-Befehle umfasst, sind diese Befehle Text. Das Modell muss nicht sehen. Es muss lesen.

Visuelle Oberflächen sind anders. Eine UI ist kein statisches Bild. Sie ist zeitlich. Zustände ändern sich. Animationen gehen über. Gesten lösen Kaskaden aus. Das Modell kann einen Button screenshotten, aber es kann das Timing eines Drucks nicht spüren. Es kann das CSS lesen, aber es kann nicht beobachten, wie sich die Easing-Kurve über die Zeit entfaltet. Visuelle Korrektheit ist erfahrungsbasiert, und Erfahrung geschieht in der Zeit.

Backend: Millisekunden

Backend-Code validiert deterministisch. Eine Funktion hat Eingaben und Ausgaben. Ein Type Checker verifiziert den Contract zur Kompilierzeit. Eine Test-Suite prüft das Verhalten in Millisekunden. Ein API-Endpunkt gibt eine Antwort zurück, die einem Schema entspricht – oder eben nicht. Die Datenbankmigration wird entweder sauber angewendet oder zurückgerollt.

Jedes Validierungssignal ist textuell, deterministisch und schnell. Das Modell kann eine Funktion generieren, den Type Checker ausführen, den Fehler sehen und in Sekunden neu generieren. Es kann einen Test schreiben, ihn ausführen, den Fehlschlag sehen und die Implementierung korrigieren. Der Iterationszyklus ist eng genug, dass das Modell innerhalb einer abgegrenzten Backend-Aufgabe semi-autonom arbeiten kann.

Deshalb fühlt sich KI-Coding heute im Backend am magischsten an. Die Domäne ist reine Logik. Die Validierung ist sofort. Das Modell weiß, wenn es falsch liegt – genau das, was deterministic guardrails dem Rest deiner Codebase geben wollen.

Web: Minuten

Webentwicklung fügt visuelle Korrektheit hinzu. Eine Komponente kann die richtigen Props und das falsche Padding haben. Ein Layout kann jeden Type Check bestehen und trotzdem kaputt aussehen. Die Validierungsoberfläche ist nicht mehr rein deterministisch.

Playwright hilft. Man kann die Komponente rendern, screenshotten und gegen eine Baseline diffen. Aber das ist langsam. Eine Backend-Test-Suite läuft in Sekunden. Eine Playwright-Visual-Regression-Suite läuft in Minuten. Die KI kann nicht mit derselben Geschwindigkeit auf ihrer eigenen Ausgabe iterieren, weil der Validierungsschritt eine Größenordnung langsamer ist.

Das Modell kann React-Code generieren, der kompiliert. Es kann nicht sagen, ob die resultierende UI korrekt aussieht, ohne einen Browser auszuführen, das DOM zu rendern und Pixel zu vergleichen. Dieser Flaschenhals ist real. KI-Coding im Web funktioniert, aber die Feedback-Schleife ist lockerer.

Mobile: Stunden

Mobile fügt physische Realität hinzu. Eine Geste hat Timing und Physik. Eine Animation hat Easing-Kurven, die sich richtig oder falsch anfühlen. Ein Bildschirm rendert auf iOS 16 anders als auf iOS 18. Bluetooth, Kamera, GPS und Push-Benachrichtigungen haben alle ein Verhalten, das je nach Gerät, Betriebssystemversion und Hersteller-Overlay variiert.

Es gibt keinen schnellen Weg, dies zu validieren. Unit Tests decken die Geschäftslogik ab, aber nicht das Gefühl eines Swipes. UI-Tests auf einem Simulator fangen Layout-Probleme ab, aber keine Frame-Drops auf einem drei Jahre alten Android-Gerät. Echte Validierung erfordert Build, Signierung, Installation und Interaktion mit der App auf physischer Hardware. Die Feedback-Schleife wird in Stunden gemessen, nicht in Sekunden.

Das Modell kann SwiftUI- oder Jetpack-Compose-Code generieren, der kompiliert. Es kann nicht sagen, ob sich die App nativ anfühlt. Das erfordert menschliche Hände auf echten Geräten. Der Iterationszyklus ist zu langsam, als dass das Modell sich effektiv selbst korrigieren könnte – weshalb KI-generierte React-Native-Apps Guardrails zum Skalieren brauchen.

Was das Spektrum bedeutet

KI-Coding expandiert nicht mit der Geschwindigkeit der Modellfähigkeiten. Es expandiert mit der Geschwindigkeit der Validierung.

Das Modell kann heute Mobile-Code schreiben. Was es nicht kann, ist zu wissen, ob dieser Code gut ist. Wissen erfordert eine Validierungsinfrastruktur, die Mobile nicht hat. Backend hat sie. Web baut sie auf. Mobile ist Jahre zurück.

Für Teams, die entscheiden, wo sie KI-Coding einsetzen, ist die Antwort offensichtlich. Fang dort an, wo die Validierung am schnellsten ist. Backend zuerst. Web als Zweites, mit Investition in visuelles Testen. Mobile zuletzt, wobei menschliche Hände immer noch die finale Validierung übernehmen. Die Wartungskosten dieser Entscheidung summieren sich mit der Zeit – weshalb Version eins nie das eigentliche Problem ist.

Das Modell ist nicht intelligenter im Backend. Es ist nur besser informiert.