KI-Agenten: was wirklich drin steckt
Coding-Agenten wie Claude, Codex und Cursor versprechen viel, heute zeigen wir dir, was sie im Alltag tatsächlich leisten und wo du den größten Hebel hast. Dazu erfährst du, wie ChatGPT jetzt besser mit deinem Kontext umgeht, wie du Agenten-Projekte sauber kalkulierst und was die aktuelle Bain-Studie über erfolgreiche KI-Projekte verrät. Alles, was du brauchst, um fundierte Entscheidungen zu treffen.
Claude, Codex und Cursor im Realitätscheck: Was Coding-Agenten wirklich leisten
Grüne Checks bedeuten nicht, dass der Job erledigt ist. Das ist die wichtigste Erkenntnis aus einem aktuellen Praxistest, bei dem Claude Code, OpenAI Codex und Cursor dieselben Aufgaben in einem echten Repository gelöst haben.
Für dich als Geschäftsführer heißt das konkret: Coding-Agenten sind heute starke Assistenten, keine autonomen Entwickler. Sie schreiben Code, der oft funktioniert und Tests besteht. Aber ob der Code ins Gesamtsystem passt, keine versteckten Fehler enthält und wirklich produktionsreif ist, das beurteilt noch immer ein erfahrener Entwickler. Wer das einkalkuliert, hat realistische Erwartungen und vermeidet böse Überraschungen.
Der Test zeigt auch, dass die drei Tools unterschiedliche Stärken haben. Claude Code punktet bei komplexeren Aufgaben mit nachvollziehbarem Vorgehen. Codex ist eng in die OpenAI-Welt eingebunden und für Teams interessant, die ohnehin dort arbeiten. Cursor überzeugt als Editor-Integration für Entwickler, die nah am Code bleiben wollen. Keines der Tools gewinnt in jeder Disziplin.
Was das für deinen Betrieb bedeutet: Wenn du Entwickler beschäftigst oder externe Dienstleister beauftragst, frag ruhig nach, wie sie KI-Tools einsetzen. Nicht weil du kontrollieren willst, sondern weil ein guter Umgang mit diesen Werkzeugen heute ein echtes Qualitätsmerkmal ist. Entwickler, die Coding-Agenten sinnvoll nutzen und ihre Grenzen kennen, arbeiten schneller und machen weniger Fehler.
Die Tools werden besser, das ist sicher. Aber der Schritt von "läuft durch die Tests" zu "kann in Produktion" bleibt menschliche Arbeit, noch eine Weile.
- golem.de · 5. Juni 2026
ChatGPT merkt sich mehr von dir, und korrigiert sich selbst
Wer ChatGPT regelmäßig nutzt, kennt das Problem: Das Tool erinnert sich an Dinge, die längst nicht mehr stimmen. Dein altes Unternehmen, deine frühere Branche, ein Projekt von vor einem Jahr. Das nervt, weil du es manuell korrigieren musst.
OpenAI hat das Gedächtnissystem jetzt grundlegend überarbeitet. Das neue System heißt intern "Dreaming" und läuft im Hintergrund: Nach Gesprächen gleicht ChatGPT neue Informationen mit dem ab, was es bereits über dich gespeichert hat, und überschreibt Veraltetes automatisch. Die Erfolgsrate, Informationen zeitlich korrekt zu halten, stieg laut OpenAI von 52 auf 75 Prozent.
Für den Alltag bedeutet das: Wenn du ChatGPT heute sagst, dass dein Team gewachsen ist oder du ein neues Produkt verkaufst, muss das nicht mehr manuell ins Gedächtnis eingetragen werden. Das System zieht die Konsequenz selbst.
Ein Vorbehalt bleibt: 75 Prozent ist besser als 52, aber kein Freifahrtschein. Für wichtige Kontexte lohnt es sich weiterhin, am Anfang eines Gesprächs kurz zu sagen, was gerade gilt. Automatisch heißt nicht fehlerfrei.
Das Update rollt für ChatGPT Plus und Pro aus.
Takeaway. Prüf einmal, was ChatGPT aktuell über dich gespeichert hat: Einstellungen → Personalisierung → Erinnerungen verwalten.
- the-decoder.de · 4. Juni 2026
- openai.com · 4. Juni 2026
KI-Kosten im Griff: So kalkulierst du Agenten-Projekte richtig
Das Flatrate-Modell stirbt gerade leise. Wer KI bisher per Monatsabo genutzt hat, kennt das Prinzip: fester Preis, offene Fragen, fertig. Mit KI-Agenten funktioniert das nicht mehr.
Agenten arbeiten nicht einmalig auf eine Frage hin. Sie denken in Schritten, rufen Tools auf, prüfen Zwischenergebnisse und laufen dabei über Minuten oder Stunden. Jeder dieser Schritte kostet. Das kann schnell das Zehnfache eines normalen Chats sein. Kein Anbieter kann das dauerhaft pauschal anbieten, also wechseln alle auf Verbrauchsabrechnung.
Das Tückische: Ein niedriger Preis pro Einheit sagt wenig darüber, was ein Prozess am Ende kostet. Entscheidend ist, wie viele Schritte ein Agent braucht, um ein Ergebnis zu liefern. Ein schlecht konstruierter Workflow kann teurer sein als ein teureres Modell mit weniger Umwegen.
Für deinen Betrieb heißt das: Bevor du einen Agenten-Workflow produktiv schaltest, lass ihn in einer Testumgebung laufen und miss den tatsächlichen Verbrauch. Setz dir ein Budget-Limit pro Lauf. Und frag bei jedem Automatisierungsprojekt nicht nur "Was kostet das Modell?", sondern "Was kostet der gesamte Prozess pro Ergebnis?"
Der Maßstab ist nicht der Tokenpreis. Der Maßstab ist: Was zahle ich, und was spare oder erwirtschafte ich dafür?
- the-decoder.de · 4. Juni 2026
Bain-Studie: So holst du mehr aus KI-Projekten heraus
Eine Bain-Umfrage unter knapp 1.000 Unternehmen zeigt: 37 Prozent wollten 11 bis 20 Prozent Kosten sparen. Fast 40 Prozent landeten am Ende bei unter 10 Prozent.
Der Hauptgrund ist beherrschbar: Die Einsparungsrechnungen basieren oft auf vollautomatisierten Abläufen, aber in der Praxis bleibt ein Mensch im Prozess. Nur 7 Prozent der Unternehmen setzen tatsächlich vollautonome KI-Agenten ein. Der Rest arbeitet mit Lösungen, bei denen Mitarbeiter prüfen, freigeben oder korrigieren. Das kostet Zeit und frisst den kalkulierten Spareffekt.
Für dich heißt das vor allem eines: Rechne ehrlich. Wenn dein Team KI-Ergebnisse noch abnehmen muss, ist das kein Fehler, sondern oft sinnvoll. Aber dann sollte die Kalkulation das abbilden und nicht von einer Automatisierung ausgehen, die noch nicht existiert.
Der zweite Schritt ist, gezielt zu schauen, wo Autonomie wirklich möglich ist. Nicht jeder Prozess braucht menschliche Kontrolle in jeder Stufe. Standardisierte, gut definierte Aufgaben wie Dokumentenverarbeitung, Datenpflege oder interne Anfragen lassen sich oft weiter automatisieren als viele Betriebe aktuell umsetzen.
Die Lücke zwischen Erwartung und Ergebnis ist kein Zeichen, dass KI nicht funktioniert. Sie ist ein Zeichen, dass die Planung zu optimistisch war. Das lässt sich korrigieren.
- the-decoder.de · 4. Juni 2026
Ein Klick reicht. Du hilfst, das Briefing schärfer zu machen.
Archiv
6 Ausgaben insgesamt
15 Min Gespräch, kostenlos.
Wir schauen, wo KI in deinem Betrieb sofort Stunden spart.
