bbastify
← Alle Ausgaben
Archiv · Ausgabe #126. Juni 2026 · 4 Min Lesezeit · 31 Quellen
Bastify Daily · Samstag, 6. Juni 2026 · #12

KI-Agenten: was wirklich drin steckt

Coding-Agenten wie Claude, Codex und Cursor versprechen viel, heute zeigen wir dir, was sie im Alltag tatsächlich leisten und wo du den größten Hebel hast. Dazu erfährst du, wie ChatGPT jetzt besser mit deinem Kontext umgeht, wie du Agenten-Projekte sauber kalkulierst und was die aktuelle Bain-Studie über erfolgreiche KI-Projekte verrät. Alles, was du brauchst, um fundierte Entscheidungen zu treffen.

Bastian Schlarp, founder of Bastify
Basti
Veröffentlicht am 06. Juni 2026, 09:16 Uhr
01Top Story

Claude, Codex und Cursor im Realitätscheck: Was Coding-Agenten wirklich leisten

TL;DREin Praxistest zeigt: KI-Coding-Agenten bestehen Tests, aber kein fertiger PR, wer das weiß, setzt sie richtig ein.

Grüne Checks bedeuten nicht, dass der Job erledigt ist. Das ist die wichtigste Erkenntnis aus einem aktuellen Praxistest, bei dem Claude Code, OpenAI Codex und Cursor dieselben Aufgaben in einem echten Repository gelöst haben.

Für dich als Geschäftsführer heißt das konkret: Coding-Agenten sind heute starke Assistenten, keine autonomen Entwickler. Sie schreiben Code, der oft funktioniert und Tests besteht. Aber ob der Code ins Gesamtsystem passt, keine versteckten Fehler enthält und wirklich produktionsreif ist, das beurteilt noch immer ein erfahrener Entwickler. Wer das einkalkuliert, hat realistische Erwartungen und vermeidet böse Überraschungen.

Der Test zeigt auch, dass die drei Tools unterschiedliche Stärken haben. Claude Code punktet bei komplexeren Aufgaben mit nachvollziehbarem Vorgehen. Codex ist eng in die OpenAI-Welt eingebunden und für Teams interessant, die ohnehin dort arbeiten. Cursor überzeugt als Editor-Integration für Entwickler, die nah am Code bleiben wollen. Keines der Tools gewinnt in jeder Disziplin.

Was das für deinen Betrieb bedeutet: Wenn du Entwickler beschäftigst oder externe Dienstleister beauftragst, frag ruhig nach, wie sie KI-Tools einsetzen. Nicht weil du kontrollieren willst, sondern weil ein guter Umgang mit diesen Werkzeugen heute ein echtes Qualitätsmerkmal ist. Entwickler, die Coding-Agenten sinnvoll nutzen und ihre Grenzen kennen, arbeiten schneller und machen weniger Fehler.

Die Tools werden besser, das ist sicher. Aber der Schritt von "läuft durch die Tests" zu "kann in Produktion" bleibt menschliche Arbeit, noch eine Weile.

Takeaway
Frag deinen Entwickler oder Dienstleister, wie er KI-Coding-Tools einsetzt und welche Qualitätssicherung dahinter steckt.
Weitere Infos
02Update· ChatGPT

ChatGPT merkt sich mehr von dir, und korrigiert sich selbst

TL;DROpenAIs neues Gedächtnissystem aktualisiert deine gespeicherten Infos automatisch im Hintergrund, statt veraltete Daten einfach zu behalten.

Wer ChatGPT regelmäßig nutzt, kennt das Problem: Das Tool erinnert sich an Dinge, die längst nicht mehr stimmen. Dein altes Unternehmen, deine frühere Branche, ein Projekt von vor einem Jahr. Das nervt, weil du es manuell korrigieren musst.

OpenAI hat das Gedächtnissystem jetzt grundlegend überarbeitet. Das neue System heißt intern "Dreaming" und läuft im Hintergrund: Nach Gesprächen gleicht ChatGPT neue Informationen mit dem ab, was es bereits über dich gespeichert hat, und überschreibt Veraltetes automatisch. Die Erfolgsrate, Informationen zeitlich korrekt zu halten, stieg laut OpenAI von 52 auf 75 Prozent.

Für den Alltag bedeutet das: Wenn du ChatGPT heute sagst, dass dein Team gewachsen ist oder du ein neues Produkt verkaufst, muss das nicht mehr manuell ins Gedächtnis eingetragen werden. Das System zieht die Konsequenz selbst.

Ein Vorbehalt bleibt: 75 Prozent ist besser als 52, aber kein Freifahrtschein. Für wichtige Kontexte lohnt es sich weiterhin, am Anfang eines Gesprächs kurz zu sagen, was gerade gilt. Automatisch heißt nicht fehlerfrei.

Das Update rollt für ChatGPT Plus und Pro aus.

Takeaway. Prüf einmal, was ChatGPT aktuell über dich gespeichert hat: Einstellungen → Personalisierung → Erinnerungen verwalten.
Weitere Infos
03Deep Dive

KI-Kosten im Griff: So kalkulierst du Agenten-Projekte richtig

TL;DRAutonome KI-Agenten verbrauchen ein Vielfaches der bisherigen Kosten, wer das früh einplant, vermeidet böse Überraschungen auf der Rechnung.

Das Flatrate-Modell stirbt gerade leise. Wer KI bisher per Monatsabo genutzt hat, kennt das Prinzip: fester Preis, offene Fragen, fertig. Mit KI-Agenten funktioniert das nicht mehr.

Agenten arbeiten nicht einmalig auf eine Frage hin. Sie denken in Schritten, rufen Tools auf, prüfen Zwischenergebnisse und laufen dabei über Minuten oder Stunden. Jeder dieser Schritte kostet. Das kann schnell das Zehnfache eines normalen Chats sein. Kein Anbieter kann das dauerhaft pauschal anbieten, also wechseln alle auf Verbrauchsabrechnung.

Das Tückische: Ein niedriger Preis pro Einheit sagt wenig darüber, was ein Prozess am Ende kostet. Entscheidend ist, wie viele Schritte ein Agent braucht, um ein Ergebnis zu liefern. Ein schlecht konstruierter Workflow kann teurer sein als ein teureres Modell mit weniger Umwegen.

Für deinen Betrieb heißt das: Bevor du einen Agenten-Workflow produktiv schaltest, lass ihn in einer Testumgebung laufen und miss den tatsächlichen Verbrauch. Setz dir ein Budget-Limit pro Lauf. Und frag bei jedem Automatisierungsprojekt nicht nur "Was kostet das Modell?", sondern "Was kostet der gesamte Prozess pro Ergebnis?"

Der Maßstab ist nicht der Tokenpreis. Der Maßstab ist: Was zahle ich, und was spare oder erwirtschafte ich dafür?

Takeaway
Definiere vor dem nächsten Agenten-Projekt ein konkretes Kostenlimit pro Prozesslauf und miss es in der Testphase.
Weitere Infos
04Deep Dive

Bain-Studie: So holst du mehr aus KI-Projekten heraus

TL;DRFast 40 % der Unternehmen sparen weniger als erhofft, weil KI-Projekte zu wenig Autonomie bekommen, wer das weiß, plant realistischer und trifft bessere Entscheidungen.

Eine Bain-Umfrage unter knapp 1.000 Unternehmen zeigt: 37 Prozent wollten 11 bis 20 Prozent Kosten sparen. Fast 40 Prozent landeten am Ende bei unter 10 Prozent.

Der Hauptgrund ist beherrschbar: Die Einsparungsrechnungen basieren oft auf vollautomatisierten Abläufen, aber in der Praxis bleibt ein Mensch im Prozess. Nur 7 Prozent der Unternehmen setzen tatsächlich vollautonome KI-Agenten ein. Der Rest arbeitet mit Lösungen, bei denen Mitarbeiter prüfen, freigeben oder korrigieren. Das kostet Zeit und frisst den kalkulierten Spareffekt.

Für dich heißt das vor allem eines: Rechne ehrlich. Wenn dein Team KI-Ergebnisse noch abnehmen muss, ist das kein Fehler, sondern oft sinnvoll. Aber dann sollte die Kalkulation das abbilden und nicht von einer Automatisierung ausgehen, die noch nicht existiert.

Der zweite Schritt ist, gezielt zu schauen, wo Autonomie wirklich möglich ist. Nicht jeder Prozess braucht menschliche Kontrolle in jeder Stufe. Standardisierte, gut definierte Aufgaben wie Dokumentenverarbeitung, Datenpflege oder interne Anfragen lassen sich oft weiter automatisieren als viele Betriebe aktuell umsetzen.

Die Lücke zwischen Erwartung und Ergebnis ist kein Zeichen, dass KI nicht funktioniert. Sie ist ein Zeichen, dass die Planung zu optimistisch war. Das lässt sich korrigieren.

Takeaway
Prüf deine laufenden KI-Projekte: Wo steckt noch manueller Aufwand drin, der in der ursprünglichen Kalkulation nicht vorgesehen war?
Weitere Infos
Wie war's heute?

Ein Klick reicht. Du hilfst, das Briefing schärfer zu machen.

Daily Morning Briefing
Bastify Daily

Dein Daily Morning Briefing. Direkt ins Postfach.

Jeden Morgen das Wichtigste aus dem KI-Maschinenraum, in 5 Minuten gelesen. Von Basti persönlich kuratiert.

Mit Klick auf „Abonnieren" stimmst du dem Versand zu. Du kannst jederzeit kündigen. Datenschutz
Kostenlos Jederzeit kündbar DSGVO-konform
So entsteht das Briefing: KI-gestützt aus 31+ Quellen recherchiert, von Basti geprüft und freigegeben.

Archiv

6 Ausgaben insgesamt

#16Mittwoch · 10. Juni 2026Claude Fable 5 schafft Code-Migrationen in einem Tag, die früher Wochen gefressen haben, und OpenAI Codex zeigt konkret, wie kleine Teams die Schlagkraft ganzer Abteilungen entfalten. Dazu: Google Meet spricht jetzt über 70 Sprachen gleichzeitig, und ein Münchner Urteil klärt, wer für falsche KI-Antworten geradestehen muss. Lies rein, es lohnt sich.#15Dienstag · 9. Juni 2026Wer KI-Tools produktiv einsetzt, will auch wissen, was sie wirklich kosten und wie er den Überblick behält. Dazu gibt es heute einen praxisnahen Einstieg ins Thema Kostensteuerung, außerdem zeigt Perplexity mit seinem neuen Update, wie KI-Suche gleichzeitig präziser und erschwinglicher wird. Und was die Instagram-KI-Lücke für dein Datenschutzbewusstsein bedeutet, liest du ebenfalls.#14Montag · 8. Juni 2026ChatGPT entwickelt sich zur echten Schaltzentrale für KI-Agenten, und wer früh versteht wie das funktioniert, hat einen echten Vorsprung. Außerdem zeigen wir dir, wie du DeepSeek datenschutzkonform einsetzt und warum der größte Hebel bei KI oft nicht die Technik ist, sondern die richtige Erwartungshaltung. Ein guter Start in die Woche.#13Sonntag · 7. Juni 2026Drei der bekanntesten KI-Coding-Assistenten im direkten Vergleich: Heute erfährst du, was Claude, Codex und Cursor im Alltag tatsächlich liefern und wo die Unterschiede liegen. Dazu zeigt Meta mit Hatch, wie du eigene Tools künftig per Spracheingabe baust, und ein neues Open-Source-Modell macht Sprachinteraktion für jeden zugänglich. Genug Stoff, um den Sonntag produktiv zu starten.#11Freitag · 5. Juni 2026Ob Datenschutz, Kostenrechnung oder der stille Agent, der künftig deinen Arbeitsalltag mitverfolgt: Diese Ausgabe zeigt, wo KI echten Nutzen bringt und wo der Mensch noch den Unterschied macht. Dazu erfährst du, warum dein Web-Traffic längst mehrheitlich aus Bots besteht und was das für dein Unternehmen bedeutet. Lies rein, es lohnt sich.
Alle Ausgaben ansehen →
1:1

15 Min Gespräch, kostenlos.

Wir schauen, wo KI in deinem Betrieb sofort Stunden spart.

Termin sichern