bbastify
← Alle Ausgaben
Archiv · Ausgabe #382. Juli 2026 · 3 Min Lesezeit · 31 Quellen
Bastify Daily · Donnerstag, 2. Juli 2026 · #38

KI-Modelle werden schnell besser und günstiger

Anthropic und OpenAI liefern diese Woche gleich doppelt gute Nachrichten: Neue Modellgenerationen bringen spürbar mehr Leistung bei mehrstufigen Aufgaben, und gleichzeitig sinken die Betriebskosten für KI-Anwendungen deutlich. Dazu zeigen wir dir, wie du mit Open WebUI einen eigenen KI-Server für dein Team aufsetzt und damit Kontrolle und Flexibilität gewinnst.

Bastian Schlarp, founder of Bastify
Basti
Veröffentlicht am 02. Juli 2026, 07:24 Uhr
01Top Story· Claude

Claude Sonnet 4.5: Besser bei mehrstufigen Aufgaben und Automatisierung

TL;DRAnthropic veröffentlicht Claude Sonnet 4.5 mit deutlich besseren Fähigkeiten bei mehrstufigen Aufgaben und Tool-Nutzung, was ihn für Automatisierungsprojekte im Mittelstand interessanter macht.

Anthropic hat Claude Sonnet 4.5 veröffentlicht. Das Modell ist sofort über die API und in Claude.ai nutzbar.

Für dich als Unternehmer ist das Wichtigste: Sonnet 4.5 ist spürbar besser darin, selbstständig mehrere Schritte hintereinander abzuarbeiten und dabei externe Tools und Datenquellen einzubinden. Das ist genau das, was du brauchst, wenn du Prozesse automatisieren willst, die über einfaches Texte schreiben hinausgehen.

Konkret heißt das: Ein KI-Agent auf Basis von Sonnet 4.5 kann zum Beispiel eine Kundenanfrage entgegennehmen, dein CRM abfragen, ein Angebot berechnen und eine Antwort-E-Mail vorbereiten, ohne dass ein Mensch jeden Schritt anstoßen muss. Solche Workflows waren mit früheren Modellen fehleranfälliger.

Wenn du bereits KI-Automatisierungen im Einsatz hast, lohnt es sich zu prüfen, ob ein Wechsel auf Sonnet 4.5 die Zuverlässigkeit deiner Workflows verbessert. Wer noch am Anfang steht: Dieses Modell senkt die Hürde für komplexere Automatisierungen spürbar.

Takeaway
Prüf heute, ob deine bestehenden KI-Workflows von Sonnet 4.5 profitieren, und teste das Modell konkret an deinem aufwändigsten Anwendungsfall.
Weitere Infos
02Update· Claude

Claude Sonnet 5: Gleicher Preis, doppelte Kosten, so steuerst du gegen

TL;DRSonnet 5 verbraucht 40 Prozent mehr Tokens als der Vorgänger, aber wer Einsatz und Ausgabelänge gezielt steuert, hält die Kosten im Griff.

Wer Sonnet 5 bewusst einsetzt und den Token-Verbrauch im Blick behält, kann die Mehrkosten weitgehend neutralisieren. Der Listenpreis ist unverändert, aber das Modell schreibt mehr, denkt länger und produziert ausführlichere Antworten. Wer es einfach gegen den Vorgänger austauscht, zahlt in der Praxis fast doppelt so viel.

Das ist kein Zufall. Anthropic macht das beim zweiten Modell in Folge so, andere Anbieter ziehen ähnliche Muster durch. Der Listenpreis wird zum Marketinginstrument, die echten Kosten stecken im Verbrauchsverhalten des Modells.

Was du konkret tust: Setz Sonnet 5 zunächst nur auf einem Prozess ein, miss den Token-Verbrauch nach einer Woche und vergleich ihn mit dem Vorgänger. Viele Anwendungsfälle brauchen keine langen Antworten. Mit kürzeren Prompts, klaren Ausgabeformaten und Längenbegrenzungen lässt sich der Mehrverbrauch oft deutlich eindämmen. Für einfache, repetitive Aufgaben bleibt ein günstigeres Modell oft die bessere Wahl.

Die gute Nachricht: Sonnet 5 ist bei agentischen Aufgaben stark, teils besser als das teurere Opus 4.8. Das Modell hat seinen Platz, aber der will bewusst gewählt sein.

Takeaway. Miss den Token-Verbrauch deines aktuellen Modells, bevor du auf Sonnet 5 umsteigst, und setz es gezielt nur dort ein, wo die höhere Leistung den Mehrpreis rechtfertigt.
Weitere Infos
03Top Story· OpenAI

OpenAI findet Wege, Modellkosten um 50% zu senken

TL;DROpenAI-Ingenieure haben Optimierungen gefunden, die Betriebskosten um über 50% senken könnten, ob das zu niedrigeren Preisen führt, ist offen.

OpenAIs Ingenieure haben Optimierungen entwickelt, die den Betrieb bestehender Modelle um mehr als 50 Prozent günstiger machen könnten. Das berichtet ein Medienunternehmen unter Berufung auf interne Quellen. Ob und wann diese Einsparungen bei den Kunden ankommen, hat OpenAI nicht kommuniziert.

Für deinen Betrieb ändert sich heute noch nichts. Aber der Befund ist trotzdem relevant: Wenn du KI-Nutzung bisher wegen der Kosten zurückgestellt hast, lohnt es sich, die Kalkulation in ein paar Monaten neu aufzumachen. Die Branche wird effizienter, das ist kein Zufall, sondern ein anhaltender Trend.

Das Prinzip dahinter ist einfach: OpenAI macht dasselbe Modell effizienter, ohne es neu zu trainieren. Ähnliche Schritte haben in den letzten zwei Jahren dazu geführt, dass KI-Nutzung heute schon deutlich günstiger ist als 2023. Wohin das führt, bleibt offen. Aber die Richtung ist klar.

Takeaway
Setz dir einen konkreten Termin in drei Monaten, um Preise und Alternativen neu zu bewerten – und notier dir heute, was du dann vergleichen willst.
Weitere Infos
04Open Source· Open WebUI

Open WebUI: Eigener KI-Server für dein Team

TL;DRMit Open WebUI und einer Linux-Maschine mit GPU kannst du Sprachmodelle selbst hosten und bist unabhängig von Cloud-Anbietern.

Wer sensible Daten hat, will sie nicht durch fremde Server schicken. Das ist kein Paranoia-Thema, sondern schlicht gute Betriebsführung. Die gute Nachricht: Du brauchst dafür kein Rechenzentrum.

Open WebUI ist eine quelloffene Oberfläche, die du auf einer eigenen Linux-Maschine mit Grafikkarte installierst. Dahinter läuft ein Sprachmodell deiner Wahl, das du und dein Team dann über den Browser nutzen, genau wie ChatGPT, nur dass die Daten das Haus nicht verlassen.

Das lohnt sich vor allem für Betriebe, die regelmäßig mit vertraulichen Dokumenten arbeiten: Angebote, Verträge, Kundendaten, interne Berichte. Statt jeden Text durch einen externen Dienst zu schicken, bleibt alles im eigenen Netz.

Für den Einstieg reicht eine gebrauchte Workstation mit einer Nvidia-Karte ab der RTX-3000-Serie und mindestens 16 GB RAM. Kleinere Modelle wie Mistral 7B oder Llama 3 8B laufen darauf problemlos. Wer etwas mehr Leistung einplant, ist mit 24 GB VRAM flexibler und kann auch größere Modelle testen. Die Installation über Docker dauert bei Linux-Grundkenntnissen etwa eine bis zwei Stunden. Die laufenden Kosten beschränken sich danach auf Strom.

Der Haken: Du bist selbst für Updates und Sicherheit verantwortlich. Das ist kein Selbstläufer, aber auch kein Hexenwerk. Wer das einmal aufgesetzt hat, hat eine Infrastruktur, die er kontrolliert.

Takeaway
Prüf, ob ein Mitarbeiter oder IT-Dienstleister Open WebUI auf einer vorhandenen Maschine aufsetzen kann, bevor du das nächste Cloud-Abo verlängerst.
Weitere Infos
Wie war's heute?

Ein Klick reicht. Du hilfst, das Briefing schärfer zu machen.

Daily Morning Briefing
Bastify Daily

Dein Daily Morning Briefing. Direkt ins Postfach.

Jeden Morgen das Wichtigste aus dem KI-Maschinenraum, in 5 Minuten gelesen. Von Basti persönlich zusammengestellt.

Mit Klick auf „Abonnieren" stimmst du dem Versand zu. Datenschutz
Kostenlos DSGVO-konform
So entsteht das Briefing: KI-gestützt aus 31+ Quellen recherchiert, von Basti geprüft und freigegeben.

Archiv

6 Ausgaben insgesamt

#37Mittwoch · 1. Juli 2026Anthropics neues Claude Sonnet 5 übertrifft das eigentlich stärkere Opus-Modell, und gleichzeitig halbiert OpenAI seine Betriebskosten, was KI für den Mittelstand noch zugänglicher macht. Dazu zeigt eine neue Studie, welche Berufsbilder in Europa sich gerade am stärksten wandeln, und warum ein Ansprechpartner vor Ort über Erfolg oder Misserfolg deines KI-Projekts entscheidet. Alles, was du heute wissen solltest, findest du unten.#36Dienstag · 30. Juni 2026Amazon macht leistungsstarke KI-Modelle deutlich zugänglicher: Durch die Destillation von Anthropic-Modellen sinken die Token-Preise spürbar, was für deinen Alltag mit KI-Tools direkt relevant wird. Außerdem zeigen wir dir, wie du eine aktuelle Linux-Sicherheitslücke schnell und unkompliziert patchst. Lies rein, es lohnt sich.#35Montag · 29. Juni 2026Wenn KI im Alltag wirklich funktionieren soll, kommt es auf ein paar entscheidende Stellschrauben an. Du erfährst heute, wie ein cleveres Routing deine Modellkosten halbiert, mit welchem System-Prompt ChatGPT deutlich zuverlässiger antwortet und wie du Skepsis im Team in echte Neugier verwandelst. Dazu zeigen wir dir, wie du mit Ollama vom ersten Experiment zur produktiven Anwendung kommst.#34Sonntag · 28. Juni 2026Eine neue Anthropic-Umfrage zeigt: Wer KI intensiv einsetzt, sieht darin vor allem eine Karrierechance, keinen Jobkiller. Dazu erfährst du heute, wie du Shadow-KI im Betrieb rechtssicher in den Griff bekommst, und was das neue GPT-5.6 in der Praxis bringen soll. Lies rein, es lohnt sich.#33Samstag · 27. Juni 2026OpenAI hat GPT-5.6 Sol veröffentlicht und zeigt gleichzeitig, wie die eigenen Teams KI tatsächlich im Arbeitsalltag einsetzen. Du erfährst außerdem, wann ein Modellwechsel sinnvoll ist und was autonome KI-Agenten konkret für deinen Betrieb leisten können. Gute Lektüre für ein produktives Wochenende.
Alle Ausgaben ansehen →
1:1

15 Min Gespräch, kostenlos.

Wir schauen, wo KI in deinem Betrieb sofort Stunden spart.

Termin sichern