KI, die liefert: dein Montag-Start
Wenn KI im Alltag wirklich funktionieren soll, kommt es auf ein paar entscheidende Stellschrauben an. Du erfährst heute, wie ein cleveres Routing deine Modellkosten halbiert, mit welchem System-Prompt ChatGPT deutlich zuverlässiger antwortet und wie du Skepsis im Team in echte Neugier verwandelst. Dazu zeigen wir dir, wie du mit Ollama vom ersten Experiment zur produktiven Anwendung kommst.
KI-Kosten halbiert: Modell-Routing spart
Nicht immer braucht man das teuerste Modell. Coinbase-Chef Brian Armstrong hat das konsequent umgesetzt und zeigt, was dabei herauskommt.
Das Krypto-Unternehmen setzt jetzt standardmäßig auf chinesische Modelle wie GLM 5.2 und Kimi 2.7, statt reflexartig auf die bekannten US-Anbieter zu setzen. Ein automatisches Routing-System entscheidet dabei je nach Aufgabe und Preis, welches Modell eine Anfrage bearbeitet. Parallel dazu hat Coinbase das Caching verbessert: Statt jede Anfrage neu zu berechnen, werden häufige Antworten zwischengespeichert. Die Trefferquote stieg dadurch von 5 auf 60 Prozent. Ergebnis: Die KI-Ausgaben haben sich halbiert, obwohl die Nutzung weiter gestiegen ist.
Für dich ist das kein Krypto-Thema, sondern ein Kostensteuerungs-Thema. Die Logik ist simpel: Einen Text zusammenfassen oder eine Standard-Antwort formulieren kann ein günstigeres Modell genauso gut. Nur für komplexe Analysen lohnt sich das Premium-Modell. Wenn du KI-Tools im Einsatz hast, lohnt sich eine Bestandsaufnahme: Welche Aufgaben laufen über welches Modell, was kostet das monatlich, und werden wiederkehrende Anfragen gecacht oder jedes Mal neu berechnet?
Die Botschaft aus San Francisco ist klar: KI-Kosten sind kein Fixum, sondern steuerbar.
- the-decoder.de · 28. Juni 2026
Mit diesem System-Prompt halluziniert ChatGPT deutlich seltener
ChatGPT erfindet gelegentlich Quellen, Zahlen oder Fakten, die schlicht nicht existieren. Das ist kein Fehler, den du falsch machst. Es liegt daran, wie Sprachmodelle grundsätzlich funktionieren. Die gute Nachricht: Du kannst das Verhalten mit einem System-Prompt deutlich einschränken.
Ein System-Prompt ist eine Anweisung, die du einmalig hinterlegst und die bei jedem Gespräch im Hintergrund aktiv ist. Du sagst dem Modell damit, wie es sich verhalten soll, bevor du überhaupt eine Frage stellst. Konkret funktioniert das zum Beispiel so: Du weist ChatGPT an, bei Unsicherheit lieber nichts zu sagen als etwas zu erfinden, keine Quellen zu nennen, die es nicht kennt, und Aussagen klar als Einschätzung zu markieren, wenn es keine gesicherte Grundlage gibt.
t3n hat dazu eine fertige Vorlage veröffentlicht, die du direkt kopieren und in deinen ChatGPT-Einstellungen unter "Angepasste Anweisungen" einfügen kannst. Das kostet fünf Minuten und gilt dann für alle zukünftigen Chats.
Wichtig bleibt: Kein Prompt macht KI-Ausgaben zu hundert Prozent zuverlässig. Bei Zahlen, Rechtsfragen oder externen Quellen prüfst du kritische Aussagen weiterhin nach. Aber das Risiko, dass ein Mitarbeiter eine erfundene Studie ungeprüft weitergibt, sinkt mit dem richtigen Setup deutlich.
- t3n.de · 28. Juni 2026
KI-Einführung im Team: So gehst du mit Skepsis konstruktiv um
Die Technik ist selten das Problem. KI-Einführungen scheitern häufig nicht an fehlenden Tools, sondern daran, dass Menschen nicht mitgenommen werden. Arbeitspsychologin und Prompt Engineerin Susanne Renate Schneider beobachtet das regelmäßig in Unternehmen.
Ihr Kern-Befund: Skepsis ist fast immer eine Reaktion auf Unsicherheit. Wer nicht weiß, ob sein Job sicherer oder unsicherer wird, ob er die neue Technik beherrschen wird, ob er damit gut aussieht oder schlecht, der bremst. Das ist menschlich und kein Zeichen von schlechtem Willen.
Was hilft: Früh und ehrlich kommunizieren, was sich ändert und was nicht. Mitarbeitende konkret einbinden, statt fertige Lösungen zu präsentieren. Kleine Erfolgserlebnisse schaffen, bevor große Prozesse umgestellt werden. Und: Wer offen sagt, dass er noch nicht alle Antworten hat, gewinnt mehr Vertrauen als wer so tut, als wäre alles schon durchgeplant.
Für dich als Geschäftsführer bedeutet das: Plane bei jeder KI-Einführung genauso viel Zeit für Kommunikation und Begleitung ein wie für die technische Umsetzung. Das ist kein weicher Faktor, das ist der entscheidende.
- t3n.de · 28. Juni 2026
Mit Ollama vom ersten Test zur echten Anwendung
Ollama ist inzwischen der einfachste Weg, ein Sprachmodell lokal auf dem eigenen Rechner zu betreiben. Kein Cloud-Abo, keine Daten, die das Haus verlassen. Das Demo läuft in Minuten.
Das Problem: Die meisten bleiben beim Demo stecken. Ein Modell, das im Terminal auf Fragen antwortet, ist kein Produkt. Es ist ein Experiment. Der Schritt zur echten Anwendung, also etwas, das Mitarbeiter täglich nutzen oder das automatisch Aufgaben übernimmt, erfordert Code drumherum: eine Schnittstelle, Eingabe-Logik, Anbindung an deine Daten.
Für dich als Geschäftsführer heißt das: Wenn jemand in deinem Team sagt "Wir haben Ollama am Laufen", ist das ein guter Anfang, aber noch kein Ergebnis. Die entscheidende Frage ist, was die Anwendung konkret tut und wer sie nutzt.
Der Golem-Artikel zeigt anhand von Python-Code, wie aus dem Demo eine strukturierte App wird. Technisch interessierten Mitarbeitern lohnt sich der Blick. Für alle anderen gilt: Lokale Modelle sind eine ernsthafte Option für datensensible Prozesse, aber plant von Anfang an, was die Anwendung leisten soll, nicht nur, dass sie läuft.
- golem.de · 28. Juni 2026
Ein Klick reicht. Du hilfst, das Briefing schärfer zu machen.
Archiv
6 Ausgaben insgesamt
15 Min Gespräch, kostenlos.
Wir schauen, wo KI in deinem Betrieb sofort Stunden spart.
