Zum Inhalt springen
← Zurück zur Übersicht

Warum das teuerste KI-Modell selten die klügste Wahl ist

Zwei KI-Modelle in Arbeitsteilung: ein günstigeres für Routinetasks, ein starkes für anspruchsvolle Fälle – visualisiert als zwei Datenströme

Harvey ist ein KI-Unternehmen, das Anwältinnen und Anwälte mit KI-Assistenz ausstattet. Die haben kürzlich ein Experiment veröffentlicht, das mich beschäftigt.

Ausgangssituation: Harvey nutzte für alle Aufgaben das teuerste verfügbare Frontier-Modell. Hohe Qualität, hohe Kosten. Dann stellten sie um: günstigeres Open-Source-Modell für die Masse der Routinetasks, teures Premium-Modell nur für wirklich anspruchsvolle, hochriskante Fälle.

Ergebnis: Kosten tief. Qualität höher als vorher.

Beides. Gleichzeitig.

Warum «immer das stärkste Modell» keine Strategie ist

Patrick O’Shaughnessy, Investor mit Fokus auf KI-Unternehmen, hat das so auf den Punkt gebracht: «Das teuerste Modell für jede Aufgabe einzusetzen, ist keine Qualitätsstrategie. Das ist Faulheit.»

Er hat recht.

Wer immer das stärkste Modell wählt, optimiert nicht. Er vermeidet das Nachdenken darüber, was eine Aufgabe wirklich braucht.

Nicht jede KI-Aufgabe braucht dieselbe Feuerkraft. Eine E-Mail-Zusammenfassung ist eine andere Anforderung als ein Vertrag, bei dem ein Fehler echten Schaden anrichtet.

Was stattdessen passiert: Teams zahlen 49 Cents pro Aufgabe für etwas, das 6 Cents gekostet hätte und gleich gut ausgefallen wäre. Das ist kein Sonderfall. Das ist die Regel.

Ein Ingenieur hat diese Woche dokumentiert: dasselbe Coding-Resultat mit Modell A für 1 Dollar, mit dem führenden Frontier-Modell für 12 Dollar. Das Frontier-Modell lieferte 5% bessere Ergebnisse. Bei 12-fachem Preis. Ob diese 5% zwölf Dollar statt einem wert sind, ist eine unternehmerische Entscheidung, keine technische.

Was hinter diesem Muster steckt

Der Befund dieser Woche aus dem AI Daily Brief: Mehrere unabhängige Experimente kommen zum gleichen Schluss. Intelligente Aufgabenverteilung zwischen Modellen schlägt das stärkste Einzelmodell, bei Kosten und oft auch bei Qualität.

OpenRouter hat einen Ansatz entwickelt, bei dem Anfragen automatisch auf ein Panel von Modellen verteilt werden. Jedes Modell übernimmt, was es am besten kann. Ein Synthesizer-Modell fasst die Antworten zusammen. Ergebnis: bessere Qualität als ein Einzelmodell, tiefere Kosten.

Harvey geht einen ähnlichen Weg: ein günstiges Modell erledigt 80% des Volumens, das teure Modell übernimmt nur dort, wo es wirklich nötig ist. Das Kosten-Qualitäts-Verhältnis verbessert sich auf beiden Seiten gleichzeitig.

Das Prinzip hat einen Namen: Routing schlägt Brute Force.

Was das für dein Unternehmen bedeutet

Wenn dein Team ChatGPT, Copilot oder ein vergleichbares KI-Tool täglich nutzt, stellt sich eine einfache Frage: Für welche Aufgaben setzt ihr eigentlich das Premium-Abo ein?

Die meisten Unternehmen, die ich in Workshops treffe, haben keine Antwort darauf. Das teuerste Modell läuft standardmässig, für alles, ohne je analysiert zu haben, was tatsächlich nötig ist. Oder KI wird noch gar nicht systematisch genutzt, was eine andere, aber ähnliche Kostenfrage aufwirft. Wer jetzt noch nicht systematisch eingestiegen ist, findet im KI-Kickstart einen geordneten Einstieg.

Für alle, die bereits KI im Einsatz haben, sind drei Schritte sofort möglich:

Aufgaben inventarisieren. Listet auf, wofür euer Team KI täglich nutzt. Mails, Zusammenfassungen, Analysen, Code, Recherche? Schon dieses Inventar zeigt, wo das Volumen liegt und welche Aufgaben wirklich komplex sind.

Risiko und Volumen trennen. Hohes Volumen, tiefes Risiko: günstigeres Modell oder Basis-Plan. Tiefes Volumen, hohes Risiko: Premium-Modell gezielt einsetzen. Diese Trennung ist keine IT-Entscheidung. Sie ist eine kaufmännische.

Preise konkret vergleichen. Qualitätsunterschiede zwischen den führenden Modellen sind oft kleiner als die Preisunterschiede. Ein strukturierter Vergleich zeigt in ein paar Stunden, wo ihr zu viel bezahlt.

Das ist kein IT-Projekt. Das ist eine Entscheidung, die an einem halben Tag getroffen sein kann, und die sich sofort in der Monatsrechnung niederschlägt.

Die eigentliche Frage

Das richtige Modell für die richtige Aufgabe zu wählen ist keine Technikfrage. Es ist eine Kosten-Nutzen-Frage, wie jede andere im Unternehmen.

Wer sie nicht stellt, zahlt zu viel. Und bekommt manchmal nicht einmal mehr dafür.

Die Evidenz dieser Woche ist eindeutig: Unternehmen, die nach Aufgabe und Risiko optimieren, verbessern Kosten und Qualität gleichzeitig. Nicht eines davon, sondern beides.

Willst du wissen, wie das konkret für dein Unternehmen aussehen könnte? In der KI-Beratung schauen wir uns gemeinsam an, welche KI-Tools ihr wirklich braucht und wo ihr zu viel bezahlt. Oder starte strukturiert mit dem KI-Kickstart.

Kostenloses Gespräch buchen, 30 Minuten, unverbindlich, ohne Verkaufsdruck.

Häufige Fragen

Was bedeutet KI-Modell-Routing und warum ist es relevant für KMU?

KI-Modell-Routing bedeutet, je nach Aufgabe das passende Modell einzusetzen: günstigere Modelle für Routinetasks, Premium-Modelle nur für riskante oder komplexe Aufgaben. Das spart erhebliche Kosten und kann die Qualität sogar verbessern, weil jede Aufgabe mit dem dafür geeigneten Werkzeug bearbeitet wird.

Lässt sich durch bessere KI-Modellwahl wirklich Geld sparen?

Ja, und der Unterschied ist erheblich. Ein konkreter Vergleich zeigt: 6 Cents versus 49 Cents pro Aufgabe bei vergleichbarem Output. Wer dasselbe Premium-Modell für Routinemails und für komplexe Analysen einsetzt, zahlt bis zu 8-mal mehr als nötig. Mit wenig Aufwand lässt sich ermitteln, wo in eurem Unternehmen welches Modell wirklich nötig ist.

Wie finde ich heraus, welche KI-Aufgaben welches Modell brauchen?

In drei Schritten: Erstens alle KI-Aufgaben inventarisieren. Zweitens nach Volumen und Risiko trennen (viel Volumen + tiefes Risiko = günstigeres Modell, tiefes Volumen + hohes Risiko = Premium). Drittens Preise konkret vergleichen. Dieses Inventar ist an einem halben Tag erstellbar und zeigt sofort, wo ihr zu viel bezahlt.

Wer unterstützt Schweizer KMU beim Aufbau einer kosteneffizienten KI-Strategie?

WhyAI berät Schweizer KMU dabei, welche KI-Tools wirklich gebraucht werden und wo Budgets sinnvoll eingesetzt sind. Im KI-Kickstart oder einer KI-Beratung analysieren wir gemeinsam den KI-Einsatz und zeigen auf, wo sich Kosten senken lassen, ohne Qualität einzubüssen.

Gilt das Routing-Prinzip auch für Standard-KI-Abos wie ChatGPT oder Copilot?

Ja. Auch ohne technische Routing-Infrastruktur lässt sich das Prinzip anwenden: Routinetasks mit dem günstigeren Basis-Plan erledigen, Premium-Funktionen nur gezielt einsetzen. Welche Aufgaben in eurer konkreten Situation welches Niveau brauchen, lässt sich in einer halbtägigen Analyse klären.

Bereit für KI, die wirkt?

30 Minuten, unverbindlich, ohne Verkaufsdruck.