Workstation für lokale KI & LLMs.
Du willst KI-Modelle auf deinem eigenen Rechner laufen lassen — ohne Cloud, ohne Abo, ohne dass deine Daten das Haus verlassen? Dann gelten andere Bauregeln als bei jedem normalen PC. Hier erfährst du, worauf es wirklich ankommt.
„Warum stürzt meine KI bei großen Modellen ab?"
Das typische Erlebnis: Ein kleines Modell läuft noch irgendwie, aber sobald du ein größeres lädst, bricht alles zusammen — Fehlermeldung, eingefrorenes System oder Antworten im Schneckentempo. Die Reflex-Diagnose lautet dann oft „der Prozessor ist zu schwach". Sie ist fast immer falsch.
Bei lokaler KI ist nicht die CPU der Engpass, sondern die Grafikkarte — genauer: ihr Videospeicher (VRAM). Er entscheidet nicht, wie schnell ein Modell läuft, sondern ob es überhaupt läuft.
VRAM ist der Türsteher: Er entscheidet, welche Modellgröße überhaupt reinkommt.
Ein KI-Modell muss beim Ausführen komplett im Videospeicher der Grafikkarte liegen — wie ein Werkstück, das auf die Werkbank passen muss, bevor du daran arbeiten kannst. Passt es nicht, lagert die Software Teile in den normalen Arbeitsspeicher aus. Der ist aber über den PCIe-Bus um ein Vielfaches langsamer angebunden — aus flüssigen Antworten werden Sekunden pro Wort. Deshalb wird eine KI-Workstation von der Grafikkarte aus geplant, nicht vom Prozessor.
Merksatz: Erst muss das Modell passen — dann reden wir über Geschwindigkeit.Die VRAM-Leiter: welche Modellgröße welchen Speicher braucht
Als Orientierung für komprimierte (quantisierte) Modelle — die Stufen, in denen geplant wird:
Was das für den Bau bedeutet
KI-Last ist anders als Gaming-Last: Sie hält die Grafikkarte nicht sekundenweise, sondern stunden- oder tagelang unter Volllast. Ein Build, der dafür gemacht ist, unterscheidet sich an vier Stellen von einem Rechner aus dem Elektromarkt:
Lokal statt Cloud: wann sich das lohnt
Eine lokale KI-Workstation lohnt sich, wenn mindestens einer dieser Punkte auf dich zutrifft: Deine Daten dürfen das Haus nicht verlassen (Kundendaten, Verträge, Quellcode), du nutzt KI täglich und die Abo-Kosten summieren sich, oder du willst Modelle anpassen und experimentieren, ohne pro Anfrage zu zahlen. Für gelegentliches Ausprobieren bleibt die Cloud günstiger — und genau das sage ich dir auch, wenn es bei dir so ist.
Aus der Werkstatt: Die häufigste Fehlinvestition, die ich sehe: ein teurer Prozessor neben einer Grafikkarte mit zu wenig VRAM. Das Geld steckt an der falschen Stelle — der PC ist schnell in allem, außer in dem, wofür er gekauft wurde.
Verwandte Klassen: Wer neben KI auch rendert oder schneidet, sollte sich die Videoschnitt- & 3D-Workstation ansehen. Läuft der Rechner rund um die Uhr — etwa als KI-Server — gelten zusätzlich die Regeln vom Büro- & Server-PC.
Fragen, die ich oft höre.
Wie viel VRAM brauche ich, um KI-Modelle lokal laufen zu lassen?
Reicht nicht einfach mehr normaler RAM statt teurem VRAM?
Warum ist die CPU bei einer KI-Workstation zweitrangig?
Kann ich eine Gaming-Grafikkarte für KI nutzen?
Was kostet eine KI-Workstation bei TeutoTech?
Sag mir, welche Modelle du fahren willst.
Ich sag dir ehrlich, was dafür nötig ist — und was nicht.