Zum Hauptinhalt springen

Tokens/Sekunde Visualizer — Kostenlos & Sicher | werkzeuge

Erleben Sie, wie schnell ein LLM bei einer bestimmten Token-Rate antwortet. Streamt Text live in Ihrem Browser — nichts wird übertragen.

Sehen und fühlen Sie, wie schnell ein Sprachmodell bei einer bestimmten Token-Rate antwortet. Der Text wird live in Ihrem Browser gestreamt.

100 % im Browser — nichts verlässt Ihr Gerät.
Beispieltext

Lange deutsche Komposita werden in viele Subwort-Tokens zerlegt — deshalb kosten sie mehr als kurze englische Wörter.

Voreinstellungen:

Während der Wiedergabe verstellbar. Typische Werte: lokal/CPU ~10, Cloud-Modelle ~50–120.

Tokens gesamt
Angezeigt
Verstrichen (s)
Effektiv (Tok./s)
Dauer geschätzt (s)
Live-Stream
Schätzung Die Token-Zerlegung ist eine Heuristik und nur eine Schätzung — echte Tokenizer (OpenAI BPE, Claude, Gemini) zählen anders. Für exakte OpenAI-Token-Zahlen nutzen Sie den Token-Counter. Zum Token-Counter

Team-Kollaboration

Arbeiten Sie im Team mit KI zusammen — gemeinsame Konversationen, geteiltes Wissen, einheitliche Ergebnisse.