Tokens/Sekunde Visualizer — Kostenlos & Sicher | werkzeuge

Erleben Sie, wie schnell ein LLM bei einer bestimmten Token-Rate antwortet. Streamt Text live in Ihrem Browser — nichts wird übertragen.

Sehen und fühlen Sie, wie schnell ein Sprachmodell bei einer bestimmten Token-Rate antwortet. Der Text wird live in Ihrem Browser gestreamt.

100 % im Browser — nichts verlässt Ihr Gerät.

Beispieltext

Eigenen Text einfügen

Lange deutsche Komposita werden in viele Subwort-Tokens zerlegt — deshalb kosten sie mehr als kurze englische Wörter.

Geschwindigkeit (Tokens/Sekunde)

Voreinstellungen:

Während der Wiedergabe verstellbar. Typische Werte: lokal/CPU ~10, Cloud-Modelle ~50–120.

Tokens gesamt

Angezeigt

Verstrichen (s)

Effektiv (Tok./s)

Dauer geschätzt (s)

Live-Stream

Schätzung Die Token-Zerlegung ist eine Heuristik und nur eine Schätzung — echte Tokenizer (OpenAI BPE, Claude, Gemini) zählen anders. Für exakte OpenAI-Token-Zahlen nutzen Sie den Token-Counter. Zum Token-Counter

Team-Kollaboration

Arbeiten Sie im Team mit KI zusammen — gemeinsame Konversationen, geteiltes Wissen, einheitliche Ergebnisse.

Team-Features entdecken →