Tokens/Sekunde Visualizer — Kostenlos & Sicher | werkzeuge
Erleben Sie, wie schnell ein LLM bei einer bestimmten Token-Rate antwortet. Streamt Text live in Ihrem Browser — nichts wird übertragen.
Sehen und fühlen Sie, wie schnell ein Sprachmodell bei einer bestimmten Token-Rate antwortet. Der Text wird live in Ihrem Browser gestreamt.
100 % im Browser — nichts verlässt Ihr Gerät.Lange deutsche Komposita werden in viele Subwort-Tokens zerlegt — deshalb kosten sie mehr als kurze englische Wörter.
Während der Wiedergabe verstellbar. Typische Werte: lokal/CPU ~10, Cloud-Modelle ~50–120.
Der Transformer, 2017 von Google vorgestellt, ersetzte rekurrente Netze durch Aufmerksamkeitsmechanismen und ist die Grundlage aller modernen Sprachmodelle.
Quelle: Vaswani, A. et al., Attention Is All You Need, NeurIPS, 2017
Team-Kollaboration
Arbeiten Sie im Team mit KI zusammen — gemeinsame Konversationen, geteiltes Wissen, einheitliche Ergebnisse.