#18
Google
Veröffentlichung: 2026-03-03
Getestet am: 2026-04-11 01:44
google/gemini-3.1-flash-lite-preview::medium
Identitätshinweis
Gemini 3.1 Flash Lite Preview war die Vorschauversion von Google: Gemini 3.1 Flash Lite.
8.2
Konsistenz
10.0
k. A.
Gesamte Ausgabe-Token
31,198
Eingabepreis
$0.250 / 1M
Ausgabepreis
$1.500 / 1M
Instabile Tests
0
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-22 00:28 Suite geändert | 7.7 | 10.0 | $0.063 | Vergleichen | |
| 2026-04-11 01:44 Erster erfasster Lauf | 8.2 | k. A. | $0.055 | Aktueller Lauf |
Laufvergleich
| Lauf | Punktzahl | Konsistenz | Zuverlässigkeit | Korrekte Tests | Instabile Tests | Gesamte Ausgabe-Token | Gesamtkosten | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · Erster erfasster Lauf | 8.2 | 10.0 | k. A. | 13/18 | 0 | 31,198 | $0.055 | 3.74s |
| 2026-05-22 00:28 · Suite geändert | 7.7 | 10.0 | 10.0 | 13/20 | 0 | 35,861 | $0.063 | 3.68s |
| Differenz | +0.5 | 0.0 | 0 | 0 | -4663 | -$0.009 | +59ms |
Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Gemini 3.1 Flash Lite PreviewmediumvsGLM 5 TurbomediumGemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewmediumvsGPT-5.4mediumGemini 3.1 Flash Lite PreviewmediumvsGemma 4 26B A4BmediumKostenlos verfügbarGemini 3.1 Flash Lite PreviewmediumvsQwen3.7 MaxnoneGemini 3.1 Flash Lite PreviewmediumvsQwen3.6 35B A3BmediumGemini 3.1 Flash Lite PreviewmediumvsGemini 3 Flash PreviewmediumGemini 3.1 Flash Lite PreviewmediumvsGemini 3.5 FlashhighGemini 3.1 Flash Lite PreviewmediumvsRing-2.6-1TmediumGemini 3.1 Flash Lite PreviewmediumvsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 9.1 | 10.0 | |
| Programmierung | 10.0 | 10.0 | |
| Kombiniert | 10.0 | 10.0 | |
| Datenanalyse und -extraktion | 10.0 | 10.0 | |
| Domänenspezifisch | 3.0 | 10.0 | |
| Allgemeine Intelligenz | 10.0 | 10.0 | |
| Befolgung von Anweisungen | 10.0 | 10.0 | |
| Rätsellösen | 7.7 | 10.0 | |
| Werkzeugaufrufe | 10.0 | 10.0 |