Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Flash Lite Preview

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-20

Metrik Seed-2.0-Mini Seed-2.0-Mini medium Veröffentlichung: 2026-02-14 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Veröffentlichung: 2026-03-03
Punktzahl 7.5 8.1
Rang #39 #22
Konsistenz 9.2 10.0
Korrekte Tests
Erfolgsquote pro Versuch 66.7% 72.2%
Instabile Tests 2 0
Gesamtläufe 54 54
Kosten pro Ergebnis 0.333 0.168
Gesamtkosten $0.037 $0.022
Eingabepreis $0.100 / 1M $0.250 / 1M
Ausgabepreis $0.400 / 1M $1.500 / 1M
Ausgabe-Token 2,419 2,247
Denk-Token 79,238 8,058
Antwortzeit (Durchschnitt) 69.70s 3.22s
Antwortzeit (Maximum) 262.83s 11.91s
Antwortzeit (Gesamt) 1045.47s 58.00s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.20s 630 372
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993

Schnellvergleich

Vergleichspaar wechseln