AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Hunter Alpha

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-03-12

Metrik	Seed-2.0-Lite Seed-2.0-Lite none Veröffentlichung: 2026-02-14	Hunter Alpha Hunter Alpha medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum

Metrik	Seed-2.0-Lite Seed-2.0-Lite none Veröffentlichung: 2026-02-14	Hunter Alpha Hunter Alpha medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum
Rang	#45	#35
Ø-Score	4.9	5.9
Konsistenz	7.4	7.6
Kosten pro Ergebnis	0.214	0.000
Gesamtkosten	$0.015	$0.000
Korrekte Tests
Erfolgsquote pro Versuch	56.3%	68.8%
Instabile Tests	5	5
Gesamtläufe	48	48
Ausgabe-Token	2,743	4,686
Denk-Token	0	17,821
Antwortzeit (Durchschnitt)	2.49s	10.71s
Antwortzeit (Maximum)	6.70s	30.53s
Antwortzeit (Gesamt)	39.91s	171.41s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Ø-Score vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Ø-Score vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	4.6	22.2%	2		2.93s	703	0
Hunter Alpha	7.0	7.2	88.9%	1		4.93s	441	1,003

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	0.0%	0		6.59s	498	0
Hunter Alpha	10.0	1.6	66.7%	1		30.53s	792	3,456

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	9.9	10.0	100.0%	0		1.82s	246	0
Hunter Alpha	9.9	10.0	100.0%	0		23.16s	1,488	8,017

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	7.2	22.2%	1		1.33s	17	0
Hunter Alpha	10.0	10.0	0.0%	0		10.52s	892	2,406

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Hunter Alpha	8.0	3.7	66.7%	1		6.44s	116	260

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Hunter Alpha	9.5	10.0	100.0%	0		4.18s	208	465

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	4.0	4.4	55.6%	2		2.46s	620	0
Hunter Alpha	4.3	4.7	66.7%	2		5.36s	441	1,310

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904

Schnellvergleich

Vergleichspaar wechseln

Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Hunter AlphamediumvsGLM 5none Seed-2.0-Litenonevsgpt-oss-120bmediumKostenlos verfügbar Seed-2.0-LitenonevsMiniMax M2.5medium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-LitenonevsMercury 2medium DeepSeek V3.2nonevsHunter Alphamedium Seed-2.0-LitenonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsGPT-5 Nanomedium Hunter AlphamediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsHunter Alphamedium Claude Sonnet 4.6nonevsHunter Alphamedium