AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs MiniMax: MiniMax M2.7

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-02

Metrik	Seed-2.0-Lite Seed-2.0-Lite none Veröffentlichung: 2026-02-14	MiniMax M2.7 MiniMax M2.7 medium Veröffentlichung: 2026-03-18

Metrik	Seed-2.0-Lite Seed-2.0-Lite none Veröffentlichung: 2026-02-14	MiniMax M2.7 MiniMax M2.7 medium Veröffentlichung: 2026-03-18
Punktzahl	6.0	5.0
Rang	#57	#76
Konsistenz	7.6	5.3
Korrekte Tests
Erfolgsquote pro Versuch	52.9%	49.0%
Instabile Tests	5	10
Gesamtläufe	51	51
Kosten pro Ergebnis	0.215	2.398
Gesamtkosten	$0.016	$0.072
Eingabepreis	$0.250 / 1M	$0.300 / 1M
Ausgabepreis	$2.000 / 1M	$1.200 / 1M
Ausgabe-Token	2,749	4,517
Denk-Token	0	47,612
Antwortzeit (Durchschnitt)	2.40s	27.32s
Antwortzeit (Maximum)	6.70s	117.04s
Antwortzeit (Gesamt)	40.85s	437.10s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	3,010	17,716

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	369	4,480

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	187	5,882

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	8	2,796

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	92	5,204

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
MiniMax M2.7	3.7	1.8	50.0%	2		12.64s	213	2,457

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
MiniMax M2.7	3.8	4.5	33.3%	2		25.62s	334	8,076

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	304	1,001

Schnellvergleich

Vergleichspaar wechseln

Seed-2.0-Litenonevsgpt-oss-120bmediumKostenlos verfügbar MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsGPT-4o-mininone Seed-2.0-LitenonevsMiniMax M2.5mediumKostenlos verfügbar Mercury 2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsNemotron 3 SupernoneKostenlos verfügbar MiniMax M2.7mediumvsQwen3.5-9Bnone Seed-2.0-LitenonevsGrok 4.20 Multi Agent Betamedium MiniMax M2.7mediumvsMistral Small 4none Seed-2.0-LitenonevsGPT-5 Nanomedium Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.7medium