Vergleichen Diagramme

Sprache:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs ByteDance Seed: Seed-2.0-Mini

Modellname:

Benchmarks aus AI BENCHY-Test-Suites generiert am : 2026-02-27 15:16

Zusammenfassung

Metrik	Anthropic: Claude Sonnet 4.6 none Veröffentlichung: Unbekanntes Veröffentlichungsdatum	ByteDance Seed: Seed-2.0-Mini medium Veröffentlichung: 2026-02-26
Rang	#14	#18
Punktzahl	6.36	6.13
Konsistenz	9.50	8.91
Kosten pro Ergebnis	1.325	0.177
Gesamtkosten	$0.106	$0.013
Korrekte Tests
Falsche Tests	6	7
Erfolgsquote pro Versuch	59.5%	59.5%
Instabile Tests	1	2
Ausgabe-Token	2,637	1,353
Denk-Token	0	24,362

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	4.00	10.00	33.3%	0		1,199	0
ByteDance Seed: Seed-2.0-Mini	7.00	9.99	66.7%	0		354	9,352

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		252	0
ByteDance Seed: Seed-2.0-Mini	9.88	10.00	100.0%	0		246	2,743

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	7.00	10.00	66.7%	0		54	0
ByteDance Seed: Seed-2.0-Mini	1.00	10.00	0.0%	0		0	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	5.50	10.00	50.0%	0		90	0
ByteDance Seed: Seed-2.0-Mini	8.00	9.99	50.0%	0		69	2,050

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	5.00	7.68	44.4%	1		595	0
ByteDance Seed: Seed-2.0-Mini	5.33	4.91	77.8%	2		462	4,982

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		447	0
ByteDance Seed: Seed-2.0-Mini	10.00	10.00	100.0%	0		222	5,235

Vergleichspaar wechseln

Anthropic: Claude Sonnet 4.6 vergleichen mit...

ByteDance Seed: Seed-2.0-Mini vergleichen mit...