AI BENCHY Compare

Mistral: Mistral Small 4 vs Laguna M.1

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-29

Metrik	Mistral Small 4 Mistral Small 4 none Veröffentlichung: 2026-03-16	Laguna M.1 Laguna M.1 none Veröffentlichung: 2026-04-28 Kostenlos verfügbar

Metrik	Mistral Small 4 Mistral Small 4 none Veröffentlichung: 2026-03-16	Laguna M.1 Laguna M.1 none Veröffentlichung: 2026-04-28 Kostenlos verfügbar
Punktzahl	5.2	5.1
Rang	#109	#117
Zuverlässigkeit	k. A.	9.9
Konsistenz	9.5	8.7
Korrekte Tests
Erfolgsquote pro Versuch	31.5%	33.3%
Instabile Tests	1	3
Gesamtläufe	54	54
Kosten pro Ergebnis	0.118	0.000
Gesamtkosten	$0.006	$0.000
Eingabepreis	$0.150 / 1M	$0.000 / 1M
Ausgabepreis	$0.600 / 1M	$0.000 / 1M
Ausgabe-Token	2,207	2,870
Denk-Token	0	0
Antwortzeit (Durchschnitt)	665ms	2.79s
Antwortzeit (Maximum)	1.72s	15.42s
Antwortzeit (Gesamt)	11.97s	50.24s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Laguna M.1	3.4	7.9	16.7%	1		1.23s	485	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0
Laguna M.1	7.5	3.8	66.7%	1		2.93s	543	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Laguna M.1	3.0	10.0	0.0%	0		4.32s	622	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Laguna M.1	10.0	10.0	100.0%	0		3.37s	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Laguna M.1	3.6	7.2	22.2%	1		5.50s	33	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Laguna M.1	4.0	10.0	0.0%	0		3.08s	212	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Laguna M.1	6.3	10.0	50.0%	0		683ms	80	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Laguna M.1	3.2	10.0	0.0%	0		951ms	340	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Laguna M.1	10.0	10.0	100.0%	0		7.54s	309	0

Schnellvergleich

Vergleichspaar wechseln

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumKostenlos verfügbar Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Nemotron 3 Nano Omni 30b A3b ReasoningmediumKostenlos verfügbarvsLaguna M.1noneKostenlos verfügbar Elephant AlphamediumvsLaguna M.1noneKostenlos verfügbar MiniMax M2.7mediumvsLaguna M.1noneKostenlos verfügbar Laguna M.1noneKostenlos verfügbarvsQwen3 Coder Nextmedium Laguna M.1noneKostenlos verfügbarvsGLM 4.7 Flashmedium MiniMax M2.5mediumKostenlos verfügbarvsMistral Small 4none Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsLaguna M.1noneKostenlos verfügbar Mistral Small 4nonevsGLM 4.7 Flashmedium