Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs MiniMax: MiniMax M2.5

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-04

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lanzamiento: 2026-03-03	MiniMax: MiniMax M2.5 medium Lanzamiento: 2026-02-12
Rango	#13	#33
Puntaje prom.	7.25	5.87
Consistencia	9.57	6.38
Costo por resultado	0.134	3.511
Costo total	$0.013	$0.246
Pruebas correctas
Tasa de aciertos por intento	64.4%	66.7%
Pruebas inestables	1	7
Tokens de salida	4,674	121,433
Tokens de razonamiento	0	205,339

Mejores modelos por puntuación

Puntuación vs costo total

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
MiniMax: MiniMax M2.5	9.33	7.89	88.9%	1		286	45,112

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	1.00	10.00	0.0%	0		367	0
MiniMax: MiniMax M2.5	9.00	10.00	100.0%	0		136	1,826

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
MiniMax: MiniMax M2.5	5.50	5.81	83.3%	1		369	4,952

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
MiniMax: MiniMax M2.5	1.00	4.41	22.2%	2		111,023	139,533

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
MiniMax: MiniMax M2.5	7.00	6.41	66.7%	1		1,121	2,521

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
MiniMax: MiniMax M2.5	4.33	4.79	55.6%	2		8,229	10,458

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
MiniMax: MiniMax M2.5	10.00	10.00	100.0%	0		269	937

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponible gratis MiniMax M2.5mediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium MiniMax M2.5mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Claude Sonnet 4.6nonevsMiniMax M2.5medium Gemini 3.1 Flash Lite PreviewnonevsGrok 4.1 Fastmedium Gemini 3.1 Flash Lite PreviewnonevsKimi K2.5medium Gemini 2.5 FlashnonevsMiniMax M2.5medium