Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs xAI: Grok 4.1 Fast

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-03

Métrica	Google: Gemini 3.1 Flash Lite Preview none Lanzamiento: 2026-03-03	xAI: Grok 4.1 Fast medium Lanzamiento: 2025-11-19
Rango	#10	#24
Puntaje prom.	7.70	6.29
Consistencia	9.54	8.20
Costo por resultado	0.116	0.532
Costo total	$0.011	$0.043
Pruebas correctas
Tasa de aciertos por intento	69.1%	66.7%
Pruebas inestables	1	3
Tokens de salida	4,307	793
Tokens de razonamiento	0	74,056

Mejores modelos por puntuación

Puntuación vs costo total

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		102	4,021

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	5,472

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		12	40,547

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0
xAI: Grok 4.1 Fast	5.50	10.00	50.0%	0		48	3,151

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0
xAI: Grok 4.1 Fast	4.67	7.20	44.4%	1		191	9,380

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tokens de salida	Tokens de razonamiento
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		260	11,485

Comparación rápida

Cambiar par de comparación

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumDisponible gratis DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewnonevsGrok 4.1 Fastmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium