Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5-122B-A10B

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-28

Métrica Gemini 3.5 Flash Gemini 3.5 Flash high Lanzamiento: 2026-05-19 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lanzamiento: 2026-02-24
Puntuación 9.6 7.7
Rango #2 #41
Fiabilidad 10.0 10.0
Consistencia 9.6 8.8
Pruebas correctas
Tasa de aciertos por intento 96.7% 71.7%
Pruebas inestables 1 3
Ejecuciones totales 60 60
Costo por resultado 5.231 5.031
Costo total $0.994 $0.509
Precio de entrada $1.500 / 1M $0.260 / 1M
Precio de salida $9.000 / 1M $2.080 / 1M
Tokens de salida 1,969 26,166
Tokens de razonamiento 102,679 213,524
Tiempo de respuesta (promedio) 8.30s 39.40s
Tiempo de respuesta (máximo) 34.82s 168.16s
Tiempo de respuesta (total) 165.92s 788.00s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

Comparación rápida

Cambiar par de comparación