AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lanzamiento: 2025-12-17	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15

Métrica	Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lanzamiento: 2025-12-17	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15
Puntuación	9.8	8.1
Rango	#1	#23
Fiabilidad	10.0	10.0
Consistencia	9.6	8.8
Pruebas correctas
Tasa de aciertos por intento	98.3%	76.7%
Pruebas inestables	1	3
Ejecuciones totales	60	60
Costo por resultado	2.980	2.251
Costo total	$0.567	$0.316
Precio de entrada	$0.500 / 1M	$0.260 / 1M
Precio de salida	$3.000 / 1M	$1.560 / 1M
Tokens de salida	2,000	2,145
Tokens de razonamiento	181,033	172,563
Tiempo de respuesta (promedio)	16.50s	67.58s
Tiempo de respuesta (máximo)	117.26s	266.69s
Tiempo de respuesta (total)	330.06s	878.57s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.88s	330	3,216
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	7.9	6.4	83.3%	1		95.96s	456	127,964
Qwen3.5 Plus 2026-02-15	7.6	6.7	66.7%	1		193.80s	406	63,554

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		22.42s	351	10,485
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.43s	279	4,893
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		15.27s	12	21,684
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.19s	72	1,905
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.04s	72	2,709
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.05s	183	4,365
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		32.50s	301	13,853

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		12.60s	234	1,487
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.50s	11	2,325
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	24	17,130

Comparación rápida

Cambiar par de comparación

Gemini 3.5 FlashminimalvsQwen3.5 Plus 2026-02-15medium GPT-5.2 ChatnonevsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-02-15medium DeepSeek V4 FlashhighDisponible gratisvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash LitelowvsQwen3.5 Plus 2026-02-15medium GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Qwen3.5 Plus 2026-02-15mediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsQwen3.5 Plus 2026-02-15medium Ring-2.6-1TnonevsQwen3.5 Plus 2026-02-15medium