AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica Qwen: Qwen3.5 Plus 2026-02-15
Rango#4
EmpresaQwen
Score 8.42
Consistencia 9.30
Costo por resultado 2.3151
Costo total $0.23151
Pruebas correctas 10/12
Tasa de aciertos por intento 86.1%
Pruebas inestables 1
Tokens de salida 802
Tokens de razonamiento 93,972

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.17 $0.00855
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.61 $0.03952
Domain specific 1/3 4.00 7.21 44.4% 1 7.28 $0.10564
Instructions following 2/2 9.50 9.99 100.0% 0 9.33 $0.02275
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.28 $0.05508

Modelos comparados

Comparar Qwen: Qwen3.5 Plus 2026-02-15 contra...

#3 · Google

Google: Gemini 3 Pro Preview

Razonamiento (medium)

Score: 8.42

Consistencia: 10.00

Tasa de aciertos por intento: 83.3%

Pruebas inestables: 0

Costo por resultado: 0.8028

Pruebas correctas: 10/12

Costo total: $0.08029

Comparar

#5 · OpenAI

OpenAI: GPT-5.2

Razonamiento (medium)

Score: 7.92

Consistencia: 9.30

Tasa de aciertos por intento: 80.6%

Pruebas inestables: 1

Costo por resultado: 2.2838

Pruebas correctas: 9/12

Costo total: $0.20554

Comparar

#2 · Google

Google: Gemini 3.1 Pro Preview

Razonamiento (medium)

Score: 9.25

Consistencia: 10.00

Tasa de aciertos por intento: 91.7%

Pruebas inestables: 0

Costo por resultado: 2.5543

Pruebas correctas: 11/12

Costo total: $0.28097

Comparar

Comparación rápida

Comparar Qwen: Qwen3.5 Plus 2026-02-15 contra...