#91
OpenAI
Lanzamiento: 2025-08-05
Probado el: 2026-04-21 12:42
openai/gpt-oss-120b::none
(medium)
(none)
Precio de entrada
$0.000 / 1M
Precio de salida
$0.000 / 1M
Pruebas inestables
5
Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).
Tiempo de respuesta (promedio)
11.96s
Tiempo de respuesta (máximo): 68.97s
Tiempo de respuesta (total): 179.34s
Historial de ejecuciones
| Probado el | Puntuación | Fiabilidad | Pruebas correctas | Costo total | Comparar |
|---|---|---|---|---|---|
| 2026-05-08 15:31 Suite modificada | 5.2 | 10.0 | $0.011 | Comparar | |
| 2026-04-21 12:42 Primera ejecución registrada | 5.2 | N/D | $0.009 | Ejecución actual |
Comparación de ejecuciones
| Ejecución | Puntuación | Consistencia | Fiabilidad | Pruebas correctas | Pruebas inestables | Total de tokens de salida | Costo total | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-21 12:42 · Primera ejecución registrada | 5.2 | 7.9 | N/D | 4/18 | 5 | 44,652 | $0.009 | 11.96s |
| 2026-05-08 15:31 · Suite modificada | 5.2 | 8.7 | 10.0 | 5/19 | 3 | 51,505 | $0.011 | 21.86s |
| Diferencia | 0.0 | -0.8 | -1 | +2 | -6853 | -$0.002 | -9905ms |
Estas dos ejecuciones usaron suites de benchmark distintas, así que las diferencias reflejan tanto cambios del modelo como de la suite.
Gráficos
Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.
Puntuación vs Costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Comparación rápida
gpt-oss-120bnoneDisponible gratisvsGLM 4.7 Flashnonegpt-oss-120bnoneDisponible gratisvsgpt-oss-120bmediumDisponible gratisgpt-oss-120bnoneDisponible gratisvsGPT-5.4nonegpt-oss-120bnoneDisponible gratisvsMiMo-V2-Prononegpt-oss-120bnoneDisponible gratisvsGLM 5.1nonegpt-oss-120bnoneDisponible gratisvsGemini 3 Flash Previewmediumgpt-oss-120bnoneDisponible gratisvsGemini 3.5 Flashhighgpt-oss-120bnoneDisponible gratisvsRing-2.6-1Tmediumgpt-oss-120bnoneDisponible gratisvsGemini 3.5 Flashlow
Desglose por categoría
| Categoría | Puntuación | Consistencia | Pruebas correctas |
|---|---|---|---|
| Trucos anti-IA | 6.6 | 8.0 | |
| Programación | 4.3 | 1.1 | |
| Combinado | 3.0 | 10.0 | |
| Análisis y extracción de datos | 6.5 | 10.0 | |
| Específico del dominio | 3.0 | 10.0 | |
| Inteligencia general | 4.6 | 10.0 | |
| Seguimiento de instrucciones | 8.4 | 6.9 | |
| Resolución de acertijos | 4.5 | 4.8 | |
| Llamada de herramientas | 3.0 | 10.0 |