Comparar Gráficos Metodología

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs MiniMax: MiniMax M2.5

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-06

Métrica	Trinity Large Preview none Lanzamiento: 2026-01-27 Disponible gratis	MiniMax: MiniMax M2.5 medium Lanzamiento: 2026-02-12
Rango	#45	#43
Puntaje prom.	4.2	4.7
Consistencia	9.6	5.6
Costo por resultado	0.000	4.981
Costo total	$0.000	$0.250
Pruebas correctas
Tasa de aciertos por intento	33.3%	60.4%
Pruebas inestables	1	9
Ejecuciones totales	48 (16 x 3)	48 (16 x 3)
Tokens de salida	1,837	107,044
Tokens de razonamiento	0	206,190
Tiempo de respuesta (promedio)	3.15s	43.03s
Tiempo de respuesta (máximo)	8.91s	237.27s
Tiempo de respuesta (total)	50.46s	387.25s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
MiniMax: MiniMax M2.5	9.3	7.9	88.9%	1		32.42s	286	45,112

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
MiniMax: MiniMax M2.5	10.0	2.1	66.7%	1		60.39s	740	9,713

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
MiniMax: MiniMax M2.5	10.0	1.7	66.7%	2		7.48s	266	3,835

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
MiniMax: MiniMax M2.5	10.0	4.4	22.2%	2		237.27s	105,047	133,487

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
MiniMax: MiniMax M2.5	3.0	2.5	33.3%	1		6.63s	25	1,686

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
MiniMax: MiniMax M2.5	8.0	6.8	83.3%	1		4.64s	252	1,873

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
MiniMax: MiniMax M2.5	4.0	7.2	44.4%	1		11.54s	159	9,547

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
MiniMax: MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	269	937

Comparación rápida

Cambiar par de comparación

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumvsGPT-5.4none MiniMax M2.5mediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone Gemini 2.5 FlashnonevsMiniMax M2.5medium MiniMax M2.5mediumvsQwen3.5-Flashnone MiniMax M2.5mediumvsKimi K2.5none MiniMax M2.5mediumvsGPT-4o-mininone MiniMax M2.5mediumvsQwen3 Coder Nextnone Trinity Large PreviewnoneDisponible gratisvsQwen3 Coder Nextmedium DeepSeek V3.2nonevsMiniMax M2.5medium MiniMax M2.5mediumvsGLM 4.7 Flashnone