比較するチャート方法論

言語:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs MiniMax: MiniMax M2.5

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-06

指標	Trinity Large Preview none リリース: 2026-01-27 無料で利用可能	MiniMax: MiniMax M2.5 medium リリース: 2026-02-12
順位	#45	#43
平均スコア	4.2	4.7
一貫性	9.6	5.6
結果あたりのコスト	0.000	4.981
合計コスト	$0.000	$0.250
正解テスト
試行ごとの合格率	33.3%	60.4%
不安定なテスト	1	9
総実行回数	48 (16 x 3)	48 (16 x 3)
出力トークン	1,837	107,044
推論トークン	0	206,190
応答時間（平均）	3.15s	43.03s
応答時間（最大）	8.91s	237.27s
応答時間（合計）	50.46s	387.25s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

平均スコア vs 応答時間（平均）

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
MiniMax: MiniMax M2.5	9.3	7.9	88.9%	1		32.42s	286	45,112

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
MiniMax: MiniMax M2.5	10.0	2.1	66.7%	1		60.39s	740	9,713

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
MiniMax: MiniMax M2.5	10.0	1.7	66.7%	2		7.48s	266	3,835

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
MiniMax: MiniMax M2.5	10.0	4.4	22.2%	2		237.27s	105,047	133,487

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
MiniMax: MiniMax M2.5	3.0	2.5	33.3%	1		6.63s	25	1,686

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
MiniMax: MiniMax M2.5	8.0	6.8	83.3%	1		4.64s	252	1,873

Puzzle Solving	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
MiniMax: MiniMax M2.5	4.0	7.2	44.4%	1		11.54s	159	9,547

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
MiniMax: MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	269	937

クイック比較

比較ペアを切り替え

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumvsGPT-5.4none MiniMax M2.5mediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone Gemini 2.5 FlashnonevsMiniMax M2.5medium MiniMax M2.5mediumvsQwen3.5-Flashnone MiniMax M2.5mediumvsKimi K2.5none MiniMax M2.5mediumvsGPT-4o-mininone MiniMax M2.5mediumvsQwen3 Coder Nextnone Trinity Large Previewnone無料で利用可能vsQwen3 Coder Nextmedium DeepSeek V3.2nonevsMiniMax M2.5medium MiniMax M2.5mediumvsGLM 4.7 Flashnone