比較するチャート方法論

言語:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs OpenAI: GPT-5.4

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-06

指標	Trinity Large Preview none リリース: 2026-01-27 無料で利用可能	OpenAI: GPT-5.4 none リリース: 2026-03-05
順位	#45	#44
平均スコア	4.2	4.5
一貫性	9.6	8.9
結果あたりのコスト	0.000	1.562
合計コスト	$0.000	$0.094
正解テスト
試行ごとの合格率	33.3%	41.7%
不安定なテスト	1	2
総実行回数	48 (16 x 3)	48 (16 x 3)
出力トークン	1,837	1,819
推論トークン	0	0
応答時間（平均）	3.15s	1.48s
応答時間（最大）	8.91s	2.89s
応答時間（合計）	50.46s	23.64s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

平均スコア vs 応答時間（平均）

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
OpenAI: GPT-5.4	3.0	9.9	0.0%	0		1.78s	184	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

クイック比較

比較ペアを切り替え

MiniMax M2.5mediumvsGPT-5.4none Trinity Large Previewnone無料で利用可能vsMiniMax M2.5medium Trinity Large Previewnone無料で利用可能vsQwen3 Coder Nextmedium Mercury 2mediumvsGPT-5.4none Trinity Large Previewnone無料で利用可能vsgpt-oss-120bmedium無料で利用可能 GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium Trinity Large Previewnone無料で利用可能vsMercury 2medium Trinity Large Previewnone無料で利用可能vsGLM 4.7 Flashmedium Trinity Large Previewnone無料で利用可能vsQwen3.5-35B-A3Bmedium Trinity Large Previewnone無料で利用可能vsGPT-5 Nanomedium GPT-5.4nonevsGLM 4.7 Flashmedium