AI BENCHY Compare

Trinity Large Preview vs inclusionAI: Ring-2.6-1T

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-03

指標	Trinity Large Preview Trinity Large Preview none リリース: 2026-01-27	Ring-2.6-1T Ring-2.6-1T medium リリース: 2026-05-10

指標	Trinity Large Preview Trinity Large Preview none リリース: 2026-01-27	Ring-2.6-1T Ring-2.6-1T medium リリース: 2026-05-10
スコア	4.7	7.0
順位	#148	#74
信頼性	10.0	10.0
一貫性	9.3	8.7
正解テスト
試行ごとの合格率	23.3%	63.3%
不安定なテスト	2	3
総実行回数	60	60
結果あたりのコスト	0.017	0.000
合計コスト	$0.008	$0.033
入力価格	$0.243 / 1M	$0.075 / 1M
出力価格	$0.243 / 1M	$0.625 / 1M
合計入力トークン	29,828	35,892
出力トークン	2,169	21,752
推論トークン	0	42,754
応答時間（平均）	2.98s	61.29s
応答時間（最大）	14.34s	304.19s
応答時間（合計）	56.57s	1164.50s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	810	3,833	4,891

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
Ring-2.6-1T	6.5	10.0	50.0%	0		59.65s	834	1,369	3,985

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	14,823	324	6,088

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	8,046	840	1,937

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	873	9,744	15,013

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	561	150	583

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	774	266	1,831

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	792	697	2,479

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	8,136	234	1,531

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	243	4,295	4,416

クイック比較

比較ペアを切り替え

Trinity Large PreviewnonevsQwen3 Coder Nextmedium Claude Sonnet 4.6nonevsRing-2.6-1Tmedium Ring-2.6-1TmediumvsQwen3.6 Max Previewnone Ring-2.6-1TmediumvsStep 3.7 Flashhigh Trinity Large PreviewnonevsGLM 4.7 Flashmedium Claude Opus 4.8nonevsRing-2.6-1Tmedium Gemma 4 31Bnone無料で利用可能vsRing-2.6-1Tmedium Gemini 3.1 Flash LiteminimalvsRing-2.6-1Tmedium Ring-2.6-1TmediumvsStep 3.7 Flashlow Ring-2.6-1TmediumvsGPT-5.3 Chatnone Ring-2.6-1TmediumvsQwen3.7 Plusnone Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium