Claude Sonnet 4.6 vs GPT-5.4 Mini (medium)

順位: #76
合計出力トークン: 19,362
応答時間（平均）: 8.12s
合計コスト: $0.661

順位: #69
合計出力トークン: 151,755
応答時間（平均）: 25.94s
合計コスト: $0.756

おすすめモデル Claude Sonnet 4.6

スコアはここでの最高値に近く（7.3 vs 7.5）、GPT-5.4 Mini (medium) より約 3.2 倍速く応答します。

詳細比較

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 none リリース: 2026-02-17	GPT-5.4 Mini GPT-5.4 Mini medium リリース: 2026-03-17

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 none リリース: 2026-02-17	GPT-5.4 Mini GPT-5.4 Mini medium リリース: 2026-03-17
スコア	7.3	7.5
順位	#76	#69
信頼性	10.0	10.0
一貫性	9.7	7.7
正解テスト
試行ごとの合格率	57.6%	71.2%
不安定なテスト	1	6
総実行回数	66	66
結果あたりのコスト	5.502	6.299
合計コスト	$0.661	$0.756
入力価格	$3.000 / 1M	$0.750 / 1M
出力価格	$15.000 / 1M	$4.500 / 1M
合計入力トークン	123,264	97,155
出力トークン	19,362	6,211
推論トークン	0	145,544
応答時間（平均）	8.12s	25.94s
応答時間（最大）	51.18s	138.75s
応答時間（合計）	121.78s	570.66s

モデル生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#76 Claude Sonnet 4.6

none

コスト: $0.038
時間: 27.3s
トークン: 2,598 tok

#69 GPT-5.4 Mini

medium

コスト: $0.056
時間: 95.5s
トークン: 12,464 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	606	296	2,876

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
GPT-5.4 Mini	8.4	7.4	88.9%	1		57.87s	7,305	467	40,902

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
GPT-5.4 Mini	6.9	5.9	66.7%	1		59.64s	74,058	4,347	40,924

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	7,140	234	650

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	619	60	43,286

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	477	150	510

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
GPT-5.4 Mini	9.8	10.0	100.0%	0		2.13s	660	96	1,185

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
GPT-5.4 Mini	7.8	10.0	66.7%	0		4.37s	642	278	2,443

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	5,453	251	2,594

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
GPT-5.4 Mini	3.0	10.0	0.0%	0		30.10s	195	32	10,174

クイック比較

比較ペアを切り替え

Claude Sonnet 4.6nonevsKAT-Coder-Pro V2.5low Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium Claude Sonnet 4.6nonevsGemini 3 Flash Previewlow Claude Sonnet 4.6nonevsDeepSeek V4 Flash 0731medium Claude Sonnet 4.6nonevsGemini 3.1 Flash Litemedium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 5nonevsGPT-5.4 Minimedium Claude Sonnet 4.6nonevsLongCat 2.0medium Claude Sonnet 4.6nonevsQwen3.7 Flashlow Claude Sonnet 4.6nonevsStep 3.7 Flashlow Claude Sonnet 4.6nonevsQwen3.5-27Bmedium Claude Sonnet 4.6nonevsKimi K2.6medium