Anthropic: Claude Opus 4.7 vs Anthropic: Claude Sonnet 4.6

Claude Opus 4.7 (medium) が平均スコアでリードし、8.7 vs 7.8 です。 Claude Opus 4.7 (medium) の benchmark コストが低く、$1.477 vs $2.057 です。 Claude Opus 4.7 (medium) の方が高速で、7.61s vs 25.91s です、成功率は 83.3% vs 66.7% です。

おすすめモデルClaude Opus 4.7 (medium)ここでは最高スコア（8.7）で、Claude Sonnet 4.6 (medium) より約 3.4 倍速く応答します。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-07-20

指標	Claude Opus 4.7 Claude Opus 4.7 medium リリース: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17

指標	Claude Opus 4.7 Claude Opus 4.7 medium リリース: 2026-04-16	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17
スコア	8.7	7.8
順位	#15	#40
信頼性	10.0	10.0
一貫性	9.6	9.2
正解テスト
試行ごとの合格率	83.3%	66.7%
不安定なテスト	1	2
総実行回数	66	66
結果あたりのコスト	8.201	14.692
合計コスト	$1.477	$2.057
入力価格	$5.000 / 1M	$3.000 / 1M
出力価格	$25.000 / 1M	$15.000 / 1M
合計入力トークン	145,252	106,292
出力トークン	24,948	80,748
推論トークン	5,042	35,117
応答時間（平均）	7.61s	25.91s
応答時間（最大）	65.40s	140.96s
応答時間（合計）	159.91s	362.78s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Claude Opus 4.7

medium

コスト: $0.059
時間: 26.8s
トークン: 2,475 tok

#40 Claude Sonnet 4.6

medium

無効なSVG

コスト: $0.000
時間: 300.0s
トークン: 0 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586

クイック比較

比較ペアを切り替え

Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh Claude Sonnet 4.6mediumvsKimi K3max Claude Sonnet 4.6mediumvsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsDeepSeek V4 Prohigh Claude Sonnet 4.6mediumvsGLM 5.2high Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsInklinghigh Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Sonnet 4.6mediumvsMuse Spark 1.1high Claude Opus 4.7mediumvsGrok 4.5low