Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.5

GPT-5.5 (medium) лидирует по среднему баллу: 9.0 vs 8.7. Claude Opus 4.7 (medium) имеет более низкую стоимость benchmark: $1.477 vs $4.137. Claude Opus 4.7 (medium) быстрее: 7.61s vs 38.42s, с долей успешных попыток 83.3% vs 87.9%.

Рекомендуемая модельClaude Opus 4.7 (medium)Его балл близок к лучшему здесь (8.7 против 9.0), при этом он примерно в 2.8 раза дешевле, чем GPT-5.5 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-24

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24
Оценка	8.7	9.0
Ранг	#18	#13
Надежность	10.0	10.0
Стабильность	9.6	8.9
Тестов верно
Доля успешных попыток	83.3%	87.9%
Нестабильные тесты	1	3
Всего запусков	66	66
Стоимость за результат	8.201	22.980
Общая стоимость	$1.477	$4.137
Цена входа	$5.000 / 1M	$5.000 / 1M
Цена выхода	$25.000 / 1M	$30.000 / 1M
Общее число входных токенов	145,252	80,659
Выходные токены	24,948	5,617
Токены рассуждений	5,042	118,819
Время ответа (среднее)	7.61s	38.42s
Время ответа (макс.)	65.40s	332.10s
Время ответа (суммарно)	159.91s	845.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Claude Opus 4.7

medium

Стоимость: $0.059
Время: 26.8s
Токены: 2,475 tok

#13 GPT-5.5

medium

Стоимость: $0.112
Время: 71.9s
Токены: 3,807 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
GPT-5.5	10.0	10.0	100.0%	0		4.66s	606	250	1,335

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
GPT-5.5	8.8	7.8	88.9%	1		59.77s	7,305	362	24,959

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
GPT-5.5	10.0	10.0	100.0%	0		33.52s	57,466	3,944	6,735

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
GPT-5.5	10.0	10.0	100.0%	0		4.18s	7,140	234	593

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
GPT-5.5	5.3	7.2	44.4%	1		164.14s	723	67	79,625

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
GPT-5.5	10.0	10.0	100.0%	0		4.16s	477	138	223

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
GPT-5.5	10.0	10.0	100.0%	0		3.36s	660	93	538

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
GPT-5.5	10.0	10.0	100.0%	0		6.76s	642	241	2,225

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
GPT-5.5	10.0	10.0	100.0%	0		10.57s	5,445	258	832

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
GPT-5.5	2.8	1.6	33.3%	1		37.86s	195	30	1,754

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashlowvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5high Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Claude Opus 4.7mediumvsGrok 4.5low Gemini 3.6 FlashlowvsGPT-5.5medium Claude Opus 4.7mediumvsMuse Spark 1.1low Gemini 3.5 FlashhighvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5low Claude Opus 4.7mediumvsGPT-5.5low Claude Opus 4.7mediumvsMuse Spark 1.1high Claude Opus 4.7mediumvsGPT-5.6 Solhigh