Claude Opus 4.7 (medium) vs Gemini 3.5 Flash

Claude Opus 4.7 (medium) лидирует по среднему баллу: 8.7 vs 7.0. Gemini 3.5 Flash имеет более низкую стоимость benchmark: $1.079 vs $1.477. Claude Opus 4.7 (medium) быстрее: 7.61s vs 9.93s, с долей успешных попыток 83.3% vs 74.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #20
Общее число выходных токенов: 29,990
Время ответа (среднее): 7.61s
Общая стоимость: $1.477

Ранг: #87
Общее число выходных токенов: 117,518
Время ответа (среднее): 9.93s
Общая стоимость: $1.079

Рекомендуемая модель Claude Opus 4.7 (medium)

У него самый высокий балл в этом сравнении (8.7) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Подробное сравнение

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19
Оценка	8.7	7.0
Ранг	#20	#87
Надежность	10.0	10.0
Стабильность	9.6	8.9
Тестов верно
Доля успешных попыток	83.3%	74.2%
Нестабильные тесты	1	3
Всего запусков	66	66
Стоимость за результат	8.201	7.190
Общая стоимость	$1.477	$1.079
Цена входа	$5.000 / 1M	$1.500 / 1M
Цена выхода	$25.000 / 1M	$9.000 / 1M
Общее число входных токенов	145,252	13,843
Выходные токены	24,948	117,518
Токены рассуждений	5,042	0
Время ответа (среднее)	7.61s	9.93s
Время ответа (макс.)	65.40s	64.36s
Время ответа (суммарно)	159.91s	178.68s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Claude Opus 4.7

medium

Стоимость: $0.059
Время: 26.8s
Токены: 2,475 tok

#87 Gemini 3.5 Flash

none

Стоимость: $0.225
Время: 125.5s
Токены: 25,004 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashnonevsMercury 2medium Gemini 3.5 FlashnonevsKimi K2.5medium Seed-2.0-MinimediumvsGemini 3.5 Flashnone DeepSeek V3.2mediumvsGemini 3.5 Flashnone Gemini 3.5 FlashnonevsKAT-Coder-Pro V2.5medium Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium Gemini 3.5 FlashnonevsQwen3.6 Flashmedium Gemini 3.5 FlashnonevsStep 3.7 Flashhigh Gemini 3.5 FlashnonevsGrok 4.20medium Gemini 3.5 FlashnonevsGLM 5.1medium Gemini 3.5 FlashnonevsGrok 4.3medium Gemini 3.5 FlashnonevsQwen3.5-122B-A10Bmedium