AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Google: Gemini 3 Flash Preview

Сводка

Сравнение benchmark Claude Opus 4.7 vs Gemini 3 Flash Preview: Claude Opus 4.7 лидирует по среднему баллу: 7.4 vs 7.4. Gemini 3 Flash Preview имеет более низкую стоимость benchmark: $0.111 vs $0.505. Claude Opus 4.7 быстрее: 3.02s vs 5.76s, с долей успешных попыток 76.2% vs 79.4%.

Рекомендуемая модель: Gemini 3 Flash Preview - Его балл близок к лучшему здесь (7.4 против 7.4), при этом он примерно в 4.6 раза дешевле, чем Claude Opus 4.7.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Claude Opus 4.7 Claude Opus 4.7 none Релиз: 2026-04-16	Gemini 3 Flash Preview Gemini 3 Flash Preview low Релиз: 2025-12-17

Метрика	Claude Opus 4.7 Claude Opus 4.7 none Релиз: 2026-04-16	Gemini 3 Flash Preview Gemini 3 Flash Preview low Релиз: 2025-12-17
Оценка	7.4	7.4
Ранг	#49	#52
Надежность	10.0	10.0
Стабильность	9.0	9.2
Тестов верно
Доля успешных попыток	76.2%	79.4%
Нестабильные тесты	0	2
Всего запусков	57	63
Стоимость за результат	3.154	0.689
Общая стоимость	$0.505	$0.111
Цена входа	$5.000 / 1M	$0.500 / 1M
Цена выхода	$25.000 / 1M	$3.000 / 1M
Общее число входных токенов	69,576	36,769
Выходные токены	6,265	2,076
Токены рассуждений	0	28,518
Время ответа (среднее)	3.02s	5.76s
Время ответа (макс.)	18.27s	14.72s
Время ответа (суммарно)	57.44s	120.93s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#49 Claude Opus 4.7

none

Стоимость: $0.051
Время: 24.2s
Токены: 2,181 tok

#52 Gemini 3 Flash Preview

low

Стоимость: $0.007
Время: 12.1s
Токены: 2,289 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		2.12s	894	522	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	500	281	3,082

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.3	3.3	33.3%	0		2.84s	1,176	494	0
Gemini 3 Flash Preview	5.8	7.2	44.4%	1		6.00s	8,122	456	7,421

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	9.5	10.0	100.0%	0		18.27s	37,740	3,504	0
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		3.27s	12,860	326	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.15s	10,533	324	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	7,261	279	3,656

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.19s	1,020	78	0
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	645	12	6,410

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		3.47s	723	257	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	492	120	981

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.46s	939	114	0
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	621	71	2,752

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.46s	939	597	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.77s	562	288	3,168

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.74s	15,339	372	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	5,550	234	415

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.0	10.0	0.0%	0		1.46s	273	3	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		2.75s	156	9	633

Быстрое сравнение

Сменить пару сравнения