Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01 Gemini 2.5 Flash Gemini 2.5 Flash none Релиз: 2025-06-17
Оценка 6.9 6.4
Ранг #81 #95
Надежность 10.0 10.0
Стабильность 7.9 9.6
Тестов верно
Доля успешных попыток 63.3% 48.3%
Нестабильные тесты 6 1
Всего запусков 60 60
Стоимость за результат 0.335 0.159
Общая стоимость $0.037 $0.015
Цена входа $0.252 / 1M $0.300 / 1M
Цена выхода $0.378 / 1M $2.500 / 1M
Выходные токены 7,177 1,764
Токены рассуждений 68,297 0
Время ответа (среднее) 53.34s 889ms
Время ответа (макс.) 189.03s 4.39s
Время ответа (суммарно) 1066.71s 17.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 8.7 10.0 83.3% 1 24.23s 3,247 6,953
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 640 21,230
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 477 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.4 2.5 33.3% 1 58.29s 49 2,189
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 72 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 132 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 12 0

Быстрое сравнение

Сменить пару сравнения