Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 2.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16

Метрика DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01 Gemini 2.5 Flash Gemini 2.5 Flash none Релиз: 2025-06-17
Оценка 6.1 6.2
Ранг #63 #61
Стабильность 8.1 9.2
Тестов верно
Доля успешных попыток 50.0% 44.4%
Нестабильные тесты 4 2
Всего запусков 54 54
Стоимость за результат 0.226 0.184
Общая стоимость $0.016 $0.013
???? ????? $0.260 / 1M $0.300 / 1M
???? ?????? $0.380 / 1M $2.500 / 1M
Выходные токены 8,384 1,726
Токены рассуждений 0 0
Время ответа (среднее) 12.09s 903ms
Время ответа (макс.) 115.89s 4.39s
Время ответа (суммарно) 217.56s 16.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.2 9.8 0.0% 0 7.63s 1,419 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 2.4 1.3 33.3% 1 7.63s 553 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.16s 453 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.6 7.2 22.2% 1 1.61s 24 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Gemini 2.5 Flash 8.0 6.8 66.7% 1 672ms 70 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 8.5 7.5 88.9% 1 7.37s 1,136 0
Gemini 2.5 Flash 5.7 10.0 33.3% 0 576ms 132 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0

Быстрое сравнение

Сменить пару сравнения