Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Google: Gemini 3.1 Flash Lite

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Релиз: 2026-05-08
Оценка 6.2 6.7
Ранг #97 #84
Надежность 10.0 10.0
Стабильность 8.3 8.8
Тестов верно
Доля успешных попыток 48.3% 56.7%
Нестабильные тесты 4 3
Всего запусков 60 60
Стоимость за результат 0.222 0.123
Общая стоимость $0.018 $0.013
Цена входа $0.252 / 1M $0.250 / 1M
Цена выхода $0.378 / 1M $1.500 / 1M
Выходные токены 11,159 2,481
Токены рассуждений 0 0
Время ответа (среднее) 14.43s 1.37s
Время ответа (макс.) 115.89s 4.49s
Время ответа (суммарно) 288.55s 27.32s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.8 8.2 12.5% 1 9.35s 1,073 0
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.1 5.4 16.7% 1 20.87s 4,522 0
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 951ms 660 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 2,887 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 1,710 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.2 6.9 16.7% 1 4.17s 21 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 9.32s 43 0
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 6.91s 298 0
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 17 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

Быстрое сравнение

Сменить пару сравнения