Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03 GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11
Оценка 7.5 7.3
Ранг #49 #59
Надежность 10.0 10.0
Стабильность 9.7 8.3
Тестов верно
Доля успешных попыток 63.3% 70.0%
Нестабильные тесты 1 4
Всего запусков 60 60
Стоимость за результат 0.142 4.094
Общая стоимость $0.017 $0.492
Цена входа $0.250 / 1M $1.750 / 1M
Цена выхода $1.500 / 1M $14.000 / 1M
Общее число входных токенов 34,579 31,348
Выходные токены 5,541 2,880
Токены рассуждений 0 28,289
Время ответа (среднее) 1.23s 16.50s
Время ответа (макс.) 3.39s 77.80s
Время ответа (суммарно) 24.68s 214.45s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 504 1,092 0
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.06s 5,125 664 0
GPT-5.2 10.0 10.0 100.0% 0 23.15s 4,683 490 8,269
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 13,026 339 0
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 7,550 399 0
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 641 568 0
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 488 69 0
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 623 574 0
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 900ms 570 1,045 0
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 5,894 782 0
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 814ms 158 9 0
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223

Быстрое сравнение

Сменить пару сравнения