Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03 GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Оценка 7.2 7.3
Ранг #58 #54
Надежность 10.0 10.0
Стабильность 9.7 9.1
Тестов верно
Доля успешных попыток 60.3% 63.5%
Нестабильные тесты 1 2
Всего запусков 63 63
Стоимость за результат 0.148 1.319
Общая стоимость $0.018 $0.159
Цена входа $0.250 / 1M $0.250 / 1M
Цена выхода $1.500 / 1M $2.000 / 1M
Общее число входных токенов 37,582 37,100
Выходные токены 5,547 6,801
Токены рассуждений 0 67,690
Время ответа (среднее) 1.21s 23.64s
Время ответа (макс.) 3.39s 88.15s
Время ответа (суммарно) 25.45s 496.44s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 504 1,092 0
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 606 1,715 6,378
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 967ms 8,128 670 0
GPT-5 Mini 10.0 10.0 100.0% 0 27.63s 7,302 658 17,152
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 13,026 339 0
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 14,118 754 11,520
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 7,550 399 0
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 7,140 453 3,200
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 641 568 0
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 515 293 14,016
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 488 69 0
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 477 349 1,856
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 623 574 0
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 660 310 3,968
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 900ms 570 1,045 0
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 642 1,622 6,144
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 5,894 782 0
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 5,445 487 1,600
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 814ms 158 9 0
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 195 160 1,856

Быстрое сравнение

Сменить пару сравнения