Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.2 Chat

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19 GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11
Оценка 9.4 7.9
Ранг #4 #24
Надежность 10.0 10.0
Стабильность 10.0 8.9
Тестов верно
Доля успешных попыток 90.5% 74.6%
Нестабильные тесты 0 3
Всего запусков 63 63
Стоимость за результат 5.546 2.803
Общая стоимость $1.054 $0.393
Цена входа $2.000 / 1M $1.750 / 1M
Цена выхода $12.000 / 1M $14.000 / 1M
Общее число входных токенов 41,617 34,212
Выходные токены 1,977 23,744
Токены рассуждений 78,896 0
Время ответа (среднее) 20.14s 7.13s
Время ответа (макс.) 88.68s 38.52s
Время ответа (суммарно) 281.92s 149.69s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 498 112 3,218
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.9 9.9 66.7% 0 40.17s 8,124 435 41,247
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 17,240 432 9,281
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 7,265 279 3,904
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 635 18 12,424
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 490 108 1,179
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 621 72 2,236
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 570 235 3,128
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 6,018 274 982
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 156 12 1,297
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0

Быстрое сравнение

Сменить пару сравнения