Навигация
AI BENCHY
Сравнить Графики Методология
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.2 Chat

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика Google: Gemini 3 Pro Preview medium Релиз: 2025-11-18 OpenAI: GPT-5.2 Chat none Релиз: 2025-12-11
Ранг #6 #15
Средний балл 8.2 7.4
Стабильность 10.0 9.1
Стоимость за результат 1.477 2.440
Общая стоимость $0.192 $0.269
Тестов верно
Доля успешных попыток 81.3% 75.0%
Нестабильные тесты 0 2
Всего запусков 48 (16 x 3) 48 (16 x 3)
Выходные токены 1,502 15,845
Токены рассуждений 9,706 0
Время ответа (среднее) 7.15s 7.03s
Время ответа (макс.) 11.96s 38.52s
Время ответа (суммарно) 64.34s 112.51s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.75s 143 1,107
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 0.0% 0 10.37s 351 952
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 9.9 10.0 100.0% 0 10.84s 279 3,156
OpenAI: GPT-5.2 Chat 9.9 10.0 100.0% 0 3.05s 980 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 4.0 10.0 33.3% 0 7.01s 15 1,195
OpenAI: GPT-5.2 Chat 4.0 10.0 33.3% 0 17.78s 7,810 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 9.34s 78 374
OpenAI: GPT-5.2 Chat 4.0 3.0 33.3% 1 3.20s 335 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 9.5 10.0 100.0% 0 3.26s 69 754
OpenAI: GPT-5.2 Chat 6.0 6.1 83.3% 1 5.46s 1,528 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
OpenAI: GPT-5.2 Chat 7.0 10.0 66.7% 0 4.42s 1,743 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 11.96s 324 971
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

Быстрое сравнение

Сменить пару сравнения