Навигация
AI BENCHY
Сравнить Графики Методология
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3 Pro Preview vs OpenAI: GPT-5.3 Chat

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика Google: Gemini 3 Pro Preview medium Релиз: 2025-11-18 OpenAI: GPT-5.3 Chat none Релиз: 2026-03-03
Ранг #6 #19
Средний балл 8.2 7.3
Стабильность 10.0 8.5
Стоимость за результат 1.477 3.163
Общая стоимость $0.192 $0.317
Тестов верно
Доля успешных попыток 81.3% 70.8%
Нестабильные тесты 0 3
Всего запусков 48 (16 x 3) 48 (16 x 3)
Выходные токены 1,502 19,272
Токены рассуждений 9,706 0
Время ответа (среднее) 7.15s 5.96s
Время ответа (макс.) 11.96s 18.33s
Время ответа (суммарно) 64.34s 95.30s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.75s 143 1,107
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 0.0% 0 10.37s 351 952
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 9.9 10.0 100.0% 0 10.84s 279 3,156
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 4.0 10.0 33.3% 0 7.01s 15 1,195
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 9.34s 78 374
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 9.5 10.0 100.0% 0 3.26s 69 754
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Pro Preview 10.0 10.0 100.0% 0 11.96s 324 971
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0

Быстрое сравнение

Сменить пару сравнения