Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.3 Chat

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19 GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03
Оценка 9.3 7.4
Ранг #3 #57
Надежность 10.0 10.0
Стабильность 10.0 8.4
Тестов верно
Доля успешных попыток 90.0% 68.3%
Нестабильные тесты 0 4
Всего запусков 60 60
Стоимость за результат 1.582 3.350
Общая стоимость $0.285 $0.402
Цена входа $1.500 / 1M $1.750 / 1M
Цена выхода $9.000 / 1M $14.000 / 1M
Выходные токены 2,027 24,757
Токены рассуждений 23,938 0
Время ответа (среднее) 2.98s 6.13s
Время ответа (макс.) 6.44s 18.33s
Время ответа (суммарно) 59.59s 122.61s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 452 6,839
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,772 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 1,491 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 1,758 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0

Быстрое сравнение

Сменить пару сравнения