Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 vs OpenAI: GPT-5.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11 GPT-5.5 GPT-5.5 none Релиз: 2026-04-24
Оценка 7.4 6.5
Ранг #57 #86
Надежность 10.0 10.0
Стабильность 8.3 8.7
Тестов верно
Доля успешных попыток 70.0% 56.7%
Нестабильные тесты 4 3
Всего запусков 60 60
Стоимость за результат 4.081 2.165
Общая стоимость $0.490 $0.217
???? ????? $1.750 / 1M $5.000 / 1M
???? ?????? $14.000 / 1M $30.000 / 1M
Выходные токены 2,754 1,949
Токены рассуждений 28,303 0
Время ответа (среднее) 16.44s 1.94s
Время ответа (макс.) 77.80s 5.56s
Время ответа (суммарно) 213.77s 38.86s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
GPT-5.5 6.9 7.9 66.7% 1 1.31s 213 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 23.15s 490 8,269
GPT-5.5 6.8 10.0 50.0% 0 1.52s 447 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
GPT-5.5 3.0 10.0 0.0% 0 5.56s 300 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
GPT-5.5 10.0 10.0 100.0% 0 1.18s 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
GPT-5.5 2.9 7.2 11.1% 1 1.31s 52 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
GPT-5.5 10.0 10.0 100.0% 0 3.41s 124 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
GPT-5.5 6.2 5.8 66.7% 1 1.15s 81 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 7.6 7.3 77.8% 1 5.47s 609 938
GPT-5.5 7.7 10.0 66.7% 0 1.36s 245 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
GPT-5.5 10.0 10.0 100.0% 0 3.90s 247 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 3.0 10.0 0.0% 0 28.18s 26 3,223
GPT-5.5 3.0 10.0 0.0% 0 5.01s 18 0

Быстрое сравнение

Сменить пару сравнения