Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen3.6 Plus Preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно
Оценка 7.6 8.2
Ранг #43 #16
Надежность 10.0 Н/Д
Стабильность 8.5 10.0
Тестов верно
Доля успешных попыток 71.7% 75.0%
Нестабильные тесты 4 0
Всего запусков 60 57
Стоимость за результат 2.955 0.000
Общая стоимость $0.355 $0.000
???? ????? $1.750 / 1M $0.000 / 1M
???? ?????? $14.000 / 1M $0.000 / 1M
Выходные токены 21,371 1,153
Токены рассуждений 0 62,197
Время ответа (среднее) 6.86s 15.25s
Время ответа (макс.) 38.52s 43.55s
Время ответа (суммарно) 137.19s 182.96s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 11.69s 61 5,812
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 7.3 5.9 83.3% 1 5.46s 1,528 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 3.40s 27 1,383
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.52s 27 2,998
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0

Быстрое сравнение

Сменить пару сравнения