Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5 Plus 2026-04-20

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-27

Метрика GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03 Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Релиз: 2026-04-20
Оценка 7.7 8.1
Ранг #48 #32
Надежность Н/Д 9.7
Стабильность 8.6 9.0
Тестов верно
Доля успешных попыток 68.5% 77.8%
Нестабильные тесты 3 2
Всего запусков 54 54
Стоимость за результат 3.082 2.065
Общая стоимость $0.340 $0.269
???? ????? $1.750 / 1M $0.400 / 1M
???? ?????? $14.000 / 1M $2.400 / 1M
Выходные токены 20,784 2,179
Токены рассуждений 0 103,832
Время ответа (среднее) 5.88s 32.81s
Время ответа (макс.) 18.33s 92.41s
Время ответа (суммарно) 105.90s 590.65s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 215 7,748
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
Qwen3.5 Plus 2026-04-20 7.6 10.0 100.0% 0 85.72s 248 11,081
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 483 17,490
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 270 14,668
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 63 28,414
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 125 4,792
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 103 7,689
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.58s 324 9,786
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 348 2,164

Быстрое сравнение

Сменить пару сравнения