Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24
Ранг #34 #49
Оценка 7.1 5.9
Стабильность 7.2 8.6
Стоимость за результат 3.610 0.237
Общая стоимость $0.289 $0.015
Тестов верно
Доля успешных попыток 68.6% 47.1%
Нестабильные тесты 6 3
Всего запусков 51 51
Выходные токены 1,708 3,761
Токены рассуждений 58,019 0
Время ответа (среднее) 15.66s 3.89s
Время ответа (макс.) 102.91s 47.43s
Время ответа (суммарно) 266.14s 66.07s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 574 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 1,833 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 114 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 63 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Qwen3.5-35B-A3B 3.9 7.4 22.2% 1 1.34s 655 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0

Быстрое сравнение

Сменить пару сравнения