Навигация
AI BENCHY
Сравнить Графики
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3 Coder Next

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика OpenAI: GPT-5 Mini medium Релиз: 2025-08-07 Qwen: Qwen3 Coder Next none Релиз: 2026-02-03
Ранг #31 #49
Средний балл 6.1 3.6
Тестов верно
Стабильность 8.9 10.0
Стоимость за результат 1.401 0.226
Общая стоимость $0.113 $0.007
Доля успешных попыток 62.2% 20.0%
Нестабильные тесты 2 0
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Выходные токены 5,477 2,874
Токены рассуждений 46,912 0
Время ответа (среднее) 25.92s 12.82s
Время ответа (макс.) 88.15s 45.14s
Время ответа (суммарно) 388.79s 115.42s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Qwen: Qwen3 Coder Next 2.3 10.0 0.0% 0 4.39s 1,315 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Qwen: Qwen3 Coder Next 10.0 10.0 0.0% 0 45.14s 317 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Qwen: Qwen3 Coder Next 5.4 10.0 50.0% 0 1.32s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Qwen: Qwen3 Coder Next 4.0 10.0 33.3% 0 962ms 26 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Qwen: Qwen3 Coder Next 4.5 10.0 0.0% 0 7.71s 63 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Qwen: Qwen3 Coder Next 1.3 10.0 0.0% 0 22.86s 652 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Qwen: Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 255 0

Быстрое сравнение

Сменить пару сравнения