Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3 Coder Next

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика	OpenAI: GPT-5 Mini medium Релиз: 2025-08-07	Qwen: Qwen3 Coder Next none Релиз: 2026-02-03
Ранг	#31	#49
Средний балл	6.1	3.6
Тестов верно
Стабильность	8.9	10.0
Стоимость за результат	1.401	0.226
Общая стоимость	$0.113	$0.007
Доля успешных попыток	62.2%	20.0%
Нестабильные тесты	2	0
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Выходные токены	5,477	2,874
Токены рассуждений	46,912	0
Время ответа (среднее)	25.92s	12.82s
Время ответа (макс.)	88.15s	45.14s
Время ответа (суммарно)	388.79s	115.42s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Быстрое сравнение

Сменить пару сравнения

GPT-5 MinimediumvsGLM 5none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3 Coder Nextnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium