gpt-oss-120b (medium) vs Qwen3.5 Plus 2026-04-20

Средний балл практически равен: 6.1 vs 6.1. gpt-oss-120b (medium) имеет более низкую стоимость benchmark: $0.019 vs $0.122. Qwen3.5 Plus 2026-04-20 быстрее: 13.56s vs 21.91s, с долей успешных попыток 50.0% vs 43.9%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #132
Общее число выходных токенов: 97,816
Время ответа (среднее): 21.91s
Общая стоимость: $0.019

Ранг: #137
Общее число выходных токенов: 51,487
Время ответа (среднее): 13.56s
Общая стоимость: $0.122

Рекомендуемая модель gpt-oss-120b (medium)

Здесь у него лучший балл (6.1), при этом он примерно в 6.5 раза дешевле, чем Qwen3.5 Plus 2026-04-20.

Подробное сравнение

Метрика	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Релиз: 2026-04-20

Метрика	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Релиз: 2026-04-20
Оценка	6.1	6.1
Ранг	#132	#137
Надежность	10.0	10.0
Стабильность	8.0	8.7
Тестов верно
Доля успешных попыток	50.0%	43.9%
Нестабильные тесты	5	4
Всего запусков	66	66
Стоимость за результат	0.221	1.636
Общая стоимость	$0.019	$0.122
Цена входа	$0.037 / 1M	$0.300 / 1M
Цена выхода	$0.170 / 1M	$1.800 / 1M
Общее число входных токенов	108,747	94,468
Выходные токены	29,772	51,487
Токены рассуждений	68,044	0
Время ответа (среднее)	21.91s	13.56s
Время ответа (макс.)	68.16s	206.05s
Время ответа (суммарно)	328.70s	298.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 gpt-oss-120b

medium

Стоимость: $0.001
Время: 26.7s
Токены: 555 tok

#137 Qwen3.5 Plus 2026-04-20

none

Стоимость: $0.008
Время: 77.0s
Токены: 4,369 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	1,314	3,518	2,177
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	696	557	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	5.9	7.0	55.6%	1		38.37s	7,782	3,365	11,973
Qwen3.5 Plus 2026-04-20	3.9	7.8	11.1%	1		1.69s	7,913	480	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	6.5	10.0	50.0%	0		23.96s	81,198	10,453	22,883
Qwen3.5 Plus 2026-04-20	6.4	5.8	66.7%	1		109.69s	66,908	42,617	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	7,476	241	1,114
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	1,266	6,784	20,606
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	789	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	659	107	387
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	522	119	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	1,036	126	1,799
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	711	68	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,190	1,790	2,264
Qwen3.5 Plus 2026-04-20	6.7	7.9	55.6%	1		1.97s	714	583	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	6,514	287	1,083
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	8,211	297	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	312	3,101	3,758
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		33.34s	210	6,505	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Litenonevsgpt-oss-120bmedium gpt-oss-120bmediumvsInklinglow GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumvsQwen3.6 Flashnone Gemini 3.1 Flash Liteminimalvsgpt-oss-120bmedium Qwen3.5 Plus 2026-04-20nonevsInklinglow gpt-oss-120bmediumvsQwen3.5-Flashnone gpt-oss-120bmediumvsQwen3.5-35B-A3Bnone Gemini 2.5 Flashnonevsgpt-oss-120bmedium Qwen3.5 Plus 2026-04-20nonevsStep 3.5 Flashmedium Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-04-20none Nemotron 3 UltranoneБесплатно доступноvsgpt-oss-120bmedium