AI BENCHY Compare

inclusionAI: Ling-2.6-1T vs OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	Ling-2.6-1T Ling-2.6-1T none Релиз: 2026-04-23	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно

Метрика	Ling-2.6-1T Ling-2.6-1T none Релиз: 2026-04-23	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно
Оценка	4.5	5.4
Ранг	#153	#124
Надежность	Н/Д	10.0
Стабильность	10.0	9.1
Тестов верно
Доля успешных попыток	16.7%	38.6%
Нестабильные тесты	0	2
Всего запусков	60	57
Стоимость за результат	0.000	0.168
Общая стоимость	$0.000	$0.011
Цена входа	$0.075 / 1M	$0.039 / 1M
Цена выхода	$0.625 / 1M	$0.180 / 1M
Выходные токены	2,434	51,664
Токены рассуждений	0	0
Время ответа (среднее)	7.72s	21.61s
Время ответа (макс.)	25.72s	113.71s
Время ответа (суммарно)	139.00s	345.79s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	3.4	10.0	0.0%	0		6.55s	777	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	5.5	10.0	0.0%	0		10.57s	381	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	3.0	10.0	0.0%	0		23.53s	183	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	10.0	10.0	100.0%	0		1.37s	285	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	3.0	10.0	0.0%	0		1.04s	27	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	5.0	10.0	0.0%	0		20.34s	140	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	6.4	10.0	50.0%	0		5.36s	81	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,940	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	3.1	10.0	0.0%	0		5.36s	131	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	3,982	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	3.0	10.0	0.0%	0		25.72s	429	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-1T	0.0	0.0	0.0%	0		0ms	0	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0

Быстрое сравнение

Сменить пару сравнения

Ling-2.6-1TnonevsGLM 4.7 Flashmedium MiniMax M2.5mediumБесплатно доступноvsgpt-oss-120bnoneБесплатно доступно Mistral Small 4mediumvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneБесплатно доступно Ling-2.6-1TnonevsQwen3.5-9Bmedium Ling-2.6-1TnonevsQwen3 Coder Nextmedium Cobuddymediumvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsOwl Alphamedium Nemotron 3 SupermediumБесплатно доступноvsgpt-oss-120bnoneБесплатно доступно gpt-oss-120bnoneБесплатно доступноvsQwen3 Coder Nextmedium Ling-2.6-1TnonevsMiniMax M2.7medium