inclusionAI: Ling-2.6-flash vs Mistral: Mistral Small 4

Mistral Small 4 (medium) лидирует по среднему баллу: 5.1 vs 4.9. Ling-2.6-flash имеет более низкую стоимость benchmark: $0.002 vs $0.096. Ling-2.6-flash быстрее: 10.68s vs 10.77s, с долей успешных попыток 30.3% vs 42.4%.

Рекомендуемая модельMistral Small 4 (medium)У него самый высокий балл в этом сравнении (5.1) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-21

Метрика	Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16

Метрика	Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21	Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16
Оценка	4.9	5.1
Ранг	#184	#173
Надежность	10.0	10.0
Стабильность	9.3	7.0
Тестов верно
Доля успешных попыток	30.3%	42.4%
Нестабильные тесты	2	8
Всего запусков	66	66
Стоимость за результат	0.024	1.913
Общая стоимость	$0.002	$0.096
Цена входа	$0.010 / 1M	$0.150 / 1M
Цена выхода	$0.030 / 1M	$0.600 / 1M
Общее число входных токенов	114,375	140,494
Выходные токены	14,903	39,462
Токены рассуждений	0	92,362
Время ответа (среднее)	10.68s	10.77s
Время ответа (макс.)	36.03s	59.15s
Время ответа (суммарно)	213.51s	236.94s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#184 Ling-2.6-flash

none

Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash

Стоимость: $0.000
Время: 0.0s
Токены: 0 tok

#173 Mistral Small 4

medium

Стоимость: $0.006
Время: 47.9s
Токены: 9,857 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	726	573	0
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	708	4,055	4,778

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	5.3	10.0	33.3%	0		11.21s	813	381	0
Mistral Small 4	4.4	5.1	33.3%	2		39.98s	7,636	11,635	54,715

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		35.69s	94,475	13,094	0
Mistral Small 4	3.0	10.0	0.0%	0		32.40s	116,624	17,890	18,384

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	8,004	246	0
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	6,171	335	723

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	810	24	0
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	742	2,621	6,904

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	540	109	0
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	519	821	828

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	732	81	0
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	729	540	1,031

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	729	151	0
Mistral Small 4	3.4	9.7	0.0%	0		2.17s	735	1,226	2,632

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	7,324	229	0
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	6,420	321	810

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	222	15	0
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	210	18	1,557

Быстрое сравнение

Сменить пару сравнения