Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Ling 2.6 Flash vs Mistral: Mistral Small 4

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-22

Метрика Ling 2.6 Flash Ling 2.6 Flash none Релиз: 2026-04-21 Бесплатно доступно Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16
Оценка 5.4 5.7
Ранг #78 #73
Стабильность 9.5 6.8
Тестов верно
Доля успешных попыток 35.2% 50.0%
Нестабильные тесты 1 7
Всего запусков 52 54
Стоимость за результат 0.000 0.674
Общая стоимость $0.000 $0.034
???? ????? $0.000 / 1M $0.150 / 1M
???? ?????? $0.000 / 1M $0.600 / 1M
Выходные токены 3,338 15,084
Токены рассуждений 0 39,408
Время ответа (среднее) 11.33s 5.64s
Время ответа (макс.) 35.34s 30.49s
Время ответа (суммарно) 203.88s 101.52s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 6.5 10.0 50.0% 0 12.30s 1,064 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 10.0 10.0 100.0% 0 11.21s 381 0
Mistral Small 4 6.7 3.5 66.7% 1 30.49s 2,796 11,296
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 6.5 10.0 50.0% 0 8.48s 246 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 4.94s 20 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 4.1 10.0 0.0% 0 11.85s 106 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 9.8 10.0 100.0% 0 5.52s 81 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 2.9 7.2 11.1% 1 11.55s 142 0
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 Flash 3.0 10.0 0.0% 0 18.80s 229 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810

Быстрое сравнение

Сменить пару сравнения