Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Ling 2.6 1t vs Mistral: Mistral Small 4

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-23

Метрика Ling 2.6 1t Ling 2.6 1t none Релиз: 2026-04-23 Бесплатно доступно Mistral Small 4 Mistral Small 4 medium Релиз: 2026-03-16
Оценка 4.5 5.7
Ранг #105 #79
Стабильность 10.0 6.8
Тестов верно
Доля успешных попыток 16.7% 50.0%
Нестабильные тесты 0 7
Всего запусков 54 54
Стоимость за результат 0.000 0.674
Общая стоимость $0.000 $0.034
???? ????? $0.000 / 1M $0.150 / 1M
???? ?????? $0.000 / 1M $0.600 / 1M
Выходные токены 2,434 15,084
Токены рассуждений 0 39,408
Время ответа (среднее) 8.79s 5.64s
Время ответа (макс.) 25.72s 30.49s
Время ответа (суммарно) 158.19s 101.52s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 3.4 10.0 0.0% 0 6.55s 777 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 5.5 10.0 0.0% 0 10.57s 381 0
Mistral Small 4 6.7 3.5 66.7% 1 30.49s 2,796 11,296
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 3.0 10.0 0.0% 0 23.53s 183 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 10.0 10.0 100.0% 0 1.37s 285 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 3.0 10.0 0.0% 0 1.04s 27 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 5.0 10.0 0.0% 0 20.34s 140 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 6.4 10.0 50.0% 0 5.36s 81 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 3.1 10.0 0.0% 0 11.76s 131 0
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Ling 2.6 1t 3.0 10.0 0.0% 0 25.72s 429 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810

Быстрое сравнение

Сменить пару сравнения