Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: GPT-5 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика Mistral Small 4 Mistral Small 4 none Релиз: 2026-03-16 GPT-5 Mini GPT-5 Mini medium Релиз: 2025-08-07
Ранг #61 #38
Оценка 5.3 6.8
Стабильность 9.5 8.5
Стоимость за результат 0.108 1.473
Общая стоимость $0.006 $0.118
Тестов верно
Доля успешных попыток 33.3% 58.8%
Нестабильные тесты 1 3
Всего запусков 51 51
Выходные токены 1,624 5,896
Токены рассуждений 0 49,322
Время ответа (среднее) 629ms 24.02s
Время ответа (макс.) 1.72s 88.15s
Время ответа (суммарно) 10.70s 408.39s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
GPT-5 Mini 8.0 6.6 83.3% 1 15.66s 318 4,992
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
GPT-5 Mini 5.6 9.8 33.3% 0 14.09s 1,527 5,760
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600

Быстрое сравнение

Сменить пару сравнения