Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Xiaomi: MiMo-V2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 medium Релиз: 2026-02-17 MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка 7.8 7.8
Ранг #40 #37
Надежность 10.0 10.0
Стабильность 9.6 8.6
Тестов верно
Доля успешных попыток 70.2% 75.9%
Нестабильные тесты 1 3
Всего запусков 57 54
Стоимость за результат 9.515 2.101
Общая стоимость $1.237 $0.253
???? ????? $3.000 / 1M $0.400 / 1M
???? ?????? $15.000 / 1M $2.000 / 1M
Выходные токены 45,505 2,821
Токены рассуждений 28,370 116,207
Время ответа (среднее) 14.25s 14.40s
Время ответа (макс.) 46.35s 86.93s
Время ответа (суммарно) 156.71s 259.20s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 35.76s 6,894 2,097
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 3,437 1,586
MiMo-V2.5 - - - - - - - -

Быстрое сравнение

Сменить пару сравнения