Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Xiaomi: MiMo-V2-Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17 MiMo-V2-Flash MiMo-V2-Flash medium Релиз: 2025-12-16
Оценка 7.0 7.1
Ранг #78 #77
Надежность 10.0 10.0
Стабильность 9.7 8.7
Тестов верно
Доля успешных попыток 58.3% 63.3%
Нестабильные тесты 1 3
Всего запусков 60 60
Стоимость за результат 2.782 0.345
Общая стоимость $0.306 $0.038
Цена входа $3.000 / 1M $0.100 / 1M
Цена выхода $15.000 / 1M $0.300 / 1M
Выходные токены 9,450 12,458
Токены рассуждений 0 115,182
Время ответа (среднее) 5.27s 20.28s
Время ответа (макс.) 23.84s 96.01s
Время ответа (суммарно) 68.50s 283.87s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.8 10.0 50.0% 0 6.73s 2,112 0
MiMo-V2-Flash 4.1 5.8 33.3% 1 7.20s 456 3,648
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 533 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 864 1,948
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 12 0

Быстрое сравнение

Сменить пару сравнения