Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Plus vs Xiaomi: MiMo-V2-Flash

Сводка

Сравнение benchmark Qwen3.7 Plus vs MiMo-V2-Flash: Qwen3.7 Plus лидирует по среднему баллу: 7.2 vs 7.1. Qwen3.7 Plus имеет более низкую стоимость benchmark: $0.023 vs $0.043. Qwen3.7 Plus быстрее: 2.85s vs 20.11s, с долей успешных попыток 47.6% vs 65.1%.

Рекомендуемая модель: Qwen3.7 Plus - Здесь у него лучший балл (7.2), при этом он примерно в 1.9 раза дешевле, чем MiMo-V2-Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03 MiMo-V2-Flash MiMo-V2-Flash medium Релиз: 2025-12-16
Оценка 7.2 7.1
Ранг #61 #62
Надежность 10.0 10.0
Стабильность 10.0 8.8
Тестов верно
Доля успешных попыток 47.6% 65.1%
Нестабильные тесты 0 3
Всего запусков 63 63
Стоимость за результат 0.276 0.343
Общая стоимость $0.023 $0.043
Цена входа $0.320 / 1M $0.100 / 1M
Цена выхода $1.280 / 1M $0.300 / 1M
Общее число входных токенов 42,510 40,111
Выходные токены 6,578 12,476
Токены рассуждений 0 125,039
Время ответа (среднее) 2.85s 20.11s
Время ответа (макс.) 29.38s 96.01s
Время ответа (суммарно) 59.86s 301.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

#62 MiMo-V2-Flash

medium
Invalid SVG
Cost
$0.020
Time
284.1s
Tokens
65,689 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

Быстрое сравнение

Сменить пару сравнения