Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Flash

Название модели:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в : 2026-02-27 15:16

Сводка

Метрика	StepFun: Step 3.5 Flash medium Релиз: Дата релиза неизвестна Бесплатно доступно	Xiaomi: MiMo-V2-Flash none Релиз: Дата релиза неизвестна
Ранг	#11	#37
Оценка	7.00	3.07
Стабильность	8.32	7.66
Стоимость за результат	0.000	0.690
Общая стоимость	$0.000	$0.021
Тестов верно
Ошибочных тестов	5	11
Доля успешных попыток	73.8%	31.0%
Нестабильные тесты	3	4
Выходные токены	60,502	67,133
Токены рассуждений	117,044	0

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		13,924	17,208
Xiaomi: MiMo-V2-Flash	1.00	7.33	11.1%	1		859	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		535	11,548
Xiaomi: MiMo-V2-Flash	1.00	5.81	16.7%	1		161	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	4.00	7.21	44.4%	1		40,942	74,237
Xiaomi: MiMo-V2-Flash	4.00	7.21	44.4%	1		24	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		2,121	3,274
Xiaomi: MiMo-V2-Flash	5.00	9.99	50.0%	0		63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	2.00	4.96	33.3%	2		2,705	6,975
Xiaomi: MiMo-V2-Flash	2.00	7.36	11.1%	1		65,754	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
StepFun: Step 3.5 Flash	10.00	10.00	100.0%	0		275	3,802
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		272	0

Сменить пару сравнения

Сравнить StepFun: Step 3.5 Flash с...

Сравнить Xiaomi: MiMo-V2-Flash с...