AI BENCHY Compare

LiquidAI: LFM2-24B-A2B vs Tencent: Hy3 preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	LFM2-24B-A2B LFM2-24B-A2B none Релиз: 2026-02-24	Hy3 preview Hy3 preview high Релиз: 2026-04-22

Метрика	LFM2-24B-A2B LFM2-24B-A2B none Релиз: 2026-02-24	Hy3 preview Hy3 preview high Релиз: 2026-04-22
Оценка	4.2	8.0
Ранг	#152	#22
Надежность	Н/Д	10.0
Стабильность	9.0	9.5
Тестов верно
Доля успешных попыток	18.8%	77.1%
Нестабильные тесты	2	1
Всего запусков	48	60
Стоимость за результат	0.024	0.000
Общая стоимость	$0.001	$0.000
???? ?????	$0.030 / 1M	$0.066 / 1M
???? ??????	$0.120 / 1M	$0.260 / 1M
Выходные токены	1,185	216,503
Токены рассуждений	0	0
Время ответа (среднее)	811ms	56.77s
Время ответа (макс.)	2.88s	149.94s
Время ответа (суммарно)	11.35s	851.49s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	3.3	9.8	0.0%	0		471ms	490	0
Hy3 preview	8.9	10.0	100.0%	0		15.12s	6,839	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0
Hy3 preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	3.0	10.0	0.0%	0		714ms	219	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	5.9	7.2	55.6%	1		287ms	30	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	4.0	10.0	0.0%	0		395ms	72	0
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	6.3	10.0	50.0%	0		1.09s	60	0
Hy3 preview	9.9	10.0	100.0%	0		34.02s	13,331	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	3.7	7.7	11.1%	1		1.69s	314	0
Hy3 preview	10.0	10.0	100.0%	0		29.74s	15,503	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	-	-	-	-	-	-	-	-
Hy3 preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
LFM2-24B-A2B	-	-	-	-	-	-	-	-
Hy3 preview	3.0	10.0	0.0%	0		47.71s	9,092	0

Быстрое сравнение

Сменить пару сравнения

Claude Opus 4.7mediumvsGPT-5.5low GPT-5.4mediumvsQwen3.7 Maxnone GPT-5.2 ChatnonevsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash LiteminimalvsKimi K2.5medium CobuddymediumБесплатно доступноvsOwl Alphanone GPT-5.4 NanononevsGLM 4.7 Flashmedium DeepSeek V4 FlashhighБесплатно доступноvsKimi K2.6medium Mistral Small 4mediumvsGrok 4.20none GPT-5.3 ChatnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash LitelowvsGLM 5.1medium