AI BENCHY Compare

LiquidAI: LFM2-24B-A2B vs Tencent: Hy3 preview

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	LFM2-24B-A2B LFM2-24B-A2B none Sortie: 2026-02-24	Hy3 preview Hy3 preview high Sortie: 2026-04-22

Métrique	LFM2-24B-A2B LFM2-24B-A2B none Sortie: 2026-02-24	Hy3 preview Hy3 preview high Sortie: 2026-04-22
Score	4.2	8.0
Rang	#152	#22
Fiabilité	N/D	10.0
Cohérence	9.0	9.5
Tests corrects
Taux de réussite par tentative	18.8%	77.1%
Tests instables	2	1
Exécutions totales	48	60
Coût par résultat	0.024	0.000
Coût total	$0.001	$0.000
Prix d'entrée	$0.030 / 1M	$0.066 / 1M
Prix de sortie	$0.120 / 1M	$0.260 / 1M
Jetons de sortie	1,185	216,503
Jetons de raisonnement	0	0
Temps de réponse (moy.)	811ms	56.77s
Temps de réponse (max)	2.88s	149.94s
Temps de réponse (total)	11.35s	851.49s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	3.3	9.8	0.0%	0		471ms	490	0
Hy3 preview	8.9	10.0	100.0%	0		15.12s	6,839	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0
Hy3 preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	3.0	10.0	0.0%	0		714ms	219	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	5.9	7.2	55.6%	1		287ms	30	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	4.0	10.0	0.0%	0		395ms	72	0
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	6.3	10.0	50.0%	0		1.09s	60	0
Hy3 preview	9.9	10.0	100.0%	0		34.02s	13,331	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	3.7	7.7	11.1%	1		1.69s	314	0
Hy3 preview	10.0	10.0	100.0%	0		29.74s	15,503	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	-	-	-	-	-	-	-	-
Hy3 preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
LFM2-24B-A2B	-	-	-	-	-	-	-	-
Hy3 preview	3.0	10.0	0.0%	0		47.71s	9,092	0

Comparaison rapide

Changer la paire de comparaison

Claude Opus 4.7mediumvsGPT-5.5low GPT-5.4mediumvsQwen3.7 Maxnone GPT-5.2 ChatnonevsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash LiteminimalvsKimi K2.5medium CobuddymediumDisponible gratuitementvsOwl Alphanone GPT-5.4 NanononevsGLM 4.7 Flashmedium DeepSeek V4 FlashhighDisponible gratuitementvsKimi K2.6medium Mistral Small 4mediumvsGrok 4.20none GPT-5.3 ChatnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash LitelowvsGLM 5.1medium