AI BENCHY Compare

Google: Gemini 3.5 Flash vs LiquidAI: LFM2-24B-A2B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-28

Metrică	Gemini 3.5 Flash Gemini 3.5 Flash low Lansare: 2026-05-19	LFM2-24B-A2B LFM2-24B-A2B none Lansare: 2026-02-24

Metrică	Gemini 3.5 Flash Gemini 3.5 Flash low Lansare: 2026-05-19	LFM2-24B-A2B LFM2-24B-A2B none Lansare: 2026-02-24
Scor	9.3	4.2
Rang	#3	#154
Fiabilitate	10.0	N/D
Consistență	10.0	9.4
Teste corecte
Rată de trecere pe încercare	90.0%	16.7%
Teste instabile	0	1
Rulări totale	60	48
Cost per rezultat	1.582	0.024
Cost total	$0.285	$0.001
Preț de intrare	$1.500 / 1M	$0.030 / 1M
Preț de ieșire	$9.000 / 1M	$0.120 / 1M
Tokenuri de ieșire	2,027	1,173
Tokenuri de raționament	23,938	0
Timp de răspuns (mediu)	2.98s	782ms
Timp de răspuns (maxim)	6.44s	3.15s
Timp de răspuns (total)	59.59s	10.94s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	209	2,536
LFM2-24B-A2B	3.3	9.8	0.0%	0		471ms	490	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	6.8	10.0	50.0%	0		5.54s	452	6,839
LFM2-24B-A2B	-	-	-	-	-	-	-	-

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	351	3,050
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	279	1,164
LFM2-24B-A2B	3.0	10.0	0.0%	0		714ms	219	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	12	4,538
LFM2-24B-A2B	5.9	7.2	55.6%	1		287ms	30	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	119	916
LFM2-24B-A2B	4.0	10.0	0.0%	0		395ms	72	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	71	1,652
LFM2-24B-A2B	6.3	10.0	50.0%	0		752ms	60	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	288	2,150
LFM2-24B-A2B	3.8	10.0	0.0%	0		1.78s	302	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	234	403
LFM2-24B-A2B	3.0	10.0	0.0%	0		0ms	0	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	12	690
LFM2-24B-A2B	-	-	-	-	-	-	-	-

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.5 FlashlowvsQwen3.7 Maxmedium Claude Opus 4.7mediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsGPT-5.5medium Claude Opus 4.8mediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsQwen3.6 Max Previewmedium Gemini 3.5 FlashlowvsGPT-5.3-Codexmedium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsQwen3.5 Plus 2026-02-15medium Seed-2.0-LitemediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsQwen3.5-27Bmedium Gemini 3.5 FlashlowvsQwen3.7 Maxnone Gemini 3.5 FlashlowvsGPT-5.4medium