Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Teste corecte ↓.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Gemini 3.5 Flash 10.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
Total teste 1 Teste greșite 1 Cost total $0.076 Timp de răspuns (mediu) 3.41s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.043 Timp de răspuns (mediu) 1.96s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
Total teste 1 Teste greșite 1 Cost total $1.148 Timp de răspuns (mediu) 149.3s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
Total teste 1 Teste greșite 1 Cost total $0.292 Timp de răspuns (mediu) 29.4s
#65	Kimi K2.7 Code medium	Moonshot AI	3.0	7.0	$0.583	0/1	341.8s
Total teste 1 Teste greșite 1 Cost total $0.583 Timp de răspuns (mediu) 341.8s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
Total teste 1 Teste greșite 1 Cost total $1.079 Timp de răspuns (mediu) 4.87s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 1.07s
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
Total teste 1 Teste greșite 1 Cost total $0.054 Timp de răspuns (mediu) 856ms
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
Total teste 0 Teste greșite 0 Cost total $0.750 Timp de răspuns (mediu) 0ms
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
Total teste 1 Teste greșite 1 Cost total $0.080 Timp de răspuns (mediu) 49.0s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
Total teste 1 Teste greșite 1 Cost total $0.108 Timp de răspuns (mediu) 1.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
Total teste 1 Teste greșite 1 Cost total $0.033 Timp de răspuns (mediu) 113.9s
#73	Mimo V2 Omni medium	Xiaomi	3.0	6.8	$0.683	0/1	234.2s
Total teste 1 Teste greșite 1 Cost total $0.683 Timp de răspuns (mediu) 234.2s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
Total teste 1 Teste greșite 1 Cost total $0.059 Timp de răspuns (mediu) 47.7s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
Total teste 1 Teste greșite 1 Cost total $0.146 Timp de răspuns (mediu) 32.9s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)