Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Grok 4.20 Beta 0.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.043 Timp de răspuns (mediu) 1.96s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.019 Timp de răspuns (mediu) 1.96s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total teste 1 Teste greșite 1 Cost total $0.075 Timp de răspuns (mediu) 1.97s
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total teste 1 Teste greșite 1 Cost total $0.052 Timp de răspuns (mediu) 2.23s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
Total teste 1 Teste greșite 1 Cost total $0.679 Timp de răspuns (mediu) 2.25s
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
Total teste 1 Teste greșite 1 Cost total $0.006 Timp de răspuns (mediu) 2.32s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
Total teste 1 Teste greșite 1 Cost total $0.058 Timp de răspuns (mediu) 2.34s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
Total teste 1 Teste greșite 1 Cost total $0.047 Timp de răspuns (mediu) 2.37s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 2.38s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 2.50s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
Total teste 1 Teste greșite 1 Cost total $0.058 Timp de răspuns (mediu) 2.58s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
Total teste 1 Teste greșite 1 Cost total $0.068 Timp de răspuns (mediu) 2.68s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Total teste 1 Teste greșite 1 Cost total $0.003 Timp de răspuns (mediu) 2.71s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
Total teste 1 Teste greșite 0 Cost total $0.111 Timp de răspuns (mediu) 2.75s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
Total teste 1 Teste greșite 0 Cost total $0.582 Timp de răspuns (mediu) 2.75s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)