Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↑.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Grok 4.20 Beta 0.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#131	North Mini Code none	Cohere	3.0	5.1	$0.000	0/1	37.4s
Total teste 1 Teste greșite 1 Cost total $0.000 Timp de răspuns (mediu) 37.4s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
Total teste 1 Teste greșite 1 Cost total $3.679 Timp de răspuns (mediu) 37.9s
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.0	8.1	$0.158	0/1	38.5s
Total teste 1 Teste greșite 1 Cost total $0.158 Timp de răspuns (mediu) 38.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 39.9s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
Total teste 1 Teste greșite 1 Cost total $0.323 Timp de răspuns (mediu) 40.2s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
Total teste 1 Teste greșite 1 Cost total $0.457 Timp de răspuns (mediu) 41.0s
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 41.7s
#37	Grok 4.3 medium	X AI	3.0	7.7	$0.614	0/1	44.5s
Total teste 1 Teste greșite 1 Cost total $0.614 Timp de răspuns (mediu) 44.5s
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total teste 1 Teste greșite 1 Cost total $0.010 Timp de răspuns (mediu) 47.3s
#30	Qwen3.6 Plus medium	Qwen	3.0	7.8	$0.294	0/1	47.5s
Total teste 1 Teste greșite 1 Cost total $0.294 Timp de răspuns (mediu) 47.5s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
Total teste 1 Teste greșite 1 Cost total $0.059 Timp de răspuns (mediu) 47.7s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
Total teste 1 Teste greșite 1 Cost total $0.175 Timp de răspuns (mediu) 48.3s
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
Total teste 1 Teste greșite 1 Cost total $0.080 Timp de răspuns (mediu) 49.0s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
Total teste 1 Teste greșite 1 Cost total $0.063 Timp de răspuns (mediu) 51.3s
#36	Qwen3.5-122B-A10B medium	Qwen	3.0	7.7	$0.588	0/1	52.9s
Total teste 1 Teste greșite 1 Cost total $0.588 Timp de răspuns (mediu) 52.9s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)