Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Timp de răspuns (mediu) ↓.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Kimi K2.7 Code 3.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total teste 1 Teste greșite 1 Cost total $0.052 Timp de răspuns (mediu) 2.23s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total teste 1 Teste greșite 1 Cost total $0.075 Timp de răspuns (mediu) 1.97s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.019 Timp de răspuns (mediu) 1.96s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.043 Timp de răspuns (mediu) 1.96s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 1.89s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
Total teste 1 Teste greșite 0 Cost total $0.349 Timp de răspuns (mediu) 1.88s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
Total teste 1 Teste greșite 1 Cost total $0.027 Timp de răspuns (mediu) 1.83s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 1.82s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
Total teste 1 Teste greșite 1 Cost total $0.108 Timp de răspuns (mediu) 1.76s
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
Total teste 1 Teste greșite 1 Cost total $0.045 Timp de răspuns (mediu) 1.63s
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
Total teste 1 Teste greșite 1 Cost total $0.028 Timp de răspuns (mediu) 1.46s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
Total teste 1 Teste greșite 1 Cost total $0.505 Timp de răspuns (mediu) 1.46s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
Total teste 1 Teste greșite 1 Cost total $0.079 Timp de răspuns (mediu) 1.36s
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
Total teste 1 Teste greșite 1 Cost total $0.026 Timp de răspuns (mediu) 1.35s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
Total teste 1 Teste greșite 1 Cost total $0.038 Timp de răspuns (mediu) 1.33s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)