Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe. Sortează după: Cost total ↑.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

North Mini Code 3.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.11s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 1.89s
#126	DeepSeek V3.2 none	DeepSeek	3.0	5.3	$0.017	0/1	17.2s
Total teste 1 Teste greșite 1 Cost total $0.017 Timp de răspuns (mediu) 17.2s
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 814ms
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 41.7s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.019 Timp de răspuns (mediu) 1.96s
#125	Qwen3.5-122B-A10B none	Qwen	3.0	5.3	$0.020	0/1	295ms
Total teste 1 Teste greșite 1 Cost total $0.020 Timp de răspuns (mediu) 295ms
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
Total teste 1 Teste greșite 1 Cost total $0.020 Timp de răspuns (mediu) 114.1s
#87	Nemotron 3 Super medium	NVIDIA	3.0	6.3	$0.021	0/1	55.3s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 55.3s
#114	Mimo V2 Omni none	Xiaomi	3.0	5.7	$0.021	0/1	1.30s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 1.30s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 39.9s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
Total teste 1 Teste greșite 1 Cost total $0.023 Timp de răspuns (mediu) 1.21s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 1.07s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Total teste 1 Teste greșite 1 Cost total $0.025 Timp de răspuns (mediu) 1.82s
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
Total teste 1 Teste greșite 1 Cost total $0.026 Timp de răspuns (mediu) 1.35s

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)