Clasament modele pentru Cultură generală

Categorie AI BENCHY

Vezi ce modele AI se descurcă cel mai bine la Cultură generală, care rămân fiabile și unde apar cele mai mari diferențe.

Modele afișate

Media pentru Scor Cultură generală

3.1

Cel mai bun model

Gemini 3.5 Flash 10.0

Motive de eșec

Cu motivul de eșec Răspuns greșit133 Cu motivul de eșec Eroare API13 Cu motivul de eșec Fără răspuns8

169/169

Rang	Model	Companie	Scor Cultură generală	Scor	Cost total	Teste corecte	Timp de răspuns (mediu)
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
Total teste 1 Teste greșite 1 Cost total $0.070 Timp de răspuns (mediu) 108.4s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
Total teste 1 Teste greșite 1 Cost total $0.440 Timp de răspuns (mediu) 81.0s
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
Total teste 1 Teste greșite 1 Cost total $0.026 Timp de răspuns (mediu) 1.35s
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 814ms
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
Total teste 1 Teste greșite 1 Cost total $0.028 Timp de răspuns (mediu) 1.46s
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
Total teste 1 Teste greșite 1 Cost total $0.018 Timp de răspuns (mediu) 41.7s
#87	Nemotron 3 Super medium	NVIDIA	3.0	6.3	$0.021	0/1	55.3s
Total teste 1 Teste greșite 1 Cost total $0.021 Timp de răspuns (mediu) 55.3s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
Total teste 1 Teste greșite 1 Cost total $0.033 Timp de răspuns (mediu) 90.1s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
Total teste 1 Teste greșite 1 Cost total $0.401 Timp de răspuns (mediu) 177.4s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
Total teste 1 Teste greșite 1 Cost total $0.231 Timp de răspuns (mediu) 5.01s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
Total teste 1 Teste greșite 1 Cost total $0.385 Timp de răspuns (mediu) 0ms
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total teste 1 Teste greșite 1 Cost total $0.019 Timp de răspuns (mediu) 1.96s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total teste 1 Teste greșite 1 Cost total $0.016 Timp de răspuns (mediu) 1.15s
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 724ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total teste 1 Teste greșite 1 Cost total $0.013 Timp de răspuns (mediu) 733ms

Clasament Cultură generală

Filtrează modelele

Top modele după Scor Cultură generală

Scor Cultură generală vs cost total

Top modele după Timp de răspuns (mediu)