सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: एकूण खर्च ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

North Mini Code 3.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	3.0	7.8	$0.317	0/1	92.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.317 प्रतिसाद वेळ (सरासरी) 92.6s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.323 प्रतिसाद वेळ (सरासरी) 40.2s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.324 प्रतिसाद वेळ (सरासरी) 34.2s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.333 प्रतिसाद वेळ (सरासरी) 82.7s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.341 प्रतिसाद वेळ (सरासरी) 124.8s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.348 प्रतिसाद वेळ (सरासरी) 83.9s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.349 प्रतिसाद वेळ (सरासरी) 1.88s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.376 प्रतिसाद वेळ (सरासरी) 114.0s
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.379 प्रतिसाद वेळ (सरासरी) 2.76s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.385 प्रतिसाद वेळ (सरासरी) 0ms
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.393 प्रतिसाद वेळ (सरासरी) 6.89s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.401 प्रतिसाद वेळ (सरासरी) 177.4s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.433 प्रतिसाद वेळ (सरासरी) 4.38s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.440 प्रतिसाद वेळ (सरासरी) 81.0s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.457 प्रतिसाद वेळ (सरासरी) 41.0s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स