सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Qwen3.7 Max 3.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 1.07s
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.054 प्रतिसाद वेळ (सरासरी) 856ms
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
एकूण चाचण्या 0 चुकीच्या चाचण्या 0 एकूण खर्च $0.750 प्रतिसाद वेळ (सरासरी) 0ms
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.080 प्रतिसाद वेळ (सरासरी) 49.0s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.108 प्रतिसाद वेळ (सरासरी) 1.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 113.9s
#73	Mimo V2 Omni medium	Xiaomi	3.0	6.8	$0.683	0/1	234.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.683 प्रतिसाद वेळ (सरासरी) 234.2s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.059 प्रतिसाद वेळ (सरासरी) 47.7s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.146 प्रतिसाद वेळ (सरासरी) 32.9s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.063 प्रतिसाद वेळ (सरासरी) 51.3s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.333 प्रतिसाद वेळ (सरासरी) 82.7s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.013 प्रतिसाद वेळ (सरासरी) 26.5s
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.081 प्रतिसाद वेळ (सरासरी) 20.1s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.070 प्रतिसाद वेळ (सरासरी) 108.4s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.440 प्रतिसाद वेळ (सरासरी) 81.0s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स