सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Qwen3.7 Max 3.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#142	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.007	0/1	8.94s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 8.94s
#143	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.001	0/1	1.06s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.001 प्रतिसाद वेळ (सरासरी) 1.06s
#144	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/1	133.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 133.6s
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.011 प्रतिसाद वेळ (सरासरी) 773ms
#146	MiniMax M2.5 medium	Minimax	3.0	4.7	$0.303	0/1	80.8s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.303 प्रतिसाद वेळ (सरासरी) 80.8s
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.005 प्रतिसाद वेळ (सरासरी) 0ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 399ms
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
एकूण चाचण्या 0 चुकीच्या चाचण्या 0 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 0ms
#150	Laguna M.1 none	Poolside	3.0	4.6	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.011 प्रतिसाद वेळ (सरासरी) 548ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
एकूण चाचण्या 0 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
एकूण चाचण्या 0 चुकीच्या चाचण्या 0 एकूण खर्च $0.057 प्रतिसाद वेळ (सरासरी) 0ms
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms

←

1 9 10 11 12

→

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स