सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Grok 4.20 Beta 0.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.043 प्रतिसाद वेळ (सरासरी) 1.96s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.019 प्रतिसाद वेळ (सरासरी) 1.96s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.075 प्रतिसाद वेळ (सरासरी) 1.97s
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.052 प्रतिसाद वेळ (सरासरी) 2.23s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.679 प्रतिसाद वेळ (सरासरी) 2.25s
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.006 प्रतिसाद वेळ (सरासरी) 2.32s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.058 प्रतिसाद वेळ (सरासरी) 2.34s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.047 प्रतिसाद वेळ (सरासरी) 2.37s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 2.38s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 2.50s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.058 प्रतिसाद वेळ (सरासरी) 2.58s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.068 प्रतिसाद वेळ (सरासरी) 2.68s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.003 प्रतिसाद वेळ (सरासरी) 2.71s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.111 प्रतिसाद वेळ (सरासरी) 2.75s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.582 प्रतिसाद वेळ (सरासरी) 2.75s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स