सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: एकूण खर्च ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

North Mini Code 3.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#144	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/1	133.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 133.6s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.027 प्रतिसाद वेळ (सरासरी) 3.62s
#23	DeepSeek V4 Flash high	DeepSeek	3.0	8.3	$0.027	0/1	54.5s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.027 प्रतिसाद वेळ (सरासरी) 54.5s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.027 प्रतिसाद वेळ (सरासरी) 1.83s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.027 प्रतिसाद वेळ (सरासरी) 3.90s
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.028 प्रतिसाद वेळ (सरासरी) 1.46s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.028 प्रतिसाद वेळ (सरासरी) 4.03s
#128	Qwen3.6 35B A3B none	Qwen	3.0	5.2	$0.031	0/1	414ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.031 प्रतिसाद वेळ (सरासरी) 414ms
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.032 प्रतिसाद वेळ (सरासरी) 33.3s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 90.1s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 113.9s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.034 प्रतिसाद वेळ (सरासरी) 5.76s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 177.0s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.038 प्रतिसाद वेळ (सरासरी) 1.33s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.043 प्रतिसाद वेळ (सरासरी) 1.96s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स