सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Qwen3.7 Max 3.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.523 प्रतिसाद वेळ (सरासरी) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.907 प्रतिसाद वेळ (सरासरी) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $3.165 प्रतिसाद वेळ (सरासरी) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $3.679 प्रतिसाद वेळ (सरासरी) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.740 प्रतिसाद वेळ (सरासरी) 14.4s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.960 प्रतिसाद वेळ (सरासरी) 60.6s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.107 प्रतिसाद वेळ (सरासरी) 6.14s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.679 प्रतिसाद वेळ (सरासरी) 2.25s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.324 प्रतिसाद वेळ (सरासरी) 34.2s
#15	GLM 5 medium	Z.ai	3.0	8.6	$0.228	0/1	67.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.228 प्रतिसाद वेळ (सरासरी) 67.4s
#16	GPT-5 Mini medium	OpenAI	3.0	8.5	$0.159	0/1	9.99s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.159 प्रतिसाद वेळ (सरासरी) 9.99s
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.210 प्रतिसाद वेळ (सरासरी) 14.0s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.175 प्रतिसाद वेळ (सरासरी) 48.3s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.393 प्रतिसाद वेळ (सरासरी) 6.89s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.376 प्रतिसाद वेळ (सरासरी) 114.0s

1 2 12

→

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स