सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Grok 4.20 Beta 0.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.104 प्रतिसाद वेळ (सरासरी) 22.8s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.069 प्रतिसाद वेळ (सरासरी) 25.5s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $3.165 प्रतिसाद वेळ (सरासरी) 25.6s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.013 प्रतिसाद वेळ (सरासरी) 26.5s
#22	GPT-5.2 medium	OpenAI	3.0	8.4	$0.548	0/1	28.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.548 प्रतिसाद वेळ (सरासरी) 28.2s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.292 प्रतिसाद वेळ (सरासरी) 29.4s
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.418 प्रतिसाद वेळ (सरासरी) 30.1s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.526 प्रतिसाद वेळ (सरासरी) 30.1s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.146 प्रतिसाद वेळ (सरासरी) 32.9s
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.032 प्रतिसाद वेळ (सरासरी) 33.3s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.523 प्रतिसाद वेळ (सरासरी) 33.4s
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.157 प्रतिसाद वेळ (सरासरी) 34.0s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.324 प्रतिसाद वेळ (सरासरी) 34.2s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.547 प्रतिसाद वेळ (सरासरी) 36.1s
#140	Cobuddy medium	Baidu	3.0	4.9	$0.000	0/1	37.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 37.0s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स