सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Gemini 3.5 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.115 प्रतिसाद वेळ (सरासरी) 3.94s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.667 प्रतिसाद वेळ (सरासरी) 5.50s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.349 प्रतिसाद वेळ (सरासरी) 1.88s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	1/1	6.27s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.054 प्रतिसाद वेळ (सरासरी) 6.27s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.582 प्रतिसाद वेळ (सरासरी) 2.75s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.111 प्रतिसाद वेळ (सरासरी) 2.75s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.523 प्रतिसाद वेळ (सरासरी) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.907 प्रतिसाद वेळ (सरासरी) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $3.165 प्रतिसाद वेळ (सरासरी) 25.6s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.960 प्रतिसाद वेळ (सरासरी) 60.6s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.107 प्रतिसाद वेळ (सरासरी) 6.14s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.679 प्रतिसाद वेळ (सरासरी) 2.25s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.324 प्रतिसाद वेळ (सरासरी) 34.2s
#15	GLM 5 medium	Z.ai	3.0	8.6	$0.228	0/1	67.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.228 प्रतिसाद वेळ (सरासरी) 67.4s
#16	GPT-5 Mini medium	OpenAI	3.0	8.5	$0.159	0/1	9.99s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.159 प्रतिसाद वेळ (सरासरी) 9.99s

1 2 12

→

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स