सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Grok 4.20 Beta 0.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#121	Gemma 4 26B A4B none	Google	3.0	5.5	$0.004	0/1	778ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 778ms
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.032 प्रतिसाद वेळ (सरासरी) 33.3s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.047 प्रतिसाद वेळ (सरासरी) 2.37s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.038 प्रतिसाद वेळ (सरासरी) 1.33s
#125	Qwen3.5-122B-A10B none	Qwen	3.0	5.3	$0.020	0/1	295ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.020 प्रतिसाद वेळ (सरासरी) 295ms
#126	DeepSeek V3.2 none	DeepSeek	3.0	5.3	$0.017	0/1	17.2s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.017 प्रतिसाद वेळ (सरासरी) 17.2s
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.104 प्रतिसाद वेळ (सरासरी) 22.8s
#128	Qwen3.6 35B A3B none	Qwen	3.0	5.2	$0.031	0/1	414ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.031 प्रतिसाद वेळ (सरासरी) 414ms
#129	Mistral Small 4 none	Mistral	3.0	5.1	$0.007	0/1	397ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 397ms
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 601ms
#131	North Mini Code none	Cohere	3.0	5.1	$0.000	0/1	37.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 37.4s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.068 प्रतिसाद वेळ (सरासरी) 5.92s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 3.89s
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.006 प्रतिसाद वेळ (सरासरी) 2.32s
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 777ms

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स