सामान्य ज्ञान मॉडेल क्रमवारी

AI BENCHY श्रेणी

सामान्य ज्ञान मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी सामान्य ज्ञान स्कोअर

3.1

सर्वोत्तम मॉडेल

Grok 4.20 Beta 0.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह133 अयशस्वी होण्याचे कारण API त्रुटी सह13 अयशस्वी होण्याचे कारण उत्तर नाही सह8

169/169

क्रमांक	मॉडेल	कंपनी	सामान्य ज्ञान स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.016 प्रतिसाद वेळ (सरासरी) 1.15s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.023 प्रतिसाद वेळ (सरासरी) 1.21s
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 1.25s
#114	Mimo V2 Omni none	Xiaomi	3.0	5.7	$0.021	0/1	1.30s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.021 प्रतिसाद वेळ (सरासरी) 1.30s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.038 प्रतिसाद वेळ (सरासरी) 1.33s
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 1.35s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.079 प्रतिसाद वेळ (सरासरी) 1.36s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.505 प्रतिसाद वेळ (सरासरी) 1.46s
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.028 प्रतिसाद वेळ (सरासरी) 1.46s
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.045 प्रतिसाद वेळ (सरासरी) 1.63s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.108 प्रतिसाद वेळ (सरासरी) 1.76s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 1.82s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.027 प्रतिसाद वेळ (सरासरी) 1.83s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.349 प्रतिसाद वेळ (सरासरी) 1.88s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.017 प्रतिसाद वेळ (सरासरी) 1.89s

सामान्य ज्ञान क्रमवारी

मॉडेल फिल्टर करा

सामान्य ज्ञान स्कोअर नुसार शीर्ष मॉडेल्स

सामान्य ज्ञान स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स