सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Multi Agent Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 814ms
#126	DeepSeek V3.2 none	DeepSeek	3.0	5.3	$0.017	0/1	17.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 17.2s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 1.89s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 1.11s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 1.15s
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 599ms
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 649ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 724ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 733ms
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 26.5s
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.012 प्रतिक्रिया समय (औसत) 493ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.011 प्रतिक्रिया समय (औसत) 548ms
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.011 प्रतिक्रिया समय (औसत) 773ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 47.3s
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 601ms

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल