सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 0ms
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 0ms
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 0ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 0ms
#113	Qwen3.6 Plus Preview medium	Qwen	3.0	5.8	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 0ms
#138	Laguna M.1 medium	Poolside	3.0	5.0	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.005 प्रतिक्रिया समय (औसत) 0ms
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 0ms
#150	Laguna M.1 none	Poolside	3.0	4.6	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 0ms

1 2 12

→

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल