सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Multi Agent Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.075 प्रतिक्रिया समय (औसत) 1.97s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.071 प्रतिक्रिया समय (औसत) 3.08s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.070 प्रतिक्रिया समय (औसत) 108.4s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.069 प्रतिक्रिया समय (औसत) 25.5s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 2.68s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 5.92s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.063 प्रतिक्रिया समय (औसत) 51.3s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.059 प्रतिक्रिया समय (औसत) 47.7s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.058 प्रतिक्रिया समय (औसत) 2.34s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.058 प्रतिक्रिया समय (औसत) 2.58s
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 0ms
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 856ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 11.1s
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.23s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.37s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल