सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Gemini 3.5 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.148 प्रतिक्रिया समय (औसत) 149.3s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.292 प्रतिक्रिया समय (औसत) 29.4s
#65	Kimi K2.7 Code medium	Moonshot AI	3.0	7.0	$0.583	0/1	341.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.583 प्रतिक्रिया समय (औसत) 341.8s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 1.07s
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 856ms
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.080 प्रतिक्रिया समय (औसत) 49.0s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 1.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 113.9s
#73	Mimo V2 Omni medium	Xiaomi	3.0	6.8	$0.683	0/1	234.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 234.2s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.059 प्रतिक्रिया समय (औसत) 47.7s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.146 प्रतिक्रिया समय (औसत) 32.9s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.063 प्रतिक्रिया समय (औसत) 51.3s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 82.7s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 26.5s
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.081 प्रतिक्रिया समय (औसत) 20.1s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल