सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Qwen3.7 Max 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 1.07s
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 856ms
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 0ms
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.080 प्रतिक्रिया समय (औसत) 49.0s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 1.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 113.9s
#73	Mimo V2 Omni medium	Xiaomi	3.0	6.8	$0.683	0/1	234.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 234.2s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.059 प्रतिक्रिया समय (औसत) 47.7s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.146 प्रतिक्रिया समय (औसत) 32.9s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.063 प्रतिक्रिया समय (औसत) 51.3s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 82.7s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 26.5s
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.081 प्रतिक्रिया समय (औसत) 20.1s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.070 प्रतिक्रिया समय (औसत) 108.4s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.440 प्रतिक्रिया समय (औसत) 81.0s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल