सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#25	Qwen3.7 Plus medium	Qwen	3.0	8.2	$0.177	0/1	91.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.177 प्रतिक्रिया समय (औसत) 91.1s
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	3.0	7.8	$0.317	0/1	92.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.317 प्रतिक्रिया समय (औसत) 92.6s
#40	MiniMax M3 medium	Minimax	3.0	7.6	$0.131	0/1	100.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.131 प्रतिक्रिया समय (औसत) 100.8s
#28	Qwen3.5 Plus 2026-02-15 medium	Qwen	3.0	8.0	$0.310	0/1	103.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.310 प्रतिक्रिया समय (औसत) 103.8s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.070 प्रतिक्रिया समय (औसत) 108.4s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 113.9s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.376 प्रतिक्रिया समय (औसत) 114.0s
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.020 प्रतिक्रिया समय (औसत) 114.1s
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.288 प्रतिक्रिया समय (औसत) 122.9s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.341 प्रतिक्रिया समय (औसत) 124.8s
#35	Kimi K2.6 medium	Moonshot AI	3.0	7.8	$0.889	0/1	130.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.889 प्रतिक्रिया समय (औसत) 130.3s
#144	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/1	133.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 133.6s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.148 प्रतिक्रिया समय (औसत) 149.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.036 प्रतिक्रिया समय (औसत) 177.0s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.401 प्रतिक्रिया समय (औसत) 177.4s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल