सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

North Mini Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	3.0	7.8	$0.317	0/1	92.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.317 प्रतिक्रिया समय (औसत) 92.6s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.323 प्रतिक्रिया समय (औसत) 40.2s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.324 प्रतिक्रिया समय (औसत) 34.2s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 82.7s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.341 प्रतिक्रिया समय (औसत) 124.8s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.348 प्रतिक्रिया समय (औसत) 83.9s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.88s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.376 प्रतिक्रिया समय (औसत) 114.0s
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.379 प्रतिक्रिया समय (औसत) 2.76s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 0ms
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.393 प्रतिक्रिया समय (औसत) 6.89s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.401 प्रतिक्रिया समय (औसत) 177.4s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 4.38s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.440 प्रतिक्रिया समय (औसत) 81.0s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.457 प्रतिक्रिया समय (औसत) 41.0s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल