सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Multi Agent Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#29	Qwen3.5-27B medium	Qwen	3.0	7.9	$0.536	0/1	85.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.536 प्रतिक्रिया समय (औसत) 85.1s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.526 प्रतिक्रिया समय (औसत) 30.1s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.523 प्रतिक्रिया समय (औसत) 33.4s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 1.46s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.457 प्रतिक्रिया समय (औसत) 41.0s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.440 प्रतिक्रिया समय (औसत) 81.0s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 4.38s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.401 प्रतिक्रिया समय (औसत) 177.4s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.393 प्रतिक्रिया समय (औसत) 6.89s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 0ms
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.379 प्रतिक्रिया समय (औसत) 2.76s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.376 प्रतिक्रिया समय (औसत) 114.0s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.88s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.348 प्रतिक्रिया समय (औसत) 83.9s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.341 प्रतिक्रिया समय (औसत) 124.8s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल