सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Gemini 3.5 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.288 प्रतिक्रिया समय (औसत) 122.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 84.0s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 1.46s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 56.8s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 12.5s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.609 प्रतिक्रिया समय (औसत) 63.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 39.9s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.316 प्रतिक्रिया समय (औसत) 4.67s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.457 प्रतिक्रिया समय (औसत) 41.0s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.539 प्रतिक्रिया समय (औसत) 3.41s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.034 प्रतिक्रिया समय (औसत) 5.76s
#59	Gemma 4 26B A4B medium	Google	3.0	7.2	$0.045	0/1	180.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 180.9s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.023 प्रतिक्रिया समय (औसत) 1.21s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.076 प्रतिक्रिया समय (औसत) 3.41s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 1.96s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल