सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Kimi K2.7 Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#28	Qwen3.5 Plus 2026-02-15 medium	Qwen	3.0	8.0	$0.310	0/1	103.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.310 प्रतिक्रिया समय (औसत) 103.8s
#40	MiniMax M3 medium	Minimax	3.0	7.6	$0.131	0/1	100.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.131 प्रतिक्रिया समय (औसत) 100.8s
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	3.0	7.8	$0.317	0/1	92.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.317 प्रतिक्रिया समय (औसत) 92.6s
#25	Qwen3.7 Plus medium	Qwen	3.0	8.2	$0.177	0/1	91.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.177 प्रतिक्रिया समय (औसत) 91.1s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 90.1s
#29	Qwen3.5-27B medium	Qwen	3.0	7.9	$0.536	0/1	85.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.536 प्रतिक्रिया समय (औसत) 85.1s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 84.0s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.348 प्रतिक्रिया समय (औसत) 83.9s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 82.7s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.440 प्रतिक्रिया समय (औसत) 81.0s
#146	MiniMax M2.5 medium	Minimax	3.0	4.7	$0.303	0/1	80.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.303 प्रतिक्रिया समय (औसत) 80.8s
#15	GLM 5 medium	Z.ai	3.0	8.6	$0.228	0/1	67.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.228 प्रतिक्रिया समय (औसत) 67.4s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.609 प्रतिक्रिया समय (औसत) 63.5s
#38	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$2.053	0/1	63.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $2.053 प्रतिक्रिया समय (औसत) 63.2s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.960 प्रतिक्रिया समय (औसत) 60.6s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल