सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#42	Grok Build 0.1 medium	X AI	3.0	7.6	$0.927	0/1	53.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.927 प्रतिक्रिया समय (औसत) 53.5s
#23	DeepSeek V4 Flash high	DeepSeek	3.0	8.3	$0.027	0/1	54.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 54.5s
#87	Nemotron 3 Super medium	NVIDIA	3.0	6.3	$0.021	0/1	55.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 55.3s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 56.8s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.960 प्रतिक्रिया समय (औसत) 60.6s
#38	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$2.053	0/1	63.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $2.053 प्रतिक्रिया समय (औसत) 63.2s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.609 प्रतिक्रिया समय (औसत) 63.5s
#15	GLM 5 medium	Z.ai	3.0	8.6	$0.228	0/1	67.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.228 प्रतिक्रिया समय (औसत) 67.4s
#146	MiniMax M2.5 medium	Minimax	3.0	4.7	$0.303	0/1	80.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.303 प्रतिक्रिया समय (औसत) 80.8s
#81	Qwen3.6 27B medium	Qwen	3.0	6.6	$0.440	0/1	81.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.440 प्रतिक्रिया समय (औसत) 81.0s
#77	Mimo V2 PRO medium	Xiaomi	3.0	6.7	$0.333	0/1	82.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 82.7s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.348 प्रतिक्रिया समय (औसत) 83.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 84.0s
#29	Qwen3.5-27B medium	Qwen	3.0	7.9	$0.536	0/1	85.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.536 प्रतिक्रिया समय (औसत) 85.1s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 90.1s

←

1 9 10 11 12

→

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल