सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Multi Agent Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.0	8.1	$0.158	0/1	38.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.158 प्रतिक्रिया समय (औसत) 38.5s
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.157 प्रतिक्रिया समय (औसत) 34.0s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.146 प्रतिक्रिया समय (औसत) 32.9s
#40	MiniMax M3 medium	Minimax	3.0	7.6	$0.131	0/1	100.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.131 प्रतिक्रिया समय (औसत) 100.8s
#112	GPT-5.4 none	OpenAI	3.0	5.8	$0.122	0/1	990ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 990ms
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.111 प्रतिक्रिया समय (औसत) 2.75s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 1.76s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.107 प्रतिक्रिया समय (औसत) 4.81s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 12.5s
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.104 प्रतिक्रिया समय (औसत) 22.8s
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 0ms
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.081 प्रतिक्रिया समय (औसत) 20.1s
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.080 प्रतिक्रिया समय (औसत) 49.0s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.079 प्रतिक्रिया समय (औसत) 1.36s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.076 प्रतिक्रिया समय (औसत) 3.41s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल