सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.379 प्रतिक्रिया समय (औसत) 2.76s
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 3.07s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.071 प्रतिक्रिया समय (औसत) 3.08s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.076 प्रतिक्रिया समय (औसत) 3.41s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.539 प्रतिक्रिया समय (औसत) 3.41s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 3.62s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 3.89s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 3.90s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.115 प्रतिक्रिया समय (औसत) 3.94s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.028 प्रतिक्रिया समय (औसत) 4.03s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 4.38s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.316 प्रतिक्रिया समय (औसत) 4.67s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.107 प्रतिक्रिया समय (औसत) 4.81s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 4.87s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 5.01s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल