सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Kimi K2.7 Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.107 प्रतिक्रिया समय (औसत) 6.14s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 5.92s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.034 प्रतिक्रिया समय (औसत) 5.76s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.667 प्रतिक्रिया समय (औसत) 5.50s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 5.01s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 4.87s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.107 प्रतिक्रिया समय (औसत) 4.81s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.316 प्रतिक्रिया समय (औसत) 4.67s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 4.38s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.028 प्रतिक्रिया समय (औसत) 4.03s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.115 प्रतिक्रिया समय (औसत) 3.94s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 3.90s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 3.89s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 3.62s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.539 प्रतिक्रिया समय (औसत) 3.41s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल