सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.667 प्रतिक्रिया समय (औसत) 5.50s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.034 प्रतिक्रिया समय (औसत) 5.76s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 5.92s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.107 प्रतिक्रिया समय (औसत) 6.14s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	1/1	6.27s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.054 प्रतिक्रिया समय (औसत) 6.27s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.393 प्रतिक्रिया समय (औसत) 6.89s
#142	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.007	0/1	8.94s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 8.94s
#16	GPT-5 Mini medium	OpenAI	3.0	8.5	$0.159	0/1	9.99s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.159 प्रतिक्रिया समय (औसत) 9.99s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.907 प्रतिक्रिया समय (औसत) 10.1s
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 11.1s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 12.5s
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.210 प्रतिक्रिया समय (औसत) 14.0s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 14.4s
#126	DeepSeek V3.2 none	DeepSeek	3.0	5.3	$0.017	0/1	17.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 17.2s
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.081 प्रतिक्रिया समय (औसत) 20.1s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल