सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Gemini 3.5 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.115 प्रतिक्रिया समय (औसत) 3.94s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.667 प्रतिक्रिया समय (औसत) 5.50s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.88s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	1/1	6.27s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.054 प्रतिक्रिया समय (औसत) 6.27s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.582 प्रतिक्रिया समय (औसत) 2.75s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.111 प्रतिक्रिया समय (औसत) 2.75s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.523 प्रतिक्रिया समय (औसत) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.907 प्रतिक्रिया समय (औसत) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.165 प्रतिक्रिया समय (औसत) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.679 प्रतिक्रिया समय (औसत) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 14.4s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.960 प्रतिक्रिया समय (औसत) 60.6s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.107 प्रतिक्रिया समय (औसत) 6.14s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.679 प्रतिक्रिया समय (औसत) 2.25s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.324 प्रतिक्रिया समय (औसत) 34.2s

1 2 12

→

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल