सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Multi Agent Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 0ms
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.679 प्रतिक्रिया समय (औसत) 37.9s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.165 प्रतिक्रिया समय (औसत) 25.6s
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 0ms
#38	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$2.053	0/1	63.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $2.053 प्रतिक्रिया समय (औसत) 63.2s
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 0ms
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.418 प्रतिक्रिया समय (औसत) 30.1s
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.210 प्रतिक्रिया समय (औसत) 14.0s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.148 प्रतिक्रिया समय (औसत) 149.3s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.115 प्रतिक्रिया समय (औसत) 3.94s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.107 प्रतिक्रिया समय (औसत) 6.14s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 4.87s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	1/1	6.27s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.054 प्रतिक्रिया समय (औसत) 6.27s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.960 प्रतिक्रिया समय (औसत) 60.6s
#42	Grok Build 0.1 medium	X AI	3.0	7.6	$0.927	0/1	53.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.927 प्रतिक्रिया समय (औसत) 53.5s

1 2 12

→

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल