सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Grok 4.20 Beta 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 0ms
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 0ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 0ms
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 0ms
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 0ms
#169	LFM2-24B-A2B none	Liquid	0.0	2.4	$0.001	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.001 प्रतिक्रिया समय (औसत) 0ms
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.679 प्रतिक्रिया समय (औसत) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 14.4s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 4.87s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.523 प्रतिक्रिया समय (औसत) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.907 प्रतिक्रिया समय (औसत) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.165 प्रतिक्रिया समय (औसत) 25.6s

1 2 12

→

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल