सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Gemini 3.5 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.036 प्रतिक्रिया समय (औसत) 177.0s
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.020 प्रतिक्रिया समय (औसत) 114.1s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $3.679 प्रतिक्रिया समय (औसत) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 14.4s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 4.87s
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 0ms
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 0ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 0ms
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 0ms

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल