सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Qwen3.7 Max 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 1.35s
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 0ms
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 814ms
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.028 प्रतिक्रिया समय (औसत) 1.46s
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 41.7s
#87	Nemotron 3 Super medium	NVIDIA	3.0	6.3	$0.021	0/1	55.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 55.3s
#88	Gemma 4 31B medium	Google	3.0	6.3	$0.033	0/1	90.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 90.1s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.401 प्रतिक्रिया समय (औसत) 177.4s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 5.01s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 0ms
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.019 प्रतिक्रिया समय (औसत) 1.96s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 1.15s
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 724ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 0ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.013 प्रतिक्रिया समय (औसत) 733ms

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल