सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Kimi K2.7 Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.076 प्रतिक्रिया समय (औसत) 3.41s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.071 प्रतिक्रिया समय (औसत) 3.08s
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 3.07s
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.379 प्रतिक्रिया समय (औसत) 2.76s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.582 प्रतिक्रिया समय (औसत) 2.75s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.111 प्रतिक्रिया समय (औसत) 2.75s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 2.71s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 2.68s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.058 प्रतिक्रिया समय (औसत) 2.58s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.50s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.38s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.37s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.058 प्रतिक्रिया समय (औसत) 2.34s
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.006 प्रतिक्रिया समय (औसत) 2.32s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.679 प्रतिक्रिया समय (औसत) 2.25s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल