सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Kimi K2.7 Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.23s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.075 प्रतिक्रिया समय (औसत) 1.97s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.019 प्रतिक्रिया समय (औसत) 1.96s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 1.96s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 1.89s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.88s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 1.83s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 1.82s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 1.76s
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 1.63s
#85	Gemini 3.1 Flash Lite low	Google	3.0	6.4	$0.028	0/1	1.46s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.028 प्रतिक्रिया समय (औसत) 1.46s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 1.46s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.079 प्रतिक्रिया समय (औसत) 1.36s
#82	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.026	0/1	1.35s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 1.35s
#124	GPT-5.4 Mini none	OpenAI	3.0	5.3	$0.038	0/1	1.33s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.038 प्रतिक्रिया समय (औसत) 1.33s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल