सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

Kimi K2.7 Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 56.8s
#87	Nemotron 3 Super medium	NVIDIA	3.0	6.3	$0.021	0/1	55.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 55.3s
#23	DeepSeek V4 Flash high	DeepSeek	3.0	8.3	$0.027	0/1	54.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 54.5s
#42	Grok Build 0.1 medium	X AI	3.0	7.6	$0.927	0/1	53.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.927 प्रतिक्रिया समय (औसत) 53.5s
#36	Qwen3.5-122B-A10B medium	Qwen	3.0	7.7	$0.588	0/1	52.9s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.588 प्रतिक्रिया समय (औसत) 52.9s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.063 प्रतिक्रिया समय (औसत) 51.3s
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.080 प्रतिक्रिया समय (औसत) 49.0s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.175 प्रतिक्रिया समय (औसत) 48.3s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.059 प्रतिक्रिया समय (औसत) 47.7s
#30	Qwen3.6 Plus medium	Qwen	3.0	7.8	$0.294	0/1	47.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.294 प्रतिक्रिया समय (औसत) 47.5s
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 47.3s
#37	Grok 4.3 medium	X AI	3.0	7.7	$0.614	0/1	44.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.614 प्रतिक्रिया समय (औसत) 44.5s
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 41.7s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.457 प्रतिक्रिया समय (औसत) 41.0s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.323 प्रतिक्रिया समय (औसत) 40.2s

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल