सामान्य ज्ञान मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि सामान्य ज्ञान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: कुल लागत ↑.

दिखाए गए मॉडल

औसत सामान्य ज्ञान स्कोर

3.1

सर्वश्रेष्ठ मॉडल

North Mini Code 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ133 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ8

169/169

रैंक	मॉडल	कंपनी	सामान्य ज्ञान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.069 प्रतिक्रिया समय (औसत) 25.5s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.070 प्रतिक्रिया समय (औसत) 108.4s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.071 प्रतिक्रिया समय (औसत) 3.08s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.075 प्रतिक्रिया समय (औसत) 1.97s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.076 प्रतिक्रिया समय (औसत) 3.41s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.079 प्रतिक्रिया समय (औसत) 1.36s
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.080 प्रतिक्रिया समय (औसत) 49.0s
#79	GPT-5 Nano medium	OpenAI	3.0	6.7	$0.081	0/1	20.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.081 प्रतिक्रिया समय (औसत) 20.1s
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
कुल टेस्ट 0 गलत टेस्ट 0 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 0ms
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.104 प्रतिक्रिया समय (औसत) 22.8s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 12.5s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.107 प्रतिक्रिया समय (औसत) 4.81s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 1.76s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.111 प्रतिक्रिया समय (औसत) 2.75s
#112	GPT-5.4 none	OpenAI	3.0	5.8	$0.122	0/1	990ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 990ms

सामान्य ज्ञान रैंकिंग

मॉडल फ़िल्टर करें

सामान्य ज्ञान स्कोर के अनुसार शीर्ष मॉडल

सामान्य ज्ञान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल