डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Grok 4.5 3.6

विफलता के कारण

विफलता कारण गलत उत्तर के साथ421 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

216/216

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#183	Nemotron 3 Super none	NVIDIA	3.6	4.9	$0.008	0/3	6.23s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 6.23s
#184	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.002	0/3	4.95s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.002 प्रतिक्रिया समय (औसत) 4.95s
#186	GPT-5.4 Nano none	OpenAI	2.9	4.8	$0.041	0/3	926ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 926ms
#187	Grok 4.20 Multi Agent Beta medium	X AI	2.9	4.8	$5.599	0/3	24.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 24.7s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	2.9	4.8	$0.067	0/3	6.24s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.067 प्रतिक्रिया समय (औसत) 6.24s
#190	Hunter Alpha medium	OpenRouter	3.0	4.7	$0.000	0/3	10.5s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 10.5s
#194	Cobuddy medium	Baidu	2.9	4.7	$0.000	0/3	128.2s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 128.2s
#196	MiniMax M2.5 medium	Minimax	2.9	4.6	$0.340	0/3	237.3s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.340 प्रतिक्रिया समय (औसत) 237.3s
#197	Grok 4.20 Beta none	X AI	3.0	4.4	$0.087	0/3	611ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 611ms
#198	Laguna M.1 none	Poolside	3.6	4.4	$0.009	0/3	5.50s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 5.50s
#199	Elephant Alpha none	Openrouter	3.0	4.3	$0.000	0/3	927ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 927ms
#200	GLM 4.7 Flash medium	Z.ai	3.5	4.3	$0.166	0/3	174.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.166 प्रतिक्रिया समय (औसत) 174.6s
#201	Elephant Alpha medium	Openrouter	3.0	4.3	$0.000	0/3	925ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 925ms
#203	Grok 4.20 none	X AI	3.0	4.1	$0.057	0/3	687ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 687ms
#204	Laguna Xs.2 medium	Poolside	4.1	4.1	$0.015	0/3	11.1s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 11.1s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल