डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ421 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

216/216

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#172	Qwen3 Coder Next none	Qwen	5.3	5.1	$0.025	1/3	962ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 962ms
#173	Mistral Small 4 medium	Mistral	5.3	5.1	$0.096	1/3	6.11s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 6.11s
#176	GLM 5 Turbo none	Z.ai	5.3	5.1	$0.047	1/3	1.97s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 1.97s
#185	Ring-2.6-1T none	Inclusionai	5.3	4.8	$0.026	1/3	73.4s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 73.4s
#189	Trinity Large Preview none	Arcee AI	5.3	4.8	$0.008	1/3	877ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 877ms
#191	Grok 4.1 Fast medium	X AI	5.8	4.7	$0.069	1/3	121.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.069 प्रतिक्रिया समय (औसत) 121.8s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	24.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 24.1s
#193	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.032	1/3	638ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.032 प्रतिक्रिया समय (औसत) 638ms
#195	Mercury 2 none	Inception	5.3	4.6	$0.030	1/3	534ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.030 प्रतिक्रिया समय (औसत) 534ms
#202	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.33s
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	564ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 564ms
#209	Grok 4.1 Fast none	X AI	5.9	3.8	$0.008	1/3	1.06s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 1.06s
#211	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	371ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.004 प्रतिक्रिया समय (औसत) 371ms
#216	LFM2-24B-A2B none	Liquid	5.9	2.2	$0.001	1/3	287ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.001 प्रतिक्रिया समय (औसत) 287ms
#15	Grok 4.5 high	X AI	3.6	8.9	$1.707	0/3	332.1s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $1.707 प्रतिक्रिया समय (औसत) 332.1s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल