डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

GLM 5 Turbo 2.9

विफलता के कारण

विफलता कारण गलत उत्तर के साथ433 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

220/220

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	3.0	5.6	$0.048	0/3	4.87s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 4.87s
#167	Laguna S 2.1 high	Poolside	3.0	5.4	$0.127	0/3	2.56s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 2.56s
#170	Ling-2.6-1T none	Inclusionai	3.0	5.3	$0.016	0/3	1.04s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 1.04s
#176	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.025	0/3	756ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 756ms
#177	Qwen3.5-9B none	Qwen	3.0	5.1	$0.021	0/3	464ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 464ms
#179	North Mini Code none	Cohere	3.0	5.1	$0.000	0/3	14.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 14.7s
#180	MiniMax M2.7 medium	Minimax	3.0	5.0	$0.163	0/3	19.0s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 19.0s
#181	Laguna S 2.1 low	Poolside	3.0	5.0	$0.091	0/3	2.51s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.091 प्रतिक्रिया समय (औसत) 2.51s
#183	GPT-4o-mini none	OpenAI	3.0	5.0	$0.010	0/3	637ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 637ms
#184	Qwen3.6 Plus Preview medium	Qwen	3.0	4.9	$0.000	0/3	22.1s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 22.1s
#187	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.002	0/3	4.95s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.002 प्रतिक्रिया समय (औसत) 4.95s
#193	Hunter Alpha medium	OpenRouter	3.0	4.7	$0.000	0/3	10.5s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 10.5s
#200	Laguna S 2.1 none	Poolside	3.0	4.5	$0.025	0/3	366ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 366ms
#201	Grok 4.20 Beta none	X AI	3.0	4.4	$0.087	0/3	611ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 611ms
#203	Elephant Alpha none	Openrouter	3.0	4.3	$0.000	0/3	927ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 927ms

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल