डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Claude Sonnet 4.6 2.9

विफलता के कारण

विफलता कारण गलत उत्तर के साथ433 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

220/220

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#14	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 3.39s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.661 प्रतिक्रिया समय (औसत) 3.54s
#95	Gemini 3.5 Flash-Lite low	Google	3.6	6.7	$0.145	0/3	3.63s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.145 प्रतिक्रिया समय (औसत) 3.63s
#86	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 3.72s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	3/3	3.96s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.517 प्रतिक्रिया समय (औसत) 3.96s
#101	GLM 5.2 none	Z.ai	5.3	6.6	$0.124	1/3	4.04s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.124 प्रतिक्रिया समय (औसत) 4.04s
#182	DeepSeek V3.2 none	DeepSeek	2.9	5.0	$0.054	0/3	4.17s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 4.17s
#68	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.3	$0.115	0/3	4.21s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.115 प्रतिक्रिया समय (औसत) 4.21s
#161	Kimi K2.5 none	Moonshot AI	5.3	5.5	$0.127	1/3	4.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 4.38s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	5.3	6.1	$0.122	1/3	4.43s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 4.43s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	3.0	5.6	$0.048	0/3	4.87s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 4.87s
#187	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.002	0/3	4.95s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.002 प्रतिक्रिया समय (औसत) 4.95s
#165	KAT-Coder-Air V2.5 low	Kwaipilot	2.9	5.4	$0.041	0/3	4.99s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 4.99s
#12	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	5.24s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.642 प्रतिक्रिया समय (औसत) 5.24s
#202	Laguna M.1 none	Poolside	3.6	4.4	$0.009	0/3	5.50s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 5.50s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल