डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ421 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

216/216

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#19	Muse Spark 1.1 medium	Meta	3.5	8.6	$1.357	0/3	71.4s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $1.357 प्रतिक्रिया समय (औसत) 71.4s
#22	Qwen3.6 Max Preview medium	Qwen	2.9	8.4	$1.143	0/3	95.9s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $1.143 प्रतिक्रिया समय (औसत) 95.9s
#23	Grok 4.5 low	X AI	3.0	8.4	$0.935	0/3	72.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.935 प्रतिक्रिया समय (औसत) 72.6s
#25	Grok 4.5 medium	X AI	2.9	8.3	$1.928	0/3	198.9s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $1.928 प्रतिक्रिया समय (औसत) 198.9s
#27	Muse Spark 1.1 low	Meta	2.9	8.3	$0.647	0/3	29.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.647 प्रतिक्रिया समय (औसत) 29.7s
#29	GPT-5 Mini medium	OpenAI	3.6	8.1	$0.237	0/3	44.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 44.6s
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $1.694 प्रतिक्रिया समय (औसत) 67.4s
#35	GLM 5.2 high	Z.ai	3.7	8.0	$0.817	0/3	74.0s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.817 प्रतिक्रिया समय (औसत) 74.0s
#40	Qwen3.7 Plus medium	Qwen	3.6	7.9	$0.267	0/3	45.3s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.267 प्रतिक्रिया समय (औसत) 45.3s
#41	Qwen3.6 Plus medium	Qwen	2.9	7.8	$0.405	0/3	29.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.405 प्रतिक्रिया समय (औसत) 29.6s
#42	GLM 5.2 medium	Z.ai	4.1	7.8	$0.187	0/3	45.5s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 45.5s
#44	Claude Sonnet 4.6 medium	Anthropic	2.9	7.8	$2.057	0/3	0ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $2.057 प्रतिक्रिया समय (औसत) 0ms
#46	GLM 5 medium	Z.ai	3.5	7.7	$0.307	0/3	0ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.307 प्रतिक्रिया समय (औसत) 0ms
#47	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$3.059	0/3	83.4s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $3.059 प्रतिक्रिया समय (औसत) 83.4s
#49	DeepSeek V4 Flash high	DeepSeek	4.1	7.7	$0.041	0/3	100.3s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 100.3s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल