डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

GLM 5 Turbo 2.9

विफलता के कारण

विफलता कारण गलत उत्तर के साथ421 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

216/216

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#144	Kimi K2.6 none	Moonshot AI	5.3	5.8	$0.184	1/3	1.48s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.184 प्रतिक्रिया समय (औसत) 1.48s
#145	GPT-5.4 none	OpenAI	5.3	5.8	$0.397	1/3	1.07s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.397 प्रतिक्रिया समय (औसत) 1.07s
#153	Mimo V2 PRO none	Xiaomi	5.3	5.6	$0.045	1/3	1.78s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 1.78s
#173	Mistral Small 4 medium	Mistral	5.3	5.1	$0.096	1/3	6.11s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 6.11s
#185	Ring-2.6-1T none	Inclusionai	5.3	4.8	$0.026	1/3	73.4s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 73.4s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	24.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 24.1s
#195	Mercury 2 none	Inception	5.3	4.6	$0.030	1/3	534ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.030 प्रतिक्रिया समय (औसत) 534ms
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	564ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 564ms
#9	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.253 प्रतिक्रिया समय (औसत) 28.1s
#17	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 14.6s
#34	GPT-5.2 Chat none	OpenAI	5.3	8.0	$0.604	1/3	17.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 17.8s
#38	GPT-5.6 Terra high	OpenAI	5.3	8.0	$1.055	1/3	43.4s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.055 प्रतिक्रिया समय (औसत) 43.4s
#43	GPT-5.6 Terra medium	OpenAI	5.3	7.8	$0.676	1/3	23.4s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 23.4s
#45	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $2.077 प्रतिक्रिया समय (औसत) 45.5s
#52	Grok Build 0.1 medium	X AI	5.3	7.6	$1.097	1/3	158.0s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.097 प्रतिक्रिया समय (औसत) 158.0s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल