डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Claude Sonnet 4.6 2.9

विफलता के कारण

विफलता कारण गलत उत्तर के साथ433 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

220/220

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#208	Laguna Xs.2 medium	Poolside	4.1	4.1	$0.015	0/3	11.1s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 11.1s
#1	Gemini 3.6 Flash medium	Google	8.2	9.9	$0.831	2/3	12.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.831 प्रतिक्रिया समय (औसत) 12.6s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.571 प्रतिक्रिया समय (औसत) 13.0s
#4	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.976 प्रतिक्रिया समय (औसत) 14.1s
#17	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 14.6s
#89	Qwen3.6 Flash medium	Qwen	3.5	6.9	$0.738	0/3	14.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.738 प्रतिक्रिया समय (औसत) 14.6s
#179	North Mini Code none	Cohere	3.0	5.1	$0.000	0/3	14.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 14.7s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	15.3s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.742 प्रतिक्रिया समय (औसत) 15.3s
#146	Nemotron 3 Super medium	NVIDIA	2.9	5.7	$0.055	0/3	16.2s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.055 प्रतिक्रिया समय (औसत) 16.2s
#54	GPT-5.6 Luna medium	OpenAI	5.3	7.6	$0.352	1/3	17.4s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.352 प्रतिक्रिया समय (औसत) 17.4s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	5.3	7.5	$0.437	1/3	17.5s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.437 प्रतिक्रिया समय (औसत) 17.5s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/3	17.5s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.387 प्रतिक्रिया समय (औसत) 17.5s
#209	Hy3 preview none	Tencent	3.6	4.0	$0.003	0/3	17.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 17.6s
#34	GPT-5.2 Chat none	OpenAI	5.3	8.0	$0.604	1/3	17.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 17.8s
#180	MiniMax M2.7 medium	Minimax	3.0	5.0	$0.163	0/3	19.0s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 19.0s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल