डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Grok 4.5 3.6

विफलता के कारण

विफलता कारण गलत उत्तर के साथ421 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

216/216

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#205	Hy3 preview none	Tencent	3.6	4.0	$0.003	0/3	17.6s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 17.6s
#207	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/3	357ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 357ms
#208	Grok Build 0.1 none	X AI	3.6	4.0	$0.547	0/3	103.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.547 प्रतिक्रिया समय (औसत) 103.7s
#210	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/3	137.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.036 प्रतिक्रिया समय (औसत) 137.7s
#212	gpt-oss-120b none	OpenAI	3.0	3.7	$0.010	0/3	35.0s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 35.0s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	56.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 56.7s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	3.2	$0.000	0/3	489ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 489ms
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.971 प्रतिक्रिया समय (औसत) 29.1s
#7	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.316 प्रतिक्रिया समय (औसत) 47.9s
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.234 प्रतिक्रिया समय (औसत) 39.5s
#9	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.253 प्रतिक्रिया समय (औसत) 28.1s
#11	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.116 प्रतिक्रिया समय (औसत) 24.9s
#13	GPT-5.5 medium	OpenAI	5.3	9.0	$4.137	1/3	164.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $4.137 प्रतिक्रिया समय (औसत) 164.1s
#16	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 64.3s
#17	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 14.6s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल