डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Claude Sonnet 4.6 2.9

विफलता के कारण

विफलता कारण गलत उत्तर के साथ433 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

220/220

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#157	GLM 5.1 none	Z.ai	2.9	5.5	$0.164	0/3	1.99s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.164 प्रतिक्रिया समय (औसत) 1.99s
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.09s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.09s
#163	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 2.10s
#147	GLM 5 none	Z.ai	3.0	5.7	$0.041	0/3	2.24s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 2.24s
#206	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.33s
#110	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.646 प्रतिक्रिया समय (औसत) 2.36s
#162	Gemma 4 26B A4B none	Google	3.6	5.5	$0.015	0/3	2.49s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 2.49s
#181	Laguna S 2.1 low	Poolside	3.0	5.0	$0.091	0/3	2.51s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.091 प्रतिक्रिया समय (औसत) 2.51s
#167	Laguna S 2.1 high	Poolside	3.0	5.4	$0.127	0/3	2.56s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 2.56s
#164	Laguna S 2.1 medium	Poolside	2.9	5.4	$0.059	0/3	2.75s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.059 प्रतिक्रिया समय (औसत) 2.75s
#154	Owl Alpha none	Openrouter	5.3	5.6	$0.000	1/3	3.00s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.00s
#158	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 3.03s
#69	Gemini 3.1 Flash Lite medium	Google	2.9	7.3	$0.117	0/3	3.16s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.117 प्रतिक्रिया समय (औसत) 3.16s
#121	Gemma 4 31B none	Google	7.7	6.2	$0.021	2/3	3.22s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 3.22s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.548 प्रतिक्रिया समय (औसत) 3.28s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल