डोमेन-विशिष्ट मॉडल रैंकिंग

देखें कि डोमेन-विशिष्ट में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत डोमेन-विशिष्ट स्कोर

4.7

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ412 विफलता कारण समय समाप्त के साथ43 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ17 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण API त्रुटि के साथ7 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

210/210

रैंक	मॉडल	कंपनी	डोमेन-विशिष्ट स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#110	Gemma 4 31B medium	Google	7.7	6.3	$0.163	2/3	38.5s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 38.5s
#115	Gemma 4 31B none	Google	7.7	6.2	$0.035	2/3	3.22s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.035 प्रतिक्रिया समय (औसत) 3.22s
#125	Qwen3.5-Flash none	Qwen	7.7	6.1	$0.073	2/3	905ms
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.073 प्रतिक्रिया समय (औसत) 905ms
#127	Qwen3.5-35B-A3B none	Qwen	7.7	6.1	$0.106	2/3	485ms
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 485ms
#152	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 3.03s
#176	GLM 4.7 Flash none	Z.ai	7.7	4.9	$0.016	2/3	744ms
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 744ms
#2	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.976 प्रतिक्रिया समय (औसत) 14.1s
#79	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 10.6s
#4	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.316 प्रतिक्रिया समय (औसत) 47.9s
#8	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.116 प्रतिक्रिया समय (औसत) 24.9s
#13	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 64.3s
#21	GPT-5.2 medium	OpenAI	5.9	8.4	$0.951	1/3	77.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 77.8s
#25	Gemini 2.5 Flash medium	Google	5.9	8.2	$0.643	1/3	37.3s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.643 प्रतिक्रिया समय (औसत) 37.3s
#35	Seed-2.0-Lite medium	Bytedance Seed	5.9	7.9	$0.234	1/3	88.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 88.7s
#53	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.138 प्रतिक्रिया समय (औसत) 38.2s

डोमेन-विशिष्ट रैंकिंग

मॉडल फ़िल्टर करें

डोमेन-विशिष्ट स्कोर के अनुसार शीर्ष मॉडल

डोमेन-विशिष्ट स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल