उत्तर नाही अपयश क्रमवारी

कोणत्या AI मॉडेल्सना उत्तर नाही सर्वाधिक वेळा येतो ते पाहा, म्हणजे निवडण्यापूर्वी विश्वासार्हतेचे धोके लक्षात येतील. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

एकूण अपयशे

सर्वाधिक प्रभावित मॉडेल

Qwen3.5-9B 2

श्रेणी

67/67

क्रमांक	मॉडेल	कंपनी	उत्तर नाही संख्या	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#138	Kimi K2.6 none	Moonshot AI	1	5.8	$0.184	7/22	19.6s
एकूण चाचण्या 22 चुकीच्या चाचण्या 15 एकूण खर्च $0.184 प्रतिसाद वेळ (सरासरी) 19.6s
#151	GLM 5.1 none	Z.ai	1	5.5	$0.164	7/22	6.70s
एकूण चाचण्या 22 चुकीच्या चाचण्या 15 एकूण खर्च $0.164 प्रतिसाद वेळ (सरासरी) 6.70s
#112	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
एकूण चाचण्या 22 चुकीच्या चाचण्या 14 एकूण खर्च $0.548 प्रतिसाद वेळ (सरासरी) 6.04s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
एकूण चाचण्या 22 चुकीच्या चाचण्या 14 एकूण खर्च $0.066 प्रतिसाद वेळ (सरासरी) 4.40s
#132	GPT-5.6 Terra none	OpenAI	1	6.0	$0.349	8/22	1.65s
एकूण चाचण्या 22 चुकीच्या चाचण्या 14 एकूण खर्च $0.349 प्रतिसाद वेळ (सरासरी) 1.65s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
एकूण चाचण्या 22 चुकीच्या चाचण्या 14 एकूण खर्च $0.050 प्रतिसाद वेळ (सरासरी) 52.0s
#97	LongCat 2.0 high	Meituan	2	6.6	$0.469	9/22	148.7s
एकूण चाचण्या 22 चुकीच्या चाचण्या 13 एकूण खर्च $0.469 प्रतिसाद वेळ (सरासरी) 148.7s
#102	Laguna XS 2.1 medium	Poolside	1	6.5	$0.068	9/22	47.9s
एकूण चाचण्या 22 चुकीच्या चाचण्या 13 एकूण खर्च $0.068 प्रतिसाद वेळ (सरासरी) 47.9s
#122	Gemini 3.1 Flash Lite none	Google	1	6.1	$0.046	9/22	1.75s
एकूण चाचण्या 22 चुकीच्या चाचण्या 13 एकूण खर्च $0.046 प्रतिसाद वेळ (सरासरी) 1.75s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
एकूण चाचण्या 22 चुकीच्या चाचण्या 13 एकूण खर्च $0.114 प्रतिसाद वेळ (सरासरी) 54.9s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
एकूण चाचण्या 22 चुकीच्या चाचण्या 12 एकूण खर्च $0.200 प्रतिसाद वेळ (सरासरी) 79.1s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
एकूण चाचण्या 22 चुकीच्या चाचण्या 12 एकूण खर्च $0.600 प्रतिसाद वेळ (सरासरी) 99.0s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
एकूण चाचण्या 22 चुकीच्या चाचण्या 12 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 100.3s
#99	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
एकूण चाचण्या 22 चुकीच्या चाचण्या 12 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 106.3s
#120	Gemini 3.1 Flash Lite minimal	Google	1	6.1	$0.047	10/22	1.86s
एकूण चाचण्या 22 चुकीच्या चाचण्या 12 एकूण खर्च $0.047 प्रतिसाद वेळ (सरासरी) 1.86s

←

1 2 3 4 5

→

उत्तर नाही अपयशे

मॉडेल फिल्टर करा

उत्तर नाही संख्या नुसार शीर्ष मॉडेल्स

उत्तर नाही संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स