नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3.5-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Mistral Small 4 Mistral Small 4 medium प्रकाशन: 2026-03-16 Qwen3.5-Flash Qwen3.5-Flash none प्रकाशन: 2026-02-24
स्कोअर 5.4 5.9
क्रमांक #123 #100
विश्वसनीयता 10.0 10.0
सुसंगतता 7.1 9.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 45.0% 41.7%
अस्थिर चाचण्या 7 1
एकूण रन 60 60
प्रति निकाल खर्च 1.112 0.073
एकूण खर्च $0.056 $0.004
इनपुट किंमत $0.150 / 1M $0.065 / 1M
आउटपुट किंमत $0.600 / 1M $0.260 / 1M
आउटपुट टोकन्स 21,871 4,270
रिझनिंग टोकन्स 68,349 0
प्रतिसाद वेळ (सरासरी) 8.35s 3.74s
प्रतिसाद वेळ (कमाल) 59.15s 27.18s
प्रतिसाद वेळ (एकूण) 167.08s 74.71s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.1 6.8 33.3% 1 44.82s 9,322 38,386
Qwen3.5-Flash 6.8 10.0 50.0% 0 993ms 513 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 1,226 2,632
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 579 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 18 1,557
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 9 0

झटपट तुलना

तुलना जोडी बदला