नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक Granite 4.1 8B Granite 4.1 8B none प्रकाशन: 2026-05-01 Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02
स्कोअर 4.3 4.4
क्रमांक #135 #132
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 10.0 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 11.1% 33.3%
अस्थिर चाचण्या 0 6
एकूण रन 54 54
प्रति निकाल खर्च 0.110 0.976
एकूण खर्च $0.003 $0.030
???? ??? $0.050 / 1M $0.100 / 1M
????? ??? $0.100 / 1M $0.150 / 1M
आउटपुट टोकन्स 2,712 24,291
रिझनिंग टोकन्स 0 172,597
प्रतिसाद वेळ (सरासरी) 767ms 73.64s
प्रतिसाद वेळ (कमाल) 2.17s 226.38s
प्रतिसाद वेळ (एकूण) 13.81s 1104.60s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

झटपट तुलना

तुलना जोडी बदला