नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3.6 Flash

सारांश

Granite 4.1 8B vs Qwen3.6 Flash benchmark तुलना: Qwen3.6 Flash average score मध्ये पुढे आहे: 6.0 vs 4.0. Granite 4.1 8B चा benchmark खर्च कमी आहे: $0.003 vs $0.015. Granite 4.1 8B वेगवान आहे: 728ms vs 1.60s, pass rates 9.5% vs 33.3%.

शिफारस केलेले मॉडेल: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than Qwen3.6 Flash, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Granite 4.1 8B Granite 4.1 8B none प्रकाशन: 2026-05-01 Qwen3.6 Flash Qwen3.6 Flash none प्रकाशन: 2026-04-20
स्कोअर 4.0 6.0
क्रमांक #163 #102
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 9.5% 33.3%
अस्थिर चाचण्या 0 0
एकूण रन 63 63
प्रति निकाल खर्च 0.131 0.266
एकूण खर्च $0.003 $0.015
इनपुट किंमत $0.050 / 1M $0.188 / 1M
आउटपुट किंमत $0.100 / 1M $1.125 / 1M
एकूण इनपुट टोकन्स 46,285 50,810
आउटपुट टोकन्स 2,911 4,164
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 728ms 1.60s
प्रतिसाद वेळ (कमाल) 2.17s 4.60s
प्रतिसाद वेळ (एकूण) 15.29s 33.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
खर्च
$0.001
वेळ
3.2s
टोकन्स
491 tok

#102 Qwen3.6 Flash

none
खर्च
$0.005
वेळ
20.1s
टोकन्स
4,211 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

झटपट तुलना

तुलना जोडी बदला