नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-4o-mini vs Qwen: Qwen3.5-9B

सारांश

GPT-4o-mini vs Qwen3.5-9B benchmark तुलना: GPT-4o-mini average score मध्ये पुढे आहे: 4.8 vs 4.2. GPT-4o-mini चा benchmark खर्च कमी आहे: $0.006 vs $0.036. GPT-4o-mini वेगवान आहे: 1.77s vs 82.24s, pass rates 23.8% vs 27.0%.

शिफारस केलेले मॉडेल: GPT-4o-mini - It has the best score here (4.8), while costing about 6.0x less than Qwen3.5-9B.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-10

मेट्रिक GPT-4o-mini GPT-4o-mini none प्रकाशन: 2024-07-18 Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02
स्कोअर 4.8 4.2
क्रमांक #148 #162
विश्वसनीयता 10.0 6.7
सुसंगतता 9.9 8.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 23.8% 27.0%
अस्थिर चाचण्या 0 5
एकूण रन 63 63
प्रति निकाल खर्च 0.119 1.187
एकूण खर्च $0.006 $0.036
इनपुट किंमत $0.150 / 1M $0.100 / 1M
आउटपुट किंमत $0.600 / 1M $0.150 / 1M
एकूण इनपुट टोकन्स 31,518 17,070
आउटपुट टोकन्स 1,982 29,045
रिझनिंग टोकन्स 0 209,516
प्रतिसाद वेळ (सरासरी) 1.77s 82.24s
प्रतिसाद वेळ (कमाल) 7.58s 226.38s
प्रतिसाद वेळ (एकूण) 24.80s 1315.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#148 GPT-4o-mini

none
Cost
$0.001
Time
6.6s
Tokens
742 tok

#162 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 618 186 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.2 9.6 0.0% 0 1.63s 7,314 367 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 8,298 568 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 7,161 183 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 732 15 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 480 66 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 6.3 10.0 50.0% 0 1.11s 666 69 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.5 10.0 0.0% 0 1.21s 651 308 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 5,400 205 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 10.0 0.0% 0 794ms 198 15 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

झटपट तुलना

तुलना जोडी बदला