नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.5-27B vs Qwen: Qwen3.7 Plus

सारांश

Qwen3.5-27B vs Qwen3.7 Plus benchmark तुलना: Qwen3.7 Plus average score में आगे है: 8.2 vs 7.9. Qwen3.7 Plus की benchmark लागत कम है: $0.177 vs $0.536. Qwen3.7 Plus तेज है: 38.95s vs 68.39s, pass rates 73.0% vs 77.8%.

अनुशंसित मॉडल: Qwen3.7 Plus - It has the best score here (8.2), while costing about 3.0x less than Qwen3.5-27B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24 Qwen3.7 Plus Qwen3.7 Plus medium रिलीज़: 2026-06-03
स्कोर 7.9 8.2
रैंक #29 #25
विश्वसनीयता 10.0 10.0
संगति 8.5 9.1
सही परीक्षण
प्रति प्रयास पास दर 73.0% 77.8%
अस्थिर टेस्ट 4 2
कुल रन 63 63
प्रति परिणाम लागत 4.901 1.474
कुल लागत $0.536 $0.177
इनपुट कीमत $0.195 / 1M $0.320 / 1M
आउटपुट कीमत $1.560 / 1M $1.280 / 1M
कुल इनपुट टोकन 42,164 40,939
आउटपुट टोकन 8,534 2,125
रीजनिंग टोकन 329,289 125,754
प्रतिक्रिया समय (औसत) 68.39s 38.95s
प्रतिक्रिया समय (अधिकतम) 234.36s 178.04s
प्रतिक्रिया समय (कुल) 1436.24s 817.85s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#29 Qwen3.5-27B

medium
लागत
$0.008
समय
62.0s
टोकन
3,099 tok

#25 Qwen3.7 Plus

medium
लागत
$0.018
समय
193.2s
टोकन
10,821 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.2 7.1 55.6% 1 160.69s 7,895 6,381 89,388
Qwen3.7 Plus 6.1 6.6 55.6% 1 108.60s 6,472 414 43,576
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

त्वरित तुलना

तुलना जोड़ी बदलें