नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.7 Max vs Qwen: Qwen3.7 Plus

सारांश

Qwen3.7 Max vs Qwen3.7 Plus benchmark तुलना: Qwen3.7 Plus average score में आगे है: 7.2 vs 6.9. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.054. Qwen3.7 Max तेज है: 1.30s vs 2.85s, pass rates 66.7% vs 47.6%.

अनुशंसित मॉडल: Qwen3.7 Plus - It has the best score here (7.2), while costing about 2.4x less than Qwen3.7 Max.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22 Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03
स्कोर 6.9 7.2
रैंक #68 #60
विश्वसनीयता 10.0 10.0
संगति 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 66.7% 47.6%
अस्थिर टेस्ट 0 0
कुल रन 63 63
प्रति परिणाम लागत 0.744 0.276
कुल लागत $0.054 $0.023
इनपुट कीमत $1.250 / 1M $0.320 / 1M
आउटपुट कीमत $3.750 / 1M $1.280 / 1M
कुल इनपुट टोकन 37,107 42,510
आउटपुट टोकन 1,994 6,578
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.30s 2.85s
प्रतिक्रिया समय (अधिकतम) 3.92s 29.38s
प्रतिक्रिया समय (कुल) 27.21s 59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 Qwen3.7 Max

none
लागत
$0.046
समय
195.0s
टोकन
12,171 tok

#60 Qwen3.7 Plus

none
लागत
$0.019
समय
213.5s
टोकन
11,960 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें