नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.2 vs Qwen: Qwen3.7 Plus

सारांश

GPT-5.2 vs Qwen3.7 Plus benchmark तुलना: GPT-5.2 average score में आगे है: 8.4 vs 7.2. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.548. Qwen3.7 Plus तेज है: 2.85s vs 16.88s, pass rates 71.4% vs 47.6%.

अनुशंसित मॉडल: Qwen3.7 Plus - It offers the best overall trade-off: a competitive score (7.2), lower cost than GPT-5.2, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11 Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03
स्कोर 8.4 7.2
रैंक #22 #62
विश्वसनीयता 10.0 10.0
संगति 8.4 10.0
सही परीक्षण
प्रति प्रयास पास दर 71.4% 47.6%
अस्थिर टेस्ट 4 0
कुल रन 63 63
प्रति परिणाम लागत 4.209 0.276
कुल लागत $0.548 $0.023
इनपुट कीमत $1.750 / 1M $0.320 / 1M
आउटपुट कीमत $14.000 / 1M $1.280 / 1M
कुल इनपुट टोकन 33,967 42,510
आउटपुट टोकन 2,901 6,578
रीजनिंग टोकन 31,932 0
प्रतिक्रिया समय (औसत) 16.88s 2.85s
प्रतिक्रिया समय (अधिकतम) 77.80s 29.38s
प्रतिक्रिया समय (कुल) 236.34s 59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2

medium
लागत
$0.047
समय
49.2s
टोकन
3,396 tok

#62 Qwen3.7 Plus

none
लागत
$0.019
समय
213.5s
टोकन
11,960 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें