नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Qwen: Qwen3.6 Flash

सारांश

Mercury 2 vs Qwen3.6 Flash benchmark तुलना: Qwen3.6 Flash average score में आगे है: 6.0 vs 4.6. Mercury 2 की benchmark लागत कम है: $0.011 vs $0.015. Mercury 2 तेज है: 653ms vs 1.60s, pass rates 23.8% vs 33.3%.

अनुशंसित मॉडल: Mercury 2 - It offers the best overall trade-off: a competitive score (4.6), lower cost than Qwen3.6 Flash, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 Qwen3.6 Flash Qwen3.6 Flash none रिलीज़: 2026-04-20
स्कोर 4.6 6.0
रैंक #151 #102
विश्वसनीयता 10.0 10.0
संगति 9.2 10.0
सही परीक्षण
प्रति प्रयास पास दर 23.8% 33.3%
अस्थिर टेस्ट 2 0
कुल रन 63 63
प्रति परिणाम लागत 0.259 0.266
कुल लागत $0.011 $0.015
इनपुट कीमत $0.250 / 1M $0.188 / 1M
आउटपुट कीमत $0.750 / 1M $1.125 / 1M
कुल इनपुट टोकन 28,113 50,810
आउटपुट टोकन 4,439 4,164
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 653ms 1.60s
प्रतिक्रिया समय (अधिकतम) 1.43s 4.60s
प्रतिक्रिया समय (कुल) 13.72s 33.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
लागत
$0.002
समय
1.8s
टोकन
1,514 tok

#102 Qwen3.6 Flash

none
लागत
$0.005
समय
20.1s
टोकन
4,211 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें