नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Qwen: Qwen3.5-Flash

सारांश

Claude Sonnet 5 vs Qwen3.5-Flash benchmark तुलना: Qwen3.5-Flash average score में आगे है: 6.1 vs 5.7. Qwen3.5-Flash की benchmark लागत कम है: $0.005 vs $0.287. Qwen3.5-Flash तेज है: 3.58s vs 4.74s, pass rates 42.9% vs 39.7%.

अनुशंसित मॉडल: Qwen3.5-Flash - It has the best score here (6.1), while costing about 69.4x less than Claude Sonnet 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 none रिलीज़: 2026-06-30 Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24
स्कोर 5.7 6.1
रैंक #117 #99
विश्वसनीयता 10.0 10.0
संगति 8.6 9.7
सही परीक्षण
प्रति प्रयास पास दर 42.9% 39.7%
अस्थिर टेस्ट 4 1
कुल रन 63 63
प्रति परिणाम लागत 4.098 0.075
कुल लागत $0.287 $0.005
इनपुट कीमत $2.000 / 1M $0.065 / 1M
आउटपुट कीमत $10.000 / 1M $0.260 / 1M
कुल इनपुट टोकन 76,797 46,439
आउटपुट टोकन 13,325 4,276
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 4.74s 3.58s
प्रतिक्रिया समय (अधिकतम) 29.46s 27.18s
प्रतिक्रिया समय (कुल) 99.46s 75.28s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
लागत
$0.061
समय
53.7s
टोकन
6,172 tok

#99 Qwen3.5-Flash

none
लागत
$0.003
समय
47.4s
टोकन
7,799 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 696 690 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Qwen3.5-Flash 5.5 10.0 33.3% 0 850ms 7,913 519 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 18,879 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 522 100 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 711 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 714 579 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 8,211 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें