नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.5-35B-A3B

सारांश

Laguna XS 2.1 vs Qwen3.5-35B-A3B benchmark तुलना: Qwen3.5-35B-A3B average score में आगे है: 6.3 vs 5.3. Laguna XS 2.1 की benchmark लागत कम है: $0.003 vs $0.401. Laguna XS 2.1 तेज है: 722ms vs 72.57s, pass rates 31.8% vs 69.8%.

अनुशंसित मॉडल: Laguna XS 2.1 - It offers the best overall trade-off: a competitive score (5.3), lower cost than Qwen3.5-35B-A3B, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Laguna XS 2.1 Laguna XS 2.1 none रिलीज़: 2026-07-02 निःशुल्क उपलब्ध Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium रिलीज़: 2026-02-24
स्कोर 5.3 6.3
रैंक #128 #92
विश्वसनीयता 10.0 10.0
संगति 9.0 7.5
सही परीक्षण
प्रति प्रयास पास दर 31.8% 69.8%
अस्थिर टेस्ट 3 6
कुल रन 63 63
प्रति परिणाम लागत 0.058 5.162
कुल लागत $0.003 $0.401
इनपुट कीमत $0.060 / 1M $0.140 / 1M
आउटपुट कीमत $0.120 / 1M $1.000 / 1M
कुल इनपुट टोकन 41,148 42,196
आउटपुट टोकन 3,451 40,630
रीजनिंग टोकन 0 353,577
प्रतिक्रिया समय (औसत) 722ms 72.57s
प्रतिक्रिया समय (अधिकतम) 2.30s 409.98s
प्रतिक्रिया समय (कुल) 15.17s 1524.04s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none
लागत
$0.001
समय
27.6s
टोकन
4,344 tok

#92 Qwen3.5-35B-A3B

medium
लागत
$0.009
समय
71.4s
टोकन
8,631 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

त्वरित तुलना

तुलना जोड़ी बदलें