नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.7 Plus

सारांश

Laguna XS 2.1 vs Qwen3.7 Plus benchmark तुलना: Qwen3.7 Plus average score में आगे है: 7.2 vs 7.0. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.036. Qwen3.7 Plus तेज है: 2.85s vs 30.08s, pass rates 44.4% vs 47.6%.

अनुशंसित मॉडल: Qwen3.7 Plus - It has the best score here (7.2), while costing about 1.6x less than Laguna XS 2.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Laguna XS 2.1 Laguna XS 2.1 medium रिलीज़: 2026-07-02 निःशुल्क उपलब्ध Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03
स्कोर 7.0 7.2
रैंक #67 #62
विश्वसनीयता 10.0 10.0
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 44.4% 47.6%
अस्थिर टेस्ट 1 0
कुल रन 63 63
प्रति परिणाम लागत 0.392 0.276
कुल लागत $0.036 $0.023
इनपुट कीमत $0.060 / 1M $0.320 / 1M
आउटपुट कीमत $0.120 / 1M $1.280 / 1M
कुल इनपुट टोकन 45,324 42,510
आउटपुट टोकन 25,761 6,578
रीजनिंग टोकन 268,677 0
प्रतिक्रिया समय (औसत) 30.08s 2.85s
प्रतिक्रिया समय (अधिकतम) 155.23s 29.38s
प्रतिक्रिया समय (कुल) 631.77s 59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium
लागत
$0.001
समय
30.6s
टोकन
4,678 tok

#62 Qwen3.7 Plus

none
लागत
$0.019
समय
213.5s
टोकन
11,960 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें