नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs Poolside: Laguna XS 2.1

सारांश

Gemini 3 Flash Preview vs Laguna XS 2.1 benchmark तुलना: Gemini 3 Flash Preview average score में आगे है: 7.4 vs 7.0. Laguna XS 2.1 की benchmark लागत कम है: $0.036 vs $0.111. Gemini 3 Flash Preview तेज है: 5.76s vs 30.08s, pass rates 79.4% vs 44.4%.

अनुशंसित मॉडल: Gemini 3 Flash Preview - It has the best score here (7.4), while responding about 5.2x faster than Laguna XS 2.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemini 3 Flash Preview Gemini 3 Flash Preview low रिलीज़: 2025-12-17 Laguna XS 2.1 Laguna XS 2.1 medium रिलीज़: 2026-07-02 निःशुल्क उपलब्ध
स्कोर 7.4 7.0
रैंक #54 #67
विश्वसनीयता 10.0 10.0
संगति 9.2 9.6
सही परीक्षण
प्रति प्रयास पास दर 79.4% 44.4%
अस्थिर टेस्ट 2 1
कुल रन 63 63
प्रति परिणाम लागत 0.689 0.392
कुल लागत $0.111 $0.036
इनपुट कीमत $0.500 / 1M $0.060 / 1M
आउटपुट कीमत $3.000 / 1M $0.120 / 1M
कुल इनपुट टोकन 36,769 45,324
आउटपुट टोकन 2,076 25,761
रीजनिंग टोकन 28,518 268,677
प्रतिक्रिया समय (औसत) 5.76s 30.08s
प्रतिक्रिया समय (अधिकतम) 14.72s 155.23s
प्रतिक्रिया समय (कुल) 120.93s 631.77s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#54 Gemini 3 Flash Preview

low
लागत
$0.007
समय
12.1s
टोकन
2,289 tok

#67 Laguna XS 2.1

medium
लागत
$0.001
समय
30.6s
टोकन
4,678 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 5.8 7.2 44.4% 1 6.00s 8,122 456 7,421
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437

त्वरित तुलना

तुलना जोड़ी बदलें