नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs Poolside: Laguna XS 2.1

सारांश

Gemini 3 Flash Preview vs Laguna XS 2.1 benchmark तुलना: Gemini 3 Flash Preview average score में आगे है: 9.6 vs 7.0. Laguna XS 2.1 की benchmark लागत कम है: $0.036 vs $0.667. Gemini 3 Flash Preview तेज है: 18.64s vs 30.08s, pass rates 98.4% vs 44.4%.

अनुशंसित मॉडल: Gemini 3 Flash Preview - It has the best score here (9.6), while responding about 1.6x faster than Laguna XS 2.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemini 3 Flash Preview Gemini 3 Flash Preview medium रिलीज़: 2025-12-17 Laguna XS 2.1 Laguna XS 2.1 medium रिलीज़: 2026-07-02 निःशुल्क उपलब्ध
स्कोर 9.6 7.0
रैंक #2 #67
विश्वसनीयता 10.0 10.0
संगति 9.7 9.6
सही परीक्षण
प्रति प्रयास पास दर 98.4% 44.4%
अस्थिर टेस्ट 1 1
कुल रन 63 63
प्रति परिणाम लागत 3.335 0.392
कुल लागत $0.667 $0.036
इनपुट कीमत $0.500 / 1M $0.060 / 1M
आउटपुट कीमत $3.000 / 1M $0.120 / 1M
कुल इनपुट टोकन 37,017 45,324
आउटपुट टोकन 2,006 25,761
रीजनिंग टोकन 214,153 268,677
प्रतिक्रिया समय (औसत) 18.64s 30.08s
प्रतिक्रिया समय (अधिकतम) 117.26s 155.23s
प्रतिक्रिया समय (कुल) 391.35s 631.77s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium
लागत
$0.010
समय
17.9s
टोकन
3,236 tok

#67 Laguna XS 2.1

medium
लागत
$0.001
समय
30.6s
टोकन
4,678 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437

त्वरित तुलना

तुलना जोड़ी बदलें