AI BENCHY
तुलना करें
❤️ Made by XCS

मॉडल नाम

Google: Gemini 3 Flash Preview

बेंचमार्क Aibenchy टेस्ट सूट्स से इस समय जनरेट किए गए: : 19 फ़र॰ 2026

मेट्रिक Google: Gemini 3 Flash Preview
रैंक#10
कंपनीGoogle
Score 6.25
संगति 8.60
प्रति परिणाम लागत 0.0754
कुल लागत $0.00528
सही परीक्षण 7/12
प्रति प्रयास पास दर 66.7%
अस्थिर टेस्ट 2
आउटपुट टोकन 485
रीजनिंग टोकन 0

श्रेणी विवरण

श्रेणी पूरी तरह पास टेस्ट Score संगति प्रति प्रयास पास दर अस्थिर टेस्ट तर्क स्कोर लागत
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 - $0.00016
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 - $0.00357
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00038
Instructions following 1/2 5.50 5.81 66.7% 1 - $0.00054
Puzzle Solving 2/3 7.00 10.00 66.7% 0 - $0.00066

तुलना किए गए मॉडल

Google: Gemini 3 Flash Preview की तुलना इससे करें...

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

तर्क (medium)

Score: 6.42

संगति: 8.00

प्रति प्रयास पास दर: 72.2%

अस्थिर टेस्ट: 3

प्रति परिणाम लागत: 2.4097

सही परीक्षण: 7/12

कुल लागत: $0.16868

तुलना करें

#11 · OpenAI

OpenAI: GPT-5 Nano

तर्क (medium)

Score: 5.92

संगति: 6.03

प्रति प्रयास पास दर: 72.2%

अस्थिर टेस्ट: 6

प्रति परिणाम लागत: 0.4675

सही परीक्षण: 6/12

कुल लागत: $0.02806

तुलना करें

#8 · X Ai

xAI: Grok 4.1 Fast

तर्क (medium)

Score: 6.42

संगति: 8.60

प्रति प्रयास पास दर: 66.7%

अस्थिर टेस्ट: 2

प्रति परिणाम लागत: 0.4800

सही परीक्षण: 7/12

कुल लागत: $0.03360

तुलना करें

त्वरित तुलना

Google: Gemini 3 Flash Preview की तुलना इससे करें...