नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs StepFun: Step 3.7 Flash

सारांश

Gemini 3.1 Flash Lite vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score में आगे है: 7.1 vs 6.1. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.013 vs $1.148. Gemini 3.1 Flash Lite तेज है: 1.33s vs 64.46s, pass rates 54.0% vs 63.5%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite - It offers the best overall trade-off: a competitive score (6.1), lower cost than Step 3.7 Flash, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal रिलीज़: 2026-05-08 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 6.1 7.1
रैंक #94 #63
विश्वसनीयता 10.0 10.0
संगति 8.8 8.2
सही परीक्षण
प्रति प्रयास पास दर 54.0% 63.5%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 0.130 10.434
कुल लागत $0.013 $1.148
इनपुट कीमत $0.250 / 1M $0.200 / 1M
आउटपुट कीमत $1.500 / 1M $1.150 / 1M
कुल इनपुट टोकन 36,973 38,391
आउटपुट टोकन 2,487 991,355
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.33s 64.46s
प्रतिक्रिया समय (अधिकतम) 4.49s 364.99s
प्रतिक्रिया समय (कुल) 27.91s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 Gemini 3.1 Flash Lite

minimal
लागत
$0.001
समय
3.7s
टोकन
635 tok

#63 Step 3.7 Flash

high
लागत
$0.007
समय
63.6s
टोकन
6,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें