नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs StepFun: Step 3.7 Flash

सारांश

Gemini 3.1 Flash Lite vs Step 3.7 Flash benchmark तुलना: Step 3.7 Flash average score में आगे है: 7.1 vs 6.4. Gemini 3.1 Flash Lite की benchmark लागत कम है: $0.028 vs $1.148. Gemini 3.1 Flash Lite तेज है: 1.89s vs 64.46s, pass rates 61.9% vs 63.5%.

अनुशंसित मॉडल: Gemini 3.1 Flash Lite - Its score stays close to the best score here (6.4 vs 7.1), while costing about 42.2x less than Step 3.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low रिलीज़: 2026-05-08 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 6.4 7.1
रैंक #85 #63
विश्वसनीयता 10.0 10.0
संगति 9.3 8.2
सही परीक्षण
प्रति प्रयास पास दर 61.9% 63.5%
अस्थिर टेस्ट 2 4
कुल रन 63 63
प्रति परिणाम लागत 0.227 10.434
कुल लागत $0.028 $1.148
इनपुट कीमत $0.250 / 1M $0.200 / 1M
आउटपुट कीमत $1.500 / 1M $1.150 / 1M
कुल इनपुट टोकन 36,892 38,391
आउटपुट टोकन 2,732 991,355
रीजनिंग टोकन 9,260 0
प्रतिक्रिया समय (औसत) 1.89s 64.46s
प्रतिक्रिया समय (अधिकतम) 5.66s 364.99s
प्रतिक्रिया समय (कुल) 39.62s 1353.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#85 Gemini 3.1 Flash Lite

low
लागत
$0.003
समय
4.0s
टोकन
1,479 tok

#63 Step 3.7 Flash

high
लागत
$0.007
समय
63.6s
टोकन
6,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 500 1,013 1,548
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 1.53s 8,132 471 1,072
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 12,870 348 975
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 7,453 291 697
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 639 15 1,214
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 492 69 438
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 619 72 760
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 570 210 1,191
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 5,457 234 945
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 160 9 420
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें