नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs StepFun: Step 3.5 Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Google: Gemini 3 Flash Preview medium रिलीज़: 2025-12-17 StepFun: Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध
रैंक #1 #13
औसत स्कोर 10.0 7.4
संगति 10.0 9.1
प्रति परिणाम लागत 1.025 0.000
कुल लागत $0.164 $0.000
सही परीक्षण
प्रति प्रयास पास दर 100.0% 68.8%
अस्थिर टेस्ट 0 2
कुल रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 1,634 71,452
रीजनिंग टोकन 47,907 155,147
प्रतिक्रिया समय (औसत) 12.36s 29.10s
प्रतिक्रिया समय (अधिकतम) 50.16s 170.45s
प्रतिक्रिया समय (कुल) 111.21s 290.96s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.61s 299 3,127
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 9.9 10.0 100.0% 0 4.72s 279 5,333
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें