नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17 Step 3.7 Flash Step 3.7 Flash low रिलीज़: 2026-05-29
स्कोर 7.6 7.4
रैंक #53 #60
विश्वसनीयता 10.0 10.0
संगति 9.2 8.7
सही परीक्षण
प्रति प्रयास पास दर 68.3% 68.3%
अस्थिर टेस्ट 2 3
कुल रन 60 60
प्रति परिणाम लागत 10.229 2.796
कुल लागत $1.330 $0.336
इनपुट कीमत $3.000 / 1M $0.200 / 1M
आउटपुट कीमत $15.000 / 1M $1.150 / 1M
आउटपुट टोकन 49,891 285,209
रीजनिंग टोकन 29,565 0
प्रतिक्रिया समय (औसत) 15.81s 16.06s
प्रतिक्रिया समय (अधिकतम) 46.35s 124.75s
प्रतिक्रिया समय (कुल) 189.71s 321.11s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.9 6.0 66.7% 1 33.87s 11,277 3,281
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 592 646
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 3,437 1,586
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

त्वरित तुलना

तुलना जोड़ी बदलें