नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs StepFun: Step 3.5 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none प्रकाशन: 2026-04-16 Step 3.5 Flash Step 3.5 Flash medium प्रकाशन: 2026-02-01
स्कोअर 9.2 7.9
क्रमांक #4 #30
सुसंगतता 10.0 9.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 88.9% 70.6%
अस्थिर चाचण्या 0 2
एकूण रन 54 49
प्रति निकाल खर्च 3.155 0.000
एकूण खर्च $0.505 $0.000
???? ??? $5.000 / 1M $0.100 / 1M
????? ??? $25.000 / 1M $0.300 / 1M
आउटपुट टोकन्स 6,326 71,904
रिझनिंग टोकन्स 0 155,607
प्रतिसाद वेळ (सरासरी) 3.13s 26.78s
प्रतिसाद वेळ (कमाल) 18.27s 170.45s
प्रतिसाद वेळ (एकूण) 56.33s 294.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Step 3.5 Flash - - - - - - - -
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

झटपट तुलना

तुलना जोडी बदला