नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs StepFun: Step 3.7 Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Ring-2.6-1T Ring-2.6-1T none प्रकाशन: 2026-05-10 Step 3.7 Flash Step 3.7 Flash high प्रकाशन: 2026-05-29
स्कोअर 7.2 7.1
क्रमांक #70 #74
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 62.5% 65.8%
अस्थिर चाचण्या 2 4
एकूण रन 60 60
प्रति निकाल खर्च 0.000 8.723
एकूण खर्च $0.000 $0.960
इनपुट किंमत $0.075 / 1M $0.200 / 1M
आउटपुट किंमत $0.625 / 1M $1.150 / 1M
आउटपुट टोकन्स 39,954 828,084
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 55.10s 49.43s
प्रतिसाद वेळ (कमाल) 143.82s 192.75s
प्रतिसाद वेळ (एकूण) 881.55s 988.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 5,575 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 10.0 10.0 100.0% 0 143.82s 5,036 0
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 1,529 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 17,728 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 846 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 2,004 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 3,469 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 3,767 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

झटपट तुलना

तुलना जोडी बदला