नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash none प्रकाशन: 2026-04-24 gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध
स्कोअर 5.3 5.8
क्रमांक #89 #76
सुसंगतता 9.1 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 51.9%
अस्थिर चाचण्या 2 6
एकूण रन 54 54
प्रति निकाल खर्च 0.147 0.144
एकूण खर्च $0.008 $0.011
???? ??? $0.140 / 1M $0.000 / 1M
????? ??? $0.280 / 1M $0.000 / 1M
आउटपुट टोकन्स 4,444 13,493
रिझनिंग टोकन्स 0 36,879
प्रतिसाद वेळ (सरासरी) 29.39s 16.08s
प्रतिसाद वेळ (कमाल) 111.96s 50.92s
प्रतिसाद वेळ (एकूण) 529.10s 176.88s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.3 10.0 0.0% 0 24.04s 471 0
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 3.1 7.3 11.1% 1 22.96s 207 0
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

झटपट तुलना

तुलना जोडी बदला