नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध
क्रमांक #45 #43
सरासरी स्कोअर 4.9 5.1
सुसंगतता 7.4 7.4
प्रति निकाल खर्च 0.214 0.135
एकूण खर्च $0.015 $0.010
बरोबर चाचण्या
प्रति प्रयत्न पास दर 56.3% 54.2%
अस्थिर चाचण्या 5 5
एकूण रन 48 48
आउटपुट टोकन्स 2,743 13,210
रिझनिंग टोकन्स 0 34,230
प्रतिसाद वेळ (सरासरी) 2.49s 16.65s
प्रतिसाद वेळ (कमाल) 6.70s 50.92s
प्रतिसाद वेळ (एकूण) 39.91s 149.88s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
gpt-oss-120b 7.0 9.8 66.7% 0 19.76s 3,463 2,077
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
gpt-oss-120b 5.5 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
gpt-oss-120b 10.0 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
gpt-oss-120b 3.0 10.0 0.0% 0 7.90s 107 387
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
gpt-oss-120b 9.5 10.0 100.0% 0 7.63s 126 1,799
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
gpt-oss-120b 1.7 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
gpt-oss-120b 9.0 10.0 100.0% 0 6.91s 287 1,083

झटपट तुलना

तुलना जोडी बदला