नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Nemotron 3 Super 120b A12b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium प्रकाशन: 2026-03-11 मोफत उपलब्ध
क्रमांक #45 #36
सरासरी स्कोअर 4.9 5.8
सुसंगतता 7.4 8.5
प्रति निकाल खर्च 0.214 0.000
एकूण खर्च $0.015 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 56.3% 56.3%
अस्थिर चाचण्या 5 3
एकूण रन 48 48
आउटपुट टोकन्स 2,743 11,925
रिझनिंग टोकन्स 0 29,687
प्रतिसाद वेळ (सरासरी) 2.49s 20.24s
प्रतिसाद वेळ (कमाल) 6.70s 87.80s
प्रतिसाद वेळ (एकूण) 39.91s 303.60s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 12.96s 1,754 3,264
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 18.16s 877 2,607
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Nemotron 3 Super 120b A12b 10.0 4.4 22.2% 2 16.19s 5,255 6,072
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Nemotron 3 Super 120b A12b 2.0 9.9 0.0% 0 27.86s 104 1,149
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Nemotron 3 Super 120b A12b 7.0 6.5 66.7% 1 7.72s 1,042 2,479
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Nemotron 3 Super 120b A12b 1.3 9.8 0.0% 0 8.39s 602 2,151
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969

झटपट तुलना

तुलना जोडी बदला