नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.2 Chat

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium प्रकाशन: 2026-02-14 GPT-5.2 Chat GPT-5.2 Chat none प्रकाशन: 2025-12-11
क्रमांक #3 #16
सरासरी स्कोअर 8.5 7.4
सुसंगतता 8.7 9.1
प्रति निकाल खर्च 0.870 2.440
एकूण खर्च $0.105 $0.269
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.5% 75.0%
अस्थिर चाचण्या 3 2
एकूण रन 48 48
आउटपुट टोकन्स 2,815 15,845
रिझनिंग टोकन्स 44,618 0
प्रतिसाद वेळ (सरासरी) 29.39s 7.03s
प्रतिसाद वेळ (कमाल) 168.71s 38.52s
प्रतिसाद वेळ (एकूण) 470.29s 112.51s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
GPT-5.2 Chat 9.9 10.0 100.0% 0 3.05s 980 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
GPT-5.2 Chat 4.0 10.0 33.3% 0 17.78s 7,810 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
GPT-5.2 Chat 4.0 3.0 33.3% 1 3.20s 335 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
GPT-5.2 Chat 6.0 6.1 83.3% 1 5.46s 1,528 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
GPT-5.2 Chat 7.0 10.0 66.7% 0 4.42s 1,743 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

झटपट तुलना

तुलना जोडी बदला