नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Hunter Alpha

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 Hunter Alpha Hunter Alpha medium प्रकाशन: प्रकाशन तारीख अज्ञात
क्रमांक #45 #35
सरासरी स्कोअर 4.9 5.9
सुसंगतता 7.4 7.6
प्रति निकाल खर्च 0.214 0.000
एकूण खर्च $0.015 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 56.3% 68.8%
अस्थिर चाचण्या 5 5
एकूण रन 48 48
आउटपुट टोकन्स 2,743 4,686
रिझनिंग टोकन्स 0 17,821
प्रतिसाद वेळ (सरासरी) 2.49s 10.71s
प्रतिसाद वेळ (कमाल) 6.70s 30.53s
प्रतिसाद वेळ (एकूण) 39.91s 171.41s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Hunter Alpha 7.0 7.2 88.9% 1 4.93s 441 1,003
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Hunter Alpha 10.0 1.6 66.7% 1 30.53s 792 3,456
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Hunter Alpha 9.9 10.0 100.0% 0 23.16s 1,488 8,017
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Hunter Alpha 10.0 10.0 0.0% 0 10.52s 892 2,406
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Hunter Alpha 8.0 3.7 66.7% 1 6.44s 116 260
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Hunter Alpha 9.5 10.0 100.0% 0 4.18s 208 465
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Hunter Alpha 4.3 4.7 66.7% 2 5.36s 441 1,310
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904

झटपट तुलना

तुलना जोडी बदला