नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक ByteDance Seed: Seed-2.0-Mini medium प्रकाशन: 2026-02-14 OpenAI: GPT-5.4 none प्रकाशन: 2026-03-05
सरासरी स्कोअर 7.0 4.6
क्रमांक #24 #45
बरोबर चाचण्या
सुसंगतता 9.4 8.9
प्रति निकाल खर्च 0.261 1.496
एकूण खर्च $0.027 $0.090
प्रति प्रयत्न पास दर 71.1% 44.4%
अस्थिर चाचण्या 1 2
common.totalRuns 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन्स 1,752 1,635
रिझनिंग टोकन्स 54,246 0
प्रतिसाद वेळ (सरासरी) 67.46s 1.46s
प्रतिसाद वेळ (कमाल) 262.83s 2.89s
प्रतिसाद वेळ (एकूण) 809.49s 21.86s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 7.0 10.0 66.7% 0 98.99s 354 9,352
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 9.9 10.0 100.0% 0 24.27s 246 2,743
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 0.0% 0 0ms 0 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 7.0 7.2 88.9% 1 25.85s 457 5,060
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

झटपट तुलना

तुलना जोडी बदला