नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Nano

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 GPT-5.4 Nano GPT-5.4 Nano medium रिलीज़: 2026-03-17
रैंक #47 #28
स्कोर 6.0 7.4
संगति 7.6 9.0
प्रति परिणाम लागत 0.215 0.769
कुल लागत $0.016 $0.077
सही परीक्षण
प्रति प्रयास पास दर 52.9% 66.7%
अस्थिर टेस्ट 5 2
कुल रन 51 51
आउटपुट टोकन 2,749 2,474
रीजनिंग टोकन 0 54,516
प्रतिक्रिया समय (औसत) 2.40s 11.08s
प्रतिक्रिया समय (अधिकतम) 6.70s 94.06s
प्रतिक्रिया समय (कुल) 40.85s 188.39s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

त्वरित तुलना

तुलना जोड़ी बदलें