नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4 Nano

सारांश

Seed-2.0-Mini vs GPT-5.4 Nano benchmark तुलना: GPT-5.4 Nano average score में आगे है: 7.5 vs 7.4. Seed-2.0-Mini की benchmark लागत कम है: $0.044 vs $0.107. GPT-5.4 Nano तेज है: 11.95s vs 80.22s, pass rates 57.1% vs 63.5%.

अनुशंसित मॉडल: GPT-5.4 Nano - It has the best score here (7.5), while responding about 6.7x faster than Seed-2.0-Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium रिलीज़: 2026-02-14 GPT-5.4 Nano GPT-5.4 Nano medium रिलीज़: 2026-03-17
स्कोर 7.4 7.5
रैंक #50 #46
विश्वसनीयता 6.7 10.0
संगति 9.3 8.4
सही परीक्षण
प्रति प्रयास पास दर 57.1% 63.5%
अस्थिर टेस्ट 2 4
कुल रन 63 63
प्रति परिणाम लागत 0.397 0.969
कुल लागत $0.044 $0.107
इनपुट कीमत $0.100 / 1M $0.200 / 1M
आउटपुट कीमत $0.400 / 1M $1.250 / 1M
कुल इनपुट टोकन 41,904 35,434
आउटपुट टोकन 2,555 3,014
रीजनिंग टोकन 95,974 76,520
प्रतिक्रिया समय (औसत) 80.22s 11.95s
प्रतिक्रिया समय (अधिकतम) 262.83s 94.06s
प्रतिक्रिया समय (कुल) 1363.72s 250.98s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 Seed-2.0-Mini

medium
लागत
$0.002
समय
161.7s
टोकन
4,379 tok

#46 GPT-5.4 Nano

medium
लागत
$0.007
समय
24.6s
टोकन
4,943 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

त्वरित तुलना

तुलना जोड़ी बदलें