नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 2.5 Flash

सारांश

Seed-2.0-Lite vs Gemini 2.5 Flash benchmark तुलना: Seed-2.0-Lite average score में आगे है: 8.5 vs 8.2. Seed-2.0-Lite की benchmark लागत कम है: $0.175 vs $0.379. Gemini 2.5 Flash तेज है: 15.49s vs 47.07s, pass rates 76.2% vs 69.8%.

अनुशंसित मॉडल: Seed-2.0-Lite - It has the best score here (8.5), while costing about 2.2x less than Gemini 2.5 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14 Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17
स्कोर 8.5 8.2
रैंक #18 #24
विश्वसनीयता 10.0 10.0
संगति 9.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 76.2% 69.8%
अस्थिर टेस्ट 3 1
कुल रन 63 63
प्रति परिणाम लागत 1.250 2.701
कुल लागत $0.175 $0.379
इनपुट कीमत $0.250 / 1M $0.300 / 1M
आउटपुट कीमत $2.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 46,740 34,476
आउटपुट टोकन 3,230 1,930
रीजनिंग टोकन 78,406 145,145
प्रतिक्रिया समय (औसत) 47.07s 15.49s
प्रतिक्रिया समय (अधिकतम) 254.92s 95.48s
प्रतिक्रिया समय (कुल) 988.37s 325.39s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium
लागत
$0.005
समय
86.7s
टोकन
2,354 tok

#24 Gemini 2.5 Flash

medium
अमान्य SVG
लागत
$0.000
समय
274.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 492 255 10,233
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
Gemini 2.5 Flash 7.8 10.0 66.7% 0 41.01s 6,669 543 32,303
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 12,522 303 11,922
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 7,257 279 2,325
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 633 18 80,702
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 486 92 1,899
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 615 69 1,203
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 558 126 2,499
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 5,088 234 1,140
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 156 11 919

त्वरित तुलना

तुलना जोड़ी बदलें