नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.6 Flash

सारांश

Seed-2.0-Mini vs Qwen3.6 Flash benchmark तुलना: average score जवळपास समान आहे: 7.4 vs 7.5. Seed-2.0-Mini चा benchmark खर्च कमी आहे: $0.044 vs $0.288. Qwen3.6 Flash वेगवान आहे: 19.25s vs 80.22s, pass rates 57.1% vs 71.4%.

शिफारस केलेले मॉडेल: Seed-2.0-Mini - It has the best score here (7.4), while costing about 6.6x less than Qwen3.6 Flash.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium प्रकाशन: 2026-02-14 Qwen3.6 Flash Qwen3.6 Flash medium प्रकाशन: 2026-04-20
स्कोअर 7.4 7.5
क्रमांक #51 #49
विश्वसनीयता 6.7 10.0
सुसंगतता 9.3 8.1
बरोबर चाचण्या
प्रति प्रयत्न पास दर 57.1% 71.4%
अस्थिर चाचण्या 2 5
एकूण रन 63 63
प्रति निकाल खर्च 0.397 3.030
एकूण खर्च $0.044 $0.288
इनपुट किंमत $0.100 / 1M $0.188 / 1M
आउटपुट किंमत $0.400 / 1M $1.125 / 1M
एकूण इनपुट टोकन्स 41,904 42,362
आउटपुट टोकन्स 2,555 2,995
रिझनिंग टोकन्स 95,974 245,358
प्रतिसाद वेळ (सरासरी) 80.22s 19.25s
प्रतिसाद वेळ (कमाल) 262.83s 122.87s
प्रतिसाद वेळ (एकूण) 1363.72s 404.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Seed-2.0-Mini

medium
Cost
$0.002
Time
161.7s
Tokens
4,379 tok

#49 Qwen3.6 Flash

medium
Invalid SVG
Cost
$0.008
Time
29.9s
Tokens
6,784 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048

झटपट तुलना

तुलना जोडी बदला