नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.7 Plus

सारांश

Seed-2.0-Lite vs Qwen3.7 Plus benchmark तुलना: Qwen3.7 Plus average score मध्ये पुढे आहे: 6.4 vs 5.8. Seed-2.0-Lite चा benchmark खर्च कमी आहे: $0.019 vs $0.028. Seed-2.0-Lite वेगवान आहे: 2.49s vs 2.85s, pass rates 46.0% vs 47.6%.

शिफारस केलेले मॉडेल: Seed-2.0-Lite - Its score stays close to the best score here (5.8 vs 6.4), while costing about 1.5x less than Qwen3.7 Plus.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-10

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none प्रकाशन: 2026-02-14 Qwen3.7 Plus Qwen3.7 Plus none प्रकाशन: 2026-06-03
स्कोअर 5.8 6.4
क्रमांक #111 #89
विश्वसनीयता 10.0 10.0
सुसंगतता 8.4 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 46.0% 47.6%
अस्थिर चाचण्या 4 0
एकूण रन 63 63
प्रति निकाल खर्च 0.228 0.276
एकूण खर्च $0.019 $0.028
इनपुट किंमत $0.250 / 1M $0.400 / 1M
आउटपुट किंमत $2.000 / 1M $1.600 / 1M
एकूण इनपुट टोकन्स 46,573 42,510
आउटपुट टोकन्स 3,259 6,578
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.49s 2.85s
प्रतिसाद वेळ (कमाल) 6.70s 29.38s
प्रतिसाद वेळ (एकूण) 52.26s 59.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none
Cost
$0.005
Time
83.8s
Tokens
2,311 tok

#89 Qwen3.7 Plus

none
Cost
$0.019
Time
213.5s
Tokens
11,960 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 894 709 0
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.6 10.0 33.3% 0 2.83s 8,215 410 0
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 16,215 498 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 8,538 246 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 939 17 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 570 294 0
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 810 73 0
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 858 709 0
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 9,270 292 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 264 11 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

झटपट तुलना

तुलना जोडी बदला