| اینٹی اے آئی چالیں | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 7.00 | 9.99 | 66.7% | 0 | 354 | 9,352 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 10.00 | 10.00 | 100.0% | 0 | 186 | 5,926 |
AI BENCHY Compare
ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.5 Plus 2026-02-15
ماڈل کا نام:
بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16
خلاصہ
| میٹرک | ByteDance Seed: Seed-2.0-Mini medium اجرا: 2026-02-26 | Qwen: Qwen3.5 Plus 2026-02-15 medium اجرا: ریلیز کی تاریخ نامعلوم |
|---|---|---|
| درجہ | #18 | #4 |
| اسکور | 6.13 | 8.64 |
| تسلسل | 8.91 | 10.00 |
| فی نتیجہ لاگت | 0.177 | 1.955 |
| کل لاگت | $0.013 | $0.235 |
| درست ٹیسٹس | ||
| غلط ٹیسٹس | 7 | 2 |
| فی کوشش کامیابی کی شرح | 59.5% | 85.7% |
| غیر مستحکم ٹیسٹ | 2 | 0 |
| آؤٹ پٹ ٹوکنز | 1,353 | 1,258 |
| ریزننگ ٹوکنز | 24,362 | 93,374 |
زمرہ وار تفصیل
| ڈیٹا پارسنگ اور استخراج | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 9.88 | 10.00 | 100.0% | 0 | 246 | 2,743 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 10.00 | 10.00 | 100.0% | 0 | 283 | 14,892 |
| ڈومین مخصوص | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 1.00 | 10.00 | 0.0% | 0 | 0 | 0 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 4.00 | 10.00 | 33.3% | 0 | 56 | 39,882 |
| ہدایات کی پیروی | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 8.00 | 9.99 | 50.0% | 0 | 69 | 2,050 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 9.50 | 9.99 | 100.0% | 0 | 102 | 9,257 |
| Puzzle Solving | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 5.33 | 4.91 | 77.8% | 2 | 462 | 4,982 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 10.00 | 10.00 | 100.0% | 0 | 322 | 22,508 |
| ٹول کالنگ | اسکور | تسلسل | فی کوشش کامیابی کی شرح | غیر مستحکم ٹیسٹ | درست ٹیسٹس | آؤٹ پٹ ٹوکنز | ریزننگ ٹوکنز |
|---|---|---|---|---|---|---|---|
| ByteDance Seed: Seed-2.0-Mini | 10.00 | 10.00 | 100.0% | 0 | 222 | 5,235 | |
| Qwen: Qwen3.5 Plus 2026-02-15 | 10.00 | 10.00 | 100.0% | 0 | 309 | 909 |
موازنہ کی جوڑی تبدیل کریں
ByteDance Seed: Seed-2.0-Mini کا موازنہ اس کے ساتھ کریں...
- Google: Gemini 3 Flash Preview medium
- Google: Gemini 3.1 Pro Preview medium
- Google: Gemini 3 Pro Preview medium
- Qwen: Qwen3.5 Plus 2026-02-15 medium
- Qwen: Qwen3.5-27B medium
- Google: Gemini 3 Flash Preview low
- OpenAI: GPT-5.3-Codex medium
- Anthropic: Claude Sonnet 4.6 medium
- Z.ai: GLM 5 medium
- Google: Gemini 3 Flash Preview none
- StepFun: Step 3.5 Flash medium مفت دستیاب
- OpenAI: GPT-5.2 medium
- Qwen: Qwen3.5-122B-A10B medium
- Anthropic: Claude Sonnet 4.6 none
- Qwen: Qwen3.5 Plus 2026-02-15 none
- xAI: Grok 4.1 Fast medium
- MoonshotAI: Kimi K2.5 medium
- Z.ai: GLM 5 none
- Anthropic: Claude Opus 4.6 medium
- Xiaomi: MiMo-V2-Flash medium
- Qwen: Qwen3.5-35B-A3B medium
- OpenAI: GPT-5 Nano medium
- Qwen: Qwen3.5-Flash medium
- OpenAI: gpt-oss-120b medium مفت دستیاب
- MiniMax: MiniMax M2.5 medium
- Qwen: Qwen3.5-122B-A10B none
- OpenAI: GPT-4o-mini none
- Qwen: Qwen3.5-27B none
- Qwen: Qwen3.5-35B-A3B none
- Z.ai: GLM 4.7 Flash medium
- MoonshotAI: Kimi K2.5 none
- Qwen: Qwen3 Coder Next none
- Z.ai: GLM 4.7 Flash none
- Qwen: Qwen3.5-Flash none
- Qwen: Qwen3 Coder Next medium
- Xiaomi: MiMo-V2-Flash none
- xAI: Grok 4.1 Fast none
- LiquidAI: LFM2-24B-A2B none
Qwen: Qwen3.5 Plus 2026-02-15 کا موازنہ اس کے ساتھ کریں...
- Google: Gemini 3 Flash Preview medium
- Google: Gemini 3.1 Pro Preview medium
- Google: Gemini 3 Pro Preview medium
- Qwen: Qwen3.5-27B medium
- Google: Gemini 3 Flash Preview low
- OpenAI: GPT-5.3-Codex medium
- Anthropic: Claude Sonnet 4.6 medium
- Z.ai: GLM 5 medium
- Google: Gemini 3 Flash Preview none
- StepFun: Step 3.5 Flash medium مفت دستیاب
- OpenAI: GPT-5.2 medium
- Qwen: Qwen3.5-122B-A10B medium
- Anthropic: Claude Sonnet 4.6 none
- Qwen: Qwen3.5 Plus 2026-02-15 none
- xAI: Grok 4.1 Fast medium
- MoonshotAI: Kimi K2.5 medium
- ByteDance Seed: Seed-2.0-Mini medium
- Z.ai: GLM 5 none
- Anthropic: Claude Opus 4.6 medium
- Xiaomi: MiMo-V2-Flash medium
- Qwen: Qwen3.5-35B-A3B medium
- OpenAI: GPT-5 Nano medium
- Qwen: Qwen3.5-Flash medium
- OpenAI: gpt-oss-120b medium مفت دستیاب
- MiniMax: MiniMax M2.5 medium
- Qwen: Qwen3.5-122B-A10B none
- OpenAI: GPT-4o-mini none
- Qwen: Qwen3.5-27B none
- Qwen: Qwen3.5-35B-A3B none
- Z.ai: GLM 4.7 Flash medium
- MoonshotAI: Kimi K2.5 none
- Qwen: Qwen3 Coder Next none
- Z.ai: GLM 4.7 Flash none
- Qwen: Qwen3.5-Flash none
- Qwen: Qwen3 Coder Next medium
- Xiaomi: MiMo-V2-Flash none
- xAI: Grok 4.1 Fast none
- LiquidAI: LFM2-24B-A2B none