نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs ByteDance Seed: Seed-2.0-Mini

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک Anthropic: Claude Opus 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم ByteDance Seed: Seed-2.0-Mini medium اجرا: 2026-02-26
درجہ #20 #18
اسکور 6.07 6.13
تسلسل 8.80 8.91
فی نتیجہ لاگت 10.992 0.177
کل لاگت $0.880 $0.013
درست ٹیسٹس
غلط ٹیسٹس 6 7
فی کوشش کامیابی کی شرح 61.9% 59.5%
غیر مستحکم ٹیسٹ 2 2
آؤٹ پٹ ٹوکنز 19,576 1,353
ریزننگ ٹوکنز 11,081 24,362

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 4.00 4.41 55.6% 2 897 1,000
ByteDance Seed: Seed-2.0-Mini 7.00 9.99 66.7% 0 354 9,352
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 668 763
ByteDance Seed: Seed-2.0-Mini 9.88 10.00 100.0% 0 246 2,743
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 1.00 10.00 0.0% 0 16,328 7,928
ByteDance Seed: Seed-2.0-Mini 1.00 10.00 0.0% 0 0 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 9.50 9.99 100.0% 0 266 468
ByteDance Seed: Seed-2.0-Mini 8.00 9.99 50.0% 0 69 2,050
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 7.00 10.00 66.7% 0 556 593
ByteDance Seed: Seed-2.0-Mini 5.33 4.91 77.8% 2 462 4,982
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 861 329
ByteDance Seed: Seed-2.0-Mini 10.00 10.00 100.0% 0 222 5,235

موازنہ کی جوڑی تبدیل کریں