نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Flash

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک Anthropic: Claude Opus 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم Xiaomi: MiMo-V2-Flash medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #20 #21
اسکور 6.07 6.00
تسلسل 8.80 8.79
فی نتیجہ لاگت 10.992 0.364
کل لاگت $0.880 $0.030
درست ٹیسٹس
غلط ٹیسٹس 6 6
فی کوشش کامیابی کی شرح 61.9% 64.3%
غیر مستحکم ٹیسٹ 2 2
آؤٹ پٹ ٹوکنز 19,576 11,650
ریزننگ ٹوکنز 11,081 93,283

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 4.00 4.41 55.6% 2 897 1,000
Xiaomi: MiMo-V2-Flash 9.67 9.99 100.0% 0 1,328 18,739
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 668 763
Xiaomi: MiMo-V2-Flash 5.50 10.00 50.0% 0 153 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 1.00 10.00 0.0% 0 16,328 7,928
Xiaomi: MiMo-V2-Flash 4.00 7.21 55.6% 1 8,363 51,202
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 9.50 9.99 100.0% 0 266 468
Xiaomi: MiMo-V2-Flash 9.50 9.99 100.0% 0 72 3,504
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 7.00 10.00 66.7% 0 556 593
Xiaomi: MiMo-V2-Flash 1.00 7.14 11.1% 1 1,413 7,123
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 861 329
Xiaomi: MiMo-V2-Flash 10.00 10.00 100.0% 0 321 12,715

موازنہ کی جوڑی تبدیل کریں