نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs OpenAI: gpt-oss-120b

خلاصہ

Ling-2.6-flash vs gpt-oss-120b benchmark موازنہ: gpt-oss-120b average score میں آگے ہے: 6.1 vs 5.0. Ling-2.6-flash کی benchmark لاگت کم ہے: $0.001 vs $0.013. Ling-2.6-flash تیز ہے: 9.34s vs 22.28s، pass rates 31.8% vs 52.4%.

تجویز کردہ ماڈل: Ling-2.6-flash - It offers the best overall trade-off: a competitive score (5.0), lower cost than gpt-oss-120b, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-04

میٹرک Ling-2.6-flash Ling-2.6-flash none اجرا: 2026-04-21 gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب
اسکور 5.0 6.1
درجہ #138 #99
اعتماد پذیری 10.0 10.0
تسلسل 9.2 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 31.8% 52.4%
غیر مستحکم ٹیسٹ 2 5
کل رنز 63 63
فی نتیجہ لاگت 0.005 0.141
کل لاگت $0.001 $0.013
ان پٹ قیمت $0.010 / 1M $0.039 / 1M
آؤٹ پٹ قیمت $0.030 / 1M $0.180 / 1M
کل ان پٹ ٹوکنز 40,718 39,084
آؤٹ پٹ ٹوکنز 2,878 20,013
ریزننگ ٹوکنز 0 50,233
ردِعمل کا وقت (اوسط) 9.34s 22.28s
ردِعمل کا وقت (زیادہ سے زیادہ) 35.34s 68.16s
ردِعمل کا وقت (کل) 177.48s 311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Ling-2.6-flash

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#99 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 5.3 10.0 33.3% 0 11.21s 813 381 0
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں