নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

তুলনা করা মডেল

সারাংশ

DeepSeek V4 Pro vs DeepSeek V4 Flash vs Ling-2.6-flash vs GLM 5 benchmark তুলনাGLM 5 স্কোর-এ 8.6 নিয়ে এগিয়ে। DeepSeek V4 Flash নির্ভরযোগ্যতা-এ 10.0 নিয়ে এগিয়ে। Ling-2.6-flash-এর মোট খরচ সবচেয়ে কম, $0.001. Ling-2.6-flash 9.34s-এ সবচেয়ে দ্রুত।

প্রস্তাবিত মডেল: Ling-2.6-flash - It offers the best overall trade-off: a competitive score (4.9), lower cost than এই তুলনার অন্য মডেলগুলো, and balanced response time.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক DeepSeek V4 Pro DeepSeek V4 Pro high প্রকাশ: 2026-04-24 DeepSeek V4 Flash DeepSeek V4 Flash high প্রকাশ: 2026-04-24 Ling-2.6-flash Ling-2.6-flash none প্রকাশ: 2026-04-21 GLM 5 GLM 5 medium প্রকাশ: 2026-02-12
স্কোর 6.3 8.3 4.9 8.6
র‍্যাঙ্ক #90 #26 #147 #18
নির্ভরযোগ্যতা 9.0 10.0 10.0 10.0
ধারাবাহিকতা 7.6 8.5 9.2 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 52.4% 74.6% 31.8% 82.5%
অস্থির টেস্ট 6 4 2 4
মোট রান 63 63 63 63
প্রতি ফলাফলে খরচ 2.869 0.299 0.005 1.668
মোট খরচ $0.079 $0.029 $0.001 $0.228
ইনপুট মূল্য $0.435 / 1M $0.098 / 1M $0.010 / 1M $0.600 / 1M
আউটপুট মূল্য $0.870 / 1M $0.196 / 1M $0.030 / 1M $1.920 / 1M
মোট ইনপুট টোকেন 32,240 39,745 40,718 35,224
আউটপুট টোকেন 12,250 10,310 2,878 21,570
রিজনিং টোকেন 72,257 123,501 0 102,996
প্রতিক্রিয়া সময় (গড়) 65.21s 45.85s 9.34s 33.54s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 358.35s 218.13s 35.34s 99.85s
প্রতিক্রিয়া সময় (মোট) 1304.19s 962.79s 177.48s 435.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 DeepSeek V4 Pro

high
Cost
$0.023
Time
257.6s
Tokens
14,870 tok

#26 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

#147 Ling-2.6-flash

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#18 GLM 5

medium
Cost
$0.005
Time
20.7s
Tokens
2,068 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 6.4 7.9 58.3% 1 16.53s 448 71 3,617
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.3 6.4 11.1% 1 118.23s 1,966 111 20,940
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
Ling-2.6-flash 5.3 10.0 33.3% 0 11.21s 813 381 0
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 14,016 465 5,914
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 7.3 5.9 83.3% 1 23.62s 5,633 229 1,710
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 2.9 7.2 11.1% 1 205.66s 430 10,529 28,089
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 314 76 1,152
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 627 205 2,416
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.9 7.2 55.6% 1 34.84s 544 139 4,019
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 8,079 372 593
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 183 53 3,807
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

দ্রুত তুলনা

তুলনার জুটি বদলান