नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

तुलना केलेली मॉडेल्स

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-25

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash high प्रकाशन: 2026-04-24 DeepSeek V4 Pro DeepSeek V4 Pro high प्रकाशन: 2026-04-24 GLM 5 GLM 5 medium प्रकाशन: 2026-02-12
स्कोअर 7.8 7.4 8.4
क्रमांक #36 #49 #15
विश्वसनीयता 10.0 3.9 लागू नाही
सुसंगतता 7.8 9.2 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 79.6% 77.8% 85.2%
अस्थिर चाचण्या 5 2 4
एकूण रन 54 54 54
प्रति निकाल खर्च 0.277 2.524 1.188
एकूण खर्च $0.031 $0.329 $0.155
???? ??? $0.140 / 1M $1.740 / 1M $0.600 / 1M
????? ??? $0.280 / 1M $3.480 / 1M $2.080 / 1M
आउटपुट टोकन्स 1,765 1,937 20,163
रिझनिंग टोकन्स 90,299 82,625 58,337
प्रतिसाद वेळ (सरासरी) 45.41s 72.92s 23.34s
प्रतिसाद वेळ (कमाल) 218.13s 414.38s 79.09s
प्रतिसाद वेळ (एकूण) 817.30s 1312.59s 233.40s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
DeepSeek V4 Pro 7.4 10.0 75.0% 0 29.33s 83 3,829
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
DeepSeek V4 Pro 10.0 10.0 100.0% 0 81.96s 339 6,962
GLM 5 10.0 10.0 100.0% 0 79.09s 330 19,814
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
DeepSeek V4 Pro 6.6 10.0 100.0% 0 71.08s 134 2,163
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
DeepSeek V4 Pro 8.8 10.0 100.0% 0 88.40s 795 6,370
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
DeepSeek V4 Pro 4.5 10.0 33.3% 0 202.43s 22 53,478
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
DeepSeek V4 Pro 6.1 3.1 66.7% 1 23.11s 106 1,248
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
DeepSeek V4 Pro 10.0 10.0 100.0% 0 20.97s 66 2,590
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
DeepSeek V4 Pro 7.6 7.4 77.8% 1 51.47s 223 5,645
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
DeepSeek V4 Pro 7.6 10.0 100.0% 0 38.69s 169 340
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994

झटपट तुलना

तुलना जोडी बदला