AI BENCHY
Advertise here
#35

DeepSeek V4 Flash

DeepSeek प्रकाशन: 2026-04-24 चाचणी तारीख: 2026-06-04 13:02 deepseek/deepseek-v4-flash::high
(high) (none)

सारांश

DeepSeek V4 Flash AI BENCHY वर 7.7 स्कोर करते आणि #35 वर आहे. याची reliability 10.0, pass rate 74.6%, एकूण खर्च $0.028, आणि सरासरी response time 44.95s आहे.

DeepSeek V4 Flash खास का आहे: हे डेटा पार्सिंग आणि निष्कर्षण मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #12. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

सुसंगतता

8.5

एकूण खर्च (सध्याची किंमत)

$0.028 ↓ -27.3%

या किमतीवर चाचणी केली: $0.038

एकूण आउटपुट टोकन्स

128,045

एकूण इनपुट टोकन्स

38,019

इनपुट किंमत

$0.099 / 1M

आउटपुट किंमत

$0.197 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 8

प्रति प्रयत्न पास दर: 74.6%

अस्थिर चाचण्या

4

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

44.95s

प्रतिसाद वेळ (कमाल): 218.13s

प्रतिसाद वेळ (एकूण): 944.02s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 DeepSeek V4 Flash

high
Cost
$0.003
Time
93.1s
Tokens
7,926 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:24 पुन्हा चाचणी 7.7 10.0 $0.029 तुलना करा
2026-06-04 13:02 नवीन चाचणी जोडली 7.7 10.0 $0.028 सध्याची रन
2026-05-22 00:39 सूट बदलला 7.4 10.0 $0.038 तुलना करा
2026-04-25 21:41 पुन्हा चाचणी 7.8 लागू नाही $0.031 तुलना करा
2026-04-24 09:19 पहिला रन 7.8 लागू नाही $0.019 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:02 · नवीन चाचणी जोडली7.78.510.013/214128,04538,019$0.02844.95s
2026-04-24 09:19 · पहिला रन7.87.8लागू नाही11/18548,9160$0.01939.75s
फरक-0.1+0.7+2-1+79129+38019+$0.009+5207ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 13:03 $0.099 / 1M $0.197 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 8.3 10.0
कोडिंग 7.8 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 4.1 4.4
Samanya Buddhimatta 6.1 3.1
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 8.2 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स