#78
DeepSeek
रिलीज़: 2026-04-24
परीक्षण किया गया: 2026-04-29 14:46
deepseek/deepseek-v4-pro::none
(high)
(none)
???? ???
$0.435 / 1M
????? ???
$0.870 / 1M
अस्थिर टेस्ट
3
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-05-22 00:38 सूट बदला गया | 6.0 | 8.1 | $0.046 | तुलना करें | |
| 2026-04-29 14:46 दोबारा परीक्षण | 6.2 | 7.9 | $0.043 | वर्तमान रन | |
| 2026-04-24 09:19 पहला रन | 3.1 | लागू नहीं | $0.009 | तुलना करें |
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-29 14:46 · दोबारा परीक्षण | 6.2 | 8.7 | 7.9 | 7/18 | 3 | 3,903 | $0.043 | 14.01s |
| 2026-05-22 00:38 · सूट बदला गया | 6.0 | 8.9 | 8.1 | 8/20 | 3 | 5,347 | $0.046 | 13.48s |
| अंतर | +0.1 | -0.2 | -0.2 | -1 | 0 | -1444 | -$0.004 | +529ms |
इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।
चार्ट
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
स्कोर vs कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
त्वरित तुलना
DeepSeek V4 PrononevsDeepSeek V4 ProhighDeepSeek V4 PrononevsGrok Build 0.1noneDeepSeek V4 PrononevsKimi K2.5mediumDeepSeek V4 PrononevsQwen3.6 27BmediumDeepSeek V4 PrononevsGemini 3.1 Flash LiteminimalDeepSeek V4 PrononevsGemini 3 Flash PreviewmediumDeepSeek V4 PrononevsGemini 3.5 FlashhighDeepSeek V4 PrononevsRing-2.6-1TmediumDeepSeek V4 PrononevsGemini 3.5 Flashlow
श्रेणी विवरण
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 3.5 | 8.0 | |
| कोडिंग | 7.1 | 3.7 | |
| संयुक्त | 9.5 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 10.0 | |
| Samanya Buddhimatta | 4.3 | 9.9 | |
| निर्देश पालन | 6.3 | 10.0 | |
| पहेली समाधान | 6.0 | 7.1 | |
| टूल कॉलिंग | 10.0 | 10.0 |