#104
DeepSeek
रिलीज़: 2025-12-01
परीक्षण किया गया: 2026-05-08 15:31
deepseek/deepseek-v3.2::none
(medium)
(none)
???? ???
$0.252 / 1M
????? ???
$0.378 / 1M
अस्थिर टेस्ट
5
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-05-22 00:35 सूट बदला गया | 5.6 | 10.0 | $0.018 | तुलना करें | |
| 2026-05-08 15:31 सूट बदला गया | 5.7 | 10.0 | $0.016 | वर्तमान रन | |
| 2026-04-20 17:48 पहला दर्ज रन | 6.1 | लागू नहीं | $0.016 | तुलना करें |
इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|
| 2026-05-08 15:31 · सूट बदला गया | 5.7 | 7.9 | 10.0 | 7/19 | 5 | 7,194 | $0.016 | 13.43s |
| 2026-04-20 17:48 · पहला दर्ज रन | 6.1 | 8.1 | लागू नहीं | 7/18 | 4 | 8,384 | $0.016 | 12.09s |
| अंतर | -0.5 | -0.2 | 0 | +1 | -1190 | -$0.001 | +1340ms |
इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।
चार्ट
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
स्कोर vs कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
त्वरित तुलना
DeepSeek V3.2nonevsGLM 5V TurbononeDeepSeek V3.2nonevsOwl AlphamediumDeepSeek V3.2nonevsQwen3.5-FlashnoneDeepSeek V3.2nonevsQwen3.5 Plus 2026-04-20noneDeepSeek V3.2nonevsNemotron 3 Supermediumनिःशुल्क उपलब्धDeepSeek V3.2nonevsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsGemini 3 Flash PreviewmediumDeepSeek V3.2nonevsGemini 3.5 FlashhighDeepSeek V3.2nonevsRing-2.6-1TmediumDeepSeek V3.2nonevsGemini 3.5 Flashlow
श्रेणी विवरण
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 3.3 | 8.2 | |
| कोडिंग | 2.4 | 1.3 | |
| संयुक्त | 6.5 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 6.3 | 5.8 | |
| डोमेन-विशिष्ट | 3.0 | 6.9 | |
| Samanya Buddhimatta | 7.6 | 10.0 | |
| निर्देश पालन | 10.0 | 10.0 | |
| पहेली समाधान | 7.5 | 7.7 | |
| टूल कॉलिंग | 10.0 | 10.0 | |
| सामान्य ज्ञान | 3.0 | 10.0 |