#30
DeepSeek V3.2
Deepseek · প্রকাশ: 2025-12-01 · deepseek/deepseek-v3.2::none
গড় স্কোর
4.70
প্রতি ফলাফলে খরচ
0.132
ধারাবাহিকতা
8.20
মোট খরচ
$0.007
সঠিক টেস্ট
5
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।
ভুল টেস্ট
9
প্রতি চেষ্টায় পাস রেট: 47.6%
অস্থির টেস্ট
3
প্রতিক্রিয়া সময়: গড় 6.22s · মোট 87.03s · সর্বোচ্চ 16.20s
ভুল উত্তর: 6
অতিরিক্ত ফরম্যাটিং: 2
নির্দেশনা অনুসরণ করা হয়নি: 1
স্কোর অনুযায়ী শীর্ষ মডেল
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
দ্রুত তুলনা
DeepSeek V3.2nonevsGPT-4o-mininoneDeepSeek V3.2nonevsQwen3.5-27BnoneDeepSeek V3.2nonevsQwen3.5-122B-A10BnoneDeepSeek V3.2nonevsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsMiniMax M2.5mediumDeepSeek V3.2nonevsTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যDeepSeek V3.2nonevsGemini 3 Flash PreviewmediumDeepSeek V3.2nonevsGemini 3.1 Pro PreviewmediumDeepSeek V3.2nonevsStep 3.5 Flashmediumবিনামূল্যে উপলভ্য
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | গড় স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| Anti-AI Tricks | 1.00 | 9.68 | 0/3 |
| Data parsing and extraction | 5.38 | 5.81 | 1/2 |
| Domain specific | 1.00 | 7.21 | 0/3 |
| Instructions following | 8.00 | 9.99 | 1/2 |
| Puzzle Solving | 7.67 | 7.50 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |