#33

GPT-5 Mini

OpenAI · প্রকাশ: 2025-08-07 · openai/gpt-5-mini::medium

গড় স্কোর

5.77

প্রতি ফলাফলে খরচ

1.200

ধারাবাহিকতা

8.80

মোট খরচ

$0.084

সঠিক টেস্ট

7

একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।

ভুল টেস্ট

7

প্রতি চেষ্টায় পাস রেট: 57.1%

অস্থির টেস্ট

2

প্রতিক্রিয়া সময়: গড় 21.47s · মোট 300.64s · সর্বোচ্চ 82.55s

নির্দেশনা অনুসরণ করা হয়নি: 3 ভুল উত্তর: 3 টাইমআউট: 1

স্কোর অনুযায়ী শীর্ষ মডেল

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

#27 GLM 5 6.08

#28 Claude Opus 4.6 6.08

#29 MiMo-V2-Flash 6.00

#30 Qwen3.5-35B-A3B 5.93

#31 GPT-5 Nano 5.86

#32 Qwen3.5-Flash 5.79

#33 GPT-5 Mini 5.77

#34 gpt-oss-120b 5.65

#35 MiniMax M2.5 5.65

#36 Gemini 2.5 Flash 5.34

#37 Qwen3.5-122B-A10B 5.20

#38 GPT-4o-mini 4.86

#39 DeepSeek V3.2 4.70

বিভাগ	গড় স্কোর	ধারাবাহিকতা	সঠিক টেস্ট
Anti-AI Tricks	7.00	9.62	2/3
Data parsing and extraction	9.88	10.00	2/2
Domain specific	1.00	7.21	0/3
Instructions following	7.00	6.64	1/2
Puzzle Solving	4.34	9.78	1/3
Tool Calling	10.00	10.00	1/1