AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY ব্যর্থতা

কোন উত্তর নেই ব্যর্থতা

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি কোন উত্তর নেই সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

6

মোট ব্যর্থতা

7

সবচেয়ে বেশি প্রভাবিত মডেল

GPT-5.2 1
র‍্যাঙ্ক মডেল কোম্পানি কোন উত্তর নেই সংখ্যা গড় স্কোর সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)
#27 GPT-5.2 medium OpenAI 1 6.5 10/16 15.3s
#14 GLM 5 medium Z.ai 1 7.4 11/16 16.2s
#30 Grok 4.1 Fast medium X AI 1 6.2 9/16 26.3s
#52 GLM 4.7 Flash medium Z.ai 2 3.1 4/16 36.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#28 Kimi K2.5 medium Moonshot AI 1 6.4 9/16 69.8s

কোন উত্তর নেই সংখ্যা অনুযায়ী শীর্ষ মডেল

কোন উত্তর নেই সংখ্যা বনাম গড় স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল