নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5.2

সারাংশ

GPT-5.2 Chat vs GPT-5.2 benchmark তুলনা: GPT-5.2 Chat average score-এ এগিয়ে: 8.5 vs 8.4. GPT-5.2 Chat-এর benchmark খরচ কম: $0.393 vs $0.548. GPT-5.2 Chat দ্রুত: 7.13s vs 16.88s, pass rates 74.6% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.2 Chat - It has the best score here (8.5), while responding about 2.4x faster than GPT-5.2.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.2 Chat GPT-5.2 Chat none প্রকাশ: 2025-12-11 GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11
স্কোর 8.5 8.4
র‍্যাঙ্ক #19 #22
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.9 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 74.6% 71.4%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.803 4.209
মোট খরচ $0.393 $0.548
ইনপুট মূল্য $1.750 / 1M $1.750 / 1M
আউটপুট মূল্য $14.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 34,212 33,967
আউটপুট টোকেন 23,744 2,901
রিজনিং টোকেন 0 31,932
প্রতিক্রিয়া সময় (গড়) 7.13s 16.88s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 38.52s 77.80s
প্রতিক্রিয়া সময় (মোট) 149.69s 236.34s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#19 GPT-5.2 Chat

none
খরচ
$0.010
সময়
15.3s
টোকেন
797 tok

#22 GPT-5.2

medium
খরচ
$0.047
সময়
49.2s
টোকেন
3,396 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223

দ্রুত তুলনা

তুলনার জুটি বদলান