AI BENCHY Compare
Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4
তুলনা করুন:
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-05
| মেট্রিক | Google: Gemini 3 Flash Preview low প্রকাশ: 2025-12-17 | OpenAI: GPT-5.4 medium প্রকাশ: 2026-03-05 |
|---|---|---|
| গড় স্কোর | 8.1 | 8.2 |
| সঠিক টেস্ট | ||
| র্যাঙ্ক | #8 | #7 |
| ধারাবাহিকতা | 9.4 | 8.9 |
| প্রতি ফলাফলে খরচ | 0.627 | 6.533 |
| মোট খরচ | $0.076 | $0.784 |
| প্রতি চেষ্টায় পাস রেট | 82.2% | 86.7% |
| অস্থির টেস্ট | 1 | 2 |
| common.totalAttempts | 45 (15 x 3) | 45 (15 x 3) |
| আউটপুট টোকেন | 1,466 | 1,611 |
| রিজনিং টোকেন | 18,969 | 46,321 |
| প্রতিক্রিয়া সময় (গড়) | 6.27s | 21.06s |
| প্রতিক্রিয়া সময় (সর্বোচ্চ) | 14.72s | 100.41s |
| প্রতিক্রিয়া সময় (মোট) | 94.05s | 315.95s |
স্কোর বনাম মোট খরচ
প্রতিক্রিয়া সময় (গড়)
গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)
বিভাগভিত্তিক বিশ্লেষণ
| অ্যান্টি-এআই কৌশল | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 10.0 | 10.0 | 100.0% | 0 | 3.50s | 275 | 2,476 | |
| OpenAI: GPT-5.4 | 10.0 | 10.0 | 100.0% | 0 | 5.02s | 216 | 1,466 |
| সমন্বিত | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 10.0 | 10.0 | 0.0% | 0 | 3.27s | 326 | 0 | |
| OpenAI: GPT-5.4 | 10.0 | 10.0 | 100.0% | 0 | 20.57s | 301 | 3,543 |
| ডেটা পার্সিং ও নিষ্কাশন | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 9.9 | 10.0 | 100.0% | 0 | 9.40s | 279 | 3,656 | |
| OpenAI: GPT-5.4 | 9.9 | 10.0 | 100.0% | 0 | 5.32s | 234 | 804 |
| ডোমেইন-নির্দিষ্ট | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 4.0 | 7.2 | 44.4% | 1 | 8.05s | 12 | 6,410 | |
| OpenAI: GPT-5.4 | 4.0 | 7.2 | 44.4% | 1 | 74.27s | 61 | 34,748 |
| নির্দেশনা অনুসরণ | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 9.5 | 10.0 | 100.0% | 0 | 7.02s | 71 | 2,752 | |
| OpenAI: GPT-5.4 | 10.0 | 10.0 | 100.0% | 0 | 3.11s | 93 | 897 |
| Puzzle Solving | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 10.0 | 10.0 | 100.0% | 0 | 6.11s | 269 | 3,260 | |
| OpenAI: GPT-5.4 | 7.0 | 7.2 | 88.9% | 1 | 9.13s | 442 | 3,832 |
| টুল কলিং | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|---|
| Google: Gemini 3 Flash Preview | 10.0 | 10.0 | 100.0% | 0 | 4.99s | 234 | 415 | |
| OpenAI: GPT-5.4 | 10.0 | 10.0 | 100.0% | 0 | 13.28s | 264 | 1,031 |
দ্রুত তুলনা
তুলনার জুটি বদলান
Gemini 3 Flash PreviewlowvsQwen3.5-122B-A10BmediumGemini 3.1 Flash Lite PreviewhighvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.2 ChatnoneGemini 3 Flash PreviewlowvsQwen3.5-27BmediumDeepSeek V3.2mediumvsGemini 3 Flash PreviewlowClaude Sonnet 4.6mediumvsGemini 3 Flash PreviewlowGemini 3 Flash PreviewlowvsGPT-5.3-CodexmediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsStep 3.5 Flashmediumবিনামূল্যে উপলভ্যGemini 3 Flash PreviewlowvsMiMo-V2-FlashmediumGemini 3 Flash PreviewlowvsGLM 5mediumGemini 3 Flash PreviewlowvsGPT-5.3 Chatnone