नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.5 Plus 2026-02-15

मॉडेल नाव:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले : 2026-02-27 15:16

सारांश

मेट्रिक OpenAI: GPT-5.3-Codex medium प्रकाशन: प्रकाशन तारीख अज्ञात Qwen: Qwen3.5 Plus 2026-02-15 medium प्रकाशन: प्रकाशन तारीख अज्ञात
क्रमांक #7 #4
स्कोअर 7.93 8.64
सुसंगतता 8.84 10.00
प्रति निकाल खर्च 4.641 1.955
एकूण खर्च $0.465 $0.235
बरोबर चाचण्या
चुकीच्या चाचण्या 4 2
प्रति प्रयत्न पास दर 78.6% 85.7%
अस्थिर चाचण्या 2 0
आउटपुट टोकन्स 1,201 1,258
रिझनिंग टोकन्स 30,056 93,374

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 216 1,421
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 186 5,926
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 234 735
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 283 14,892
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 4.00 7.21 55.6% 1 64 25,308
Qwen: Qwen3.5 Plus 2026-02-15 4.00 10.00 33.3% 0 56 39,882
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 9.00 10.00 50.0% 0 93 693
Qwen: Qwen3.5 Plus 2026-02-15 9.50 9.99 100.0% 0 102 9,257
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 7.00 7.38 77.8% 1 340 1,407
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 322 22,508
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या आउटपुट टोकन्स रिझनिंग टोकन्स
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 254 492
Qwen: Qwen3.5 Plus 2026-02-15 10.00 10.00 100.0% 0 309 909

तुलना जोडी बदला