नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5 Plus 2026-02-15

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium रिलीज़: 2026-02-15
रैंक #20 #5
औसत स्कोर 7.3 8.3
संगति 8.5 9.5
प्रति परिणाम लागत 3.163 1.264
कुल लागत $0.317 $0.165
सही परीक्षण
प्रति प्रयास पास दर 70.8% 85.4%
अस्थिर टेस्ट 3 1
कुल रन 48 48
आउटपुट टोकन 19,272 1,735
रीजनिंग टोकन 0 77,212
प्रतिक्रिया समय (औसत) 5.96s 34.45s
प्रतिक्रिया समय (अधिकतम) 18.33s 79.86s
प्रतिक्रिया समय (कुल) 95.30s 310.09s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 10.37s 186 5,926
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Qwen3.5 Plus 2026-02-15 9.9 10.0 100.0% 0 46.91s 270 14,916
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Qwen3.5 Plus 2026-02-15 4.0 10.0 33.3% 0 17.50s 35 16,680
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Qwen3.5 Plus 2026-02-15 10.0 1.6 66.7% 1 79.86s 73 8,675
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 34.57s 340 14,496
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909

त्वरित तुलना

तुलना जोड़ी बदलें