AI BENCHY
Advertise here

#57

GPT-5.3 Chat

OpenAI रिलीज़: 2026-03-03 परीक्षण किया गया: 2026-05-22 00:20 openai/gpt-5.3-chat::none

संगति

8.4

कुल आउटपुट टोकन

24,757

कुल इनपुट टोकन

31,590

इनपुट कीमत

$1.750 / 1M

आउटपुट कीमत

$14.000 / 1M

सही परीक्षण

गलत टेस्ट: 8

प्रति प्रयास पास दर: 68.3%

अस्थिर टेस्ट

4

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

6.13s

प्रतिक्रिया समय (अधिकतम): 18.33s

प्रतिक्रिया समय (कुल): 122.61s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:20 दोबारा परीक्षण 7.4 10.0 $0.401 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 7.7 लागू नहीं $0.340 तुलना करें

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-22 00:20 · वर्तमान रन7.48.410.012/20424,75731,590$0.4026.13s
2026-04-11 01:44 · पहला दर्ज रन7.78.6लागू नहीं11/18320,7840$0.3405.88s
अंतर-0.3-0.2+1+1+3973+31590+$0.063+247ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $1.750 / 1M $14.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 6.7 8.1
कोडिंग 6.9 6.2
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.5 4.4
Samanya Buddhimatta 4.6 10.0
निर्देश पालन 9.8 10.0
पहेली समाधान 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल