AI BENCHY
Advertise here

#73

GPT-5 Mini

OpenAI रिलीज़: 2025-08-07 परीक्षण किया गया: 2026-05-22 00:16 openai/gpt-5-mini::medium

संगति

9.1

कुल आउटपुट टोकन

69,805

कुल इनपुट टोकन

34,481

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$2.000 / 1M

सही परीक्षण

गलत टेस्ट: 9

प्रति प्रयास पास दर: 61.7%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

23.75s

प्रतिक्रिया समय (अधिकतम): 88.15s

प्रतिक्रिया समय (कुल): 475.03s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:16 दोबारा परीक्षण 6.9 10.0 $0.150 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 7.0 लागू नहीं $0.128 तुलना करें

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-22 00:16 · वर्तमान रन7.29.110.011/20269,80534,481$0.14923.75s
2026-04-11 01:44 · पहला दर्ज रन7.08.6लागू नहीं9/18359,8610$0.12823.98s
अंतर+0.1+0.5+2-1+9944+34481+$0.021-224ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $0.250 / 1M $2.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 7.1 7.6
कोडिंग 10.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.6 7.2
Samanya Buddhimatta 4.5 10.0
निर्देश पालन 10.0 10.0
पहेली समाधान 5.6 9.8
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल