#26

GPT-5 Mini

OpenAI रिलीज़: 2025-08-07 परीक्षण किया गया: 2026-07-16 22:27 openai/gpt-5-mini::medium

सारांश

GPT-5 Mini AI BENCHY पर 8.1 स्कोर करता है और #26 पर है। इसकी reliability 10.0, pass rate 63.6%, कुल लागत $0.237, और औसत response time 27.63s है।

GPT-5 Mini को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

8.1

संगति

8.8

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.237

कुल आउटपुट टोकन

105,932

कुल इनपुट टोकन

98,374

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$2.000 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 63.6%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

27.63s

प्रतिक्रिया समय (अधिकतम): 111.48s

प्रतिक्रिया समय (कुल): 607.92s

गलत उत्तर: 5 निर्देशों का पालन नहीं किया: 3 कोई उत्तर नहीं: 1 समय समाप्त: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#26 GPT-5 Mini

medium

लागत: $0.007
समय: 42.9s
टोकन: 3,432 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:27 नया टेस्ट जोड़ा गया	8.1	10.0	$0.237	वर्तमान रन
2026-06-04 13:43 नया टेस्ट जोड़ा गया	7.3	10.0	$0.159	तुलना करें
2026-05-22 00:16 दोबारा परीक्षण	6.9	10.0	$0.150	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	7.0	लागू नहीं	$0.128	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 22:27 · वर्तमान रन	8.1	8.8	10.0	12/22	3	105,932	98,374	$0.237	27.63s
2026-04-11 01:44 · पहला दर्ज रन	7.0	8.6	लागू नहीं	9/18	3	59,861	0	$0.128	23.98s
अंतर	+1.1	+0.2		+3	0	+46071	+98374	+$0.110	+3657ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.250 / 1M	$2.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

GPT-5 MinimediumvsGemini 2.5 Flashmedium GPT-5 MinimediumvsMuse Spark 1.1high GPT-5 MinimediumvsMuse Spark 1.1low GPT-5 MinimediumvsStep 3.7 Flashmedium GPT-5 MinimediumvsClaude Sonnet 5medium GPT-5 MinimediumvsGPT-5.2 Chatnone GPT-5 MinimediumvsGemini 3 Flash Previewmedium GPT-5 MinimediumvsGemini 3.5 Flashhigh GPT-5 MinimediumvsNemotron 3 Ultramediumनिःशुल्क उपलब्ध GPT-5 MinimediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	7.1	7.6
कोडिंग	10.0	10.0
संयुक्त	7.3	5.8
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.6	7.2
Samanya Buddhimatta	4.5	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	5.6	9.8
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

GPT-5 Mini

Hamster playing table tennis

#26 GPT-5 Mini

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल