AI BENCHY
Advertise here

#121

GPT-5.4

OpenAI रिलीज़: 2026-03-05 परीक्षण किया गया: 2026-05-22 00:18 openai/gpt-5.4::none
(medium) (none)

संगति

9.1

कुल आउटपुट टोकन

2,402

कुल इनपुट टोकन

31,593

इनपुट कीमत

$2.500 / 1M

आउटपुट कीमत

$15.000 / 1M

सही परीक्षण

गलत टेस्ट: 13

प्रति प्रयास पास दर: 38.3%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.45s

प्रतिक्रिया समय (अधिकतम): 2.95s

प्रतिक्रिया समय (कुल): 29.00s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:18 सूट बदला गया 5.6 10.0 $0.115 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 5.9 लागू नहीं $0.104 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-03 21:35 $2.500 / 1M $15.000 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 3.2 8.0
कोडिंग 6.8 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.4 9.9
निर्देश पालन 6.5 10.0
पहेली समाधान 5.6 9.8
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल