AI BENCHY
Advertise here
#144

GPT-4o-mini

OpenAI प्रकाशन: 2024-07-18 चाचणी तारीख: 2026-06-04 13:04 openai/gpt-4o-mini::none

सारांश

GPT-4o-mini AI BENCHY वर 5.0 स्कोर करते आणि #144 वर आहे. याची reliability 10.0, pass rate 23.8%, एकूण खर्च $0.006, आणि सरासरी response time 1.77s आहे.

GPT-4o-mini खास का आहे: समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

सुसंगतता

9.9

एकूण आउटपुट टोकन्स

1,982

एकूण इनपुट टोकन्स

31,518

इनपुट किंमत

$0.150 / 1M

आउटपुट किंमत

$0.600 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 23.8%

अस्थिर चाचण्या

0

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.77s

प्रतिसाद वेळ (कमाल): 7.58s

प्रतिसाद वेळ (एकूण): 24.80s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#144 GPT-4o-mini

none
खर्च
$0.001
वेळ
6.6s
टोकन्स
742 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:04 नवीन चाचणी जोडली 4.8 10.0 $0.006 सध्याची रन
2026-05-21 23:41 सूट बदलला 4.9 10.0 $0.006 तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन 4.9 लागू नाही $0.005 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:04 · सध्याची रन5.09.910.05/2101,98231,518$0.0061.77s
2026-05-21 23:41 · सूट बदलला4.99.910.05/2001,9770$0.0061.87s
फरक+0.10.00.000+5+31518+$0.001-101ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.150 / 1M $0.600 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 3.2 9.6
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 4.0 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 3.5 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स