नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Cobuddy vs OpenAI: GPT-5.4 Mini

सारांश

Cobuddy vs GPT-5.4 Mini benchmark तुलना: GPT-5.4 Mini average score में आगे है: 5.3 vs 4.9. Cobuddy की benchmark लागत कम है: $0.000 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 39.90s, pass rates 47.6% vs 30.2%.

अनुशंसित मॉडल: GPT-5.4 Mini - It has the best score here (5.3), while responding about 35.2x faster than Cobuddy.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Cobuddy Cobuddy medium रिलीज़: 2026-05-06 GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17
स्कोर 4.9 5.3
रैंक #144 #131
विश्वसनीयता 10.0 10.0
संगति 7.5 8.8
सही परीक्षण
प्रति प्रयास पास दर 47.6% 30.2%
अस्थिर टेस्ट 6 3
कुल रन 63 63
प्रति परिणाम लागत 0.000 0.743
कुल लागत $0.000 $0.038
इनपुट कीमत $0.000 / 1M $0.750 / 1M
आउटपुट कीमत $0.000 / 1M $4.500 / 1M
कुल इनपुट टोकन 37,449 34,244
आउटपुट टोकन 1,677 2,541
रीजनिंग टोकन 116,703 0
प्रतिक्रिया समय (औसत) 39.90s 1.13s
प्रतिक्रिया समय (अधिकतम) 309.02s 2.52s
प्रतिक्रिया समय (कुल) 797.98s 23.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#144 Cobuddy

medium
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

त्वरित तुलना

तुलना जोड़ी बदलें