नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs xAI: Grok 4.3

सारांश

GPT-5.2 Chat vs Grok 4.3 benchmark तुलना: GPT-5.2 Chat average score में आगे है: 8.5 vs 7.7. GPT-5.2 Chat की benchmark लागत कम है: $0.393 vs $0.614. GPT-5.2 Chat तेज है: 7.13s vs 47.51s, pass rates 74.6% vs 71.4%.

अनुशंसित मॉडल: GPT-5.2 Chat - It has the best score here (8.5), while costing about 1.6x less than Grok 4.3.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11 Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 8.5 7.7
रैंक #22 #40
विश्वसनीयता 10.0 10.0
संगति 8.9 8.5
सही परीक्षण
प्रति प्रयास पास दर 74.6% 71.4%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 2.803 4.724
कुल लागत $0.393 $0.614
इनपुट कीमत $1.750 / 1M $1.250 / 1M
आउटपुट कीमत $14.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 34,212 44,472
आउटपुट टोकन 23,744 1,981
रीजनिंग टोकन 0 221,382
प्रतिक्रिया समय (औसत) 7.13s 47.51s
प्रतिक्रिया समय (अधिकतम) 38.52s 216.69s
प्रतिक्रिया समय (कुल) 149.69s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2 Chat

none
Cost
$0.010
Time
15.3s
Tokens
797 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

त्वरित तुलना

तुलना जोड़ी बदलें