AI BENCHY
比較する
❤️ Made by XCS
Your ad here

モデル名

OpenAI: GPT-5.3-Codex

推論(medium)

ベンチマークは AI BENCHY テストスイートから次の日時に生成 : 2026/02/24

指標 OpenAI: GPT-5.3-Codex
順位#6
企業OpenAI
Score 7.77
一貫性 8.75
結果あたりのコスト 4.9342
合計コスト $0.44408
正解テスト
試行ごとの合格率 76.9%
不安定なテスト 2
出力トークン 947
推論トークン 29,564
応答時間(平均)17944ms
応答時間(合計)233267ms
応答時間(最大)100927ms

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア 応答時間(平均) コスト
反AIトリック 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
データ解析と抽出 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
ドメイン特化 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
指示追従 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

比較対象モデル

OpenAI: GPT-5.3-Codex と比較...

#5 · Google

Google: Gemini 3 Flash Preview

推論(low)

Score: 8.23

一貫性: 8.71

試行ごとの合格率: 82.0%

不安定なテスト: 2

結果あたりのコスト: 0.6173

正解テスト:

合計コスト: $0.06174

比較する

#7 · OpenAI

OpenAI: GPT-5.2

推論(medium)

Score: 7.38

一貫性: 8.73

試行ごとの合格率: 76.9%

不安定なテスト: 2

結果あたりのコスト: 2.5637

正解テスト:

合計コスト: $0.23074

比較する

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

推論(medium)

Score: 8.54

一貫性: 9.35

試行ごとの合格率: 87.2%

不安定なテスト: 1

結果あたりのコスト: 2.1621

正解テスト:

合計コスト: $0.23784

比較する

クイック比較

OpenAI: GPT-5.3-Codex と比較...