ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5.4

概要

Gemini 3.5 Flash vs GPT-5.4 の benchmark 比較: GPT-5.4 が平均スコアでリードし、8.5 vs 7.0 です。 Gemini 3.5 Flash の benchmark コストが低く、$1.079 vs $1.210 です。 Gemini 3.5 Flash の方が高速で、9.93s vs 22.35s です、成功率は 77.8% vs 76.2% です。

おすすめモデル: Gemini 3.5 Flash - 総合的に最も良い選択です。競争力のあるスコア(7.0)、GPT-5.4 より低いコスト、バランスの取れた応答時間があります。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標 Gemini 3.5 Flash Gemini 3.5 Flash none リリース: 2026-05-19 GPT-5.4 GPT-5.4 medium リリース: 2026-03-05
スコア 7.0 8.5
順位 #66 #20
信頼性 10.0 10.0
一貫性 8.9 8.6
正解テスト
試行ごとの合格率 77.8% 76.2%
不安定なテスト 3 4
総実行回数 63 63
結果あたりのコスト 7.190 8.640
合計コスト $1.079 $1.210
入力価格 $1.500 / 1M $2.500 / 1M
出力価格 $9.000 / 1M $15.000 / 1M
合計入力トークン 13,843 34,108
出力トークン 117,518 2,242
推論トークン 0 72,707
応答時間(平均) 9.93s 22.35s
応答時間(最大) 64.36s 100.41s
応答時間(合計) 178.68s 469.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#20 GPT-5.4

medium
Cost
$0.214
Time
199.6s
Tokens
14,349 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
GPT-5.4 8.8 7.8 88.9% 1 44.36s 7,305 433 24,216
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821

クイック比較

比較ペアを切り替え