ナビゲーション
AI BENCHY
比較する チャート 方法論
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-Flash

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-06

指標 OpenAI: GPT-5 Mini medium リリース: 2025-08-07 Qwen: Qwen3.5-Flash none リリース: 2026-02-24
平均スコア 6.1 4.9
順位 #32 #41
正解テスト
一貫性 8.9 9.5
結果あたりのコスト 1.401 0.088
合計コスト $0.113 $0.006
試行ごとの合格率 62.2% 42.2%
不安定なテスト 2 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
出力トークン 5,477 3,674
推論トークン 46,912 0
応答時間(平均) 25.92s 3.73s
応答時間(最大) 88.15s 13.73s
応答時間(合計) 388.79s 55.90s

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

平均スコア vs 応答時間(平均)

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Qwen: Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Qwen: Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Qwen: Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Qwen: Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Qwen: Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Puzzle Solving スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Qwen: Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

クイック比較

比較ペアを切り替え