ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Qwen: Qwen3.5-35B-A3B

概要

Gemini 2.5 Flash vs Qwen3.5-35B-A3B の benchmark 比較: Qwen3.5-35B-A3B が平均スコアでリードし、6.3 vs 6.2 です。 Gemini 2.5 Flash の benchmark コストが低く、$0.016 vs $0.401 です。 Gemini 2.5 Flash の方が高速で、875ms vs 72.57s です、成功率は 46.0% vs 69.8% です。

おすすめモデル: Gemini 2.5 Flash - スコアはここでの最高値に近く(6.2 vs 6.3)、Qwen3.5-35B-A3B より約 26.3 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標 Gemini 2.5 Flash Gemini 2.5 Flash none リリース: 2025-06-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium リリース: 2026-02-24
スコア 6.2 6.3
順位 #94 #88
信頼性 10.0 10.0
一貫性 9.6 7.5
正解テスト
試行ごとの合格率 46.0% 69.8%
不安定なテスト 1 6
総実行回数 63 63
結果あたりのコスト 0.169 5.162
合計コスト $0.016 $0.401
入力価格 $0.300 / 1M $0.140 / 1M
出力価格 $2.500 / 1M $1.000 / 1M
合計入力トークン 35,926 42,196
出力トークン 1,770 40,630
推論トークン 0 353,577
応答時間(平均) 875ms 72.57s
応答時間(最大) 4.39s 409.98s
応答時間(合計) 18.37s 1524.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 Gemini 2.5 Flash

none
Invalid SVG
Cost
$0.164
Time
215.5s
Tokens
65,659 tok

#88 Qwen3.5-35B-A3B

medium
Cost
$0.009
Time
71.4s
Tokens
8,631 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 5.5 10.0 33.3% 0 736ms 8,122 483 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

クイック比較

比較ペアを切り替え