Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4 Nano

Rezumat

Comparație benchmark Seed-2.0-Mini vs GPT-5.4 Nano: GPT-5.4 Nano conduce la scorul mediu cu 7.5 vs 7.4. Seed-2.0-Mini are costul de benchmark mai mic, $0.044 vs $0.107. GPT-5.4 Nano este mai rapid cu 11.95s vs 80.22s, cu rate de reușită de 57.1% vs 63.5%.

Model recomandat: GPT-5.4 Nano - Are cel mai bun scor aici (7.5) și răspunde de aproximativ 6.7x mai rapid decât Seed-2.0-Mini.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică Seed-2.0-Mini Seed-2.0-Mini medium Lansare: 2026-02-14 GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17
Scor 7.4 7.5
Rang #50 #46
Fiabilitate 6.7 10.0
Consistență 9.3 8.4
Teste corecte
Rată de trecere pe încercare 57.1% 63.5%
Teste instabile 2 4
Rulări totale 63 63
Cost per rezultat 0.397 0.969
Cost total $0.044 $0.107
Preț de intrare $0.100 / 1M $0.200 / 1M
Preț de ieșire $0.400 / 1M $1.250 / 1M
Total tokenuri de intrare 41,904 35,434
Tokenuri de ieșire 2,555 3,014
Tokenuri de raționament 95,974 76,520
Timp de răspuns (mediu) 80.22s 11.95s
Timp de răspuns (maxim) 262.83s 94.06s
Timp de răspuns (total) 1363.72s 250.98s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#50 Seed-2.0-Mini

medium
Cost
$0.002
Timp
161.7s
Tokenuri
4,379 tok

#46 GPT-5.4 Nano

medium
Cost
$0.007
Timp
24.6s
Tokenuri
4,943 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

Comparație rapidă

Schimbă perechea de comparație