#60 Step 3.7 Flash
low- Gharama
- $0.004
- Muda
- 25.3s
- Tokeni
- 3,072 tok
Muhtasari
Step 3.7 Flash hupata alama 7.4 kwenye AI BENCHY na iko nafasi ya #60. Ina reliability 10.0, pass rate 68.3%, gharama jumla $0.336, na wastani wa response time 16.06s.
Kinachofanya Step 3.7 Flash iwe ya kipekee: Inaonekana zaidi kwenye Uandishi wa msimbo, ambako iko #1; huku Akili ya jumla ikiwa eneo lake dhaifu zaidi kwenye #15.
7.4
Uthabiti
8.7
10.0
Jumla ya tokeni za matokeo
285,209
Jumla ya tokeni za ingizo
0
Bei ya ingizo
$0.200 / 1M
Bei ya toleo
$1.150 / 1M
Majaribio yasiyo thabiti
3
Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).
Onyesho la kizazi
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
Historia ya uendeshaji
| Imepimwa tarehe | Alama | Uaminifu | Majaribio sahihi | Jumla ya gharama | Linganisha |
|---|---|---|---|---|---|
| 2026-06-04 13:49 Jaribio jipya limeongezwa | 7.3 | 10.0 | $0.341 | Linganisha | |
| 2026-05-29 11:49 Uendeshaji wa kwanza | 7.4 | 10.0 | $0.336 | Uendeshaji wa sasa |
Chagua modeli ya kwanza, kisha bofya modeli ya pili kufungua ukurasa wa kulinganisha bega kwa bega.
| Kategoria | Alama | Uthabiti | Majaribio sahihi |
|---|---|---|---|
| Mbinu za kupinga AI | 8.7 | 7.9 | |
| Uandishi wa msimbo | 10.0 | 10.0 | |
| Mchanganyiko | 10.0 | 10.0 | |
| Uchanganuzi na uchimbaji wa data | 7.3 | 5.8 | |
| Mahususi kwa domeni | 5.3 | 7.2 | |
| Akili ya jumla | 3.4 | 9.3 | |
| Ufuataji wa maagizo | 9.8 | 10.0 | |
| Utatuzi wa mafumbo | 5.5 | 9.9 | |
| Mwito wa zana | 10.0 | 10.0 | |
| Maarifa ya jumla | 3.0 | 10.0 |