-
Notifications
You must be signed in to change notification settings - Fork 1.1k
AArch64 status
[bot] michalowski-arm edited this page Dec 12, 2025
·
406 revisions
✅ unit tests passed
✅ unit tests passed
✅ unit tests passed
| problem | v3.9 p50 time(ms) | v3.9 p10 time (ms) | e7ac8d p50 time(ms) | e7ac8d p10 time (ms) | speedup (>1 is faster) |
|---|---|---|---|---|---|
eltwise alg=relu-dst--mode=P --max-ms-per-prb=300 --eltwise --alg=relu-dst --alpha=0 --beta=0 384x384 |
0.0024 | 0.0022 | 0.0027 | 0.0024 | |
eltwise alg=relu-dst--mode=P --max-ms-per-prb=300 --eltwise --tag=axb --alg=relu-dst --alpha=0 --beta=0 384x384 |
0.0024 | 0.0022 | 0.0027 | 0.0024 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ab --dtag=BA8b4a 384x384 |
0.0085 | 0.0083 | 0.005 | 0.005 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ab --dtag=BA4b4a 384x384 |
0.009 | 0.009 | 0.0054 | 0.0054 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ba --dtag=BA8b4a 384x384 |
0.0083 | 0.0083 | 0.0056 | 0.0054 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ba --dtag=BA4b4a 384x384 |
0.0083 | 0.0081 | 0.0054 | 0.0054 | |
reorder sdt=bf16 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=bf16 --ddt=f32 --stag=BA8b4a --dtag=ba 384x384 |
0.0066 | 0.0066 | 0.0034 | 0.0032 | |
reorder sdt=bf16 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=bf16 --ddt=f32 --stag=BA4b4a --dtag=ba 384x384 |
0.0066 | 0.0066 | 0.0034 | 0.0032 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=abx --dtag=abx 8x256x15x15 |
0.011 | 0.011 | 0.0039 | 0.0039 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=axb --dtag=axb 8x256x15x15 |
0.011 | 0.011 | 0.0039 | 0.0039 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.016 | 0.015 | 0.014 | 0.014 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.015 | 0.015 | 0.0078 | 0.0078 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.012 | 0.011 | 0.0039 | 0.0039 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.013 | 0.013 | 0.0044 | 0.0044 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.013 | 0.013 | 0.0046 | 0.0046 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.011 | 0.011 | 0.0039 | 0.0039 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=axb --dtag=axb 8x256x15x15 |
0.021 | 0.021 | 0.014 | 0.014 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.0425 | 0.0425 | 0.018 | 0.017 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.0435 | 0.0435 | 0.018 | 0.018 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.021 | 0.021 | 0.014 | 0.014 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.043 | 0.043 | 0.015 | 0.015 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.0417 | 0.0417 | 0.015 | 0.015 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.021 | 0.021 | 0.014 | 0.014 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=abx --dtag=abx 8x256x15x15 |
0.014 | 0.014 | 0.0076 | 0.0076 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=axb --dtag=axb 8x256x15x15 |
0.014 | 0.014 | 0.0076 | 0.0076 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.0254 | 0.0251 | 0.0081 | 0.0081 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.026 | 0.026 | 0.009 | 0.0088 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.014 | 0.014 | 0.0076 | 0.0076 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.026 | 0.025 | 0.0078 | 0.0078 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.0251 | 0.0251 | 0.0078 | 0.0078 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.014 | 0.014 | 0.0076 | 0.0076 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=abx --dtag=abx 8x256x15x15 |
0.011 | 0.011 | 0.0027 | 0.0027 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=axb --dtag=axb 8x256x15x15 |
0.011 | 0.011 | 0.0027 | 0.0027 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.013 | 0.013 | 0.0059 | 0.0059 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.014 | 0.014 | 0.0062 | 0.0061 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.011 | 0.011 | 0.0027 | 0.0027 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.013 | 0.013 | 0.0042 | 0.0042 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.013 | 0.013 | 0.0042 | 0.0042 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.011 | 0.011 | 0.003 | 0.003 |
| problem | v3.9 p50 time(ms) | v3.9 p10 time (ms) | e7ac8d p50 time(ms) | e7ac8d p10 time (ms) | speedup (>1 is faster) |
|---|---|---|---|---|---|
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb1ic64ih200iw267oc256oh200ow267kh1kw1ph0pw0 |
1.63 | 1.63 | 2.65 | 2.64 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic3ih224oc64oh112kh7sh2ph3n"resnet-50:conv1" |
32 | 31 | 12 | 12 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic3ih224oc64oh112kh7sh2ph3n"resnet-50:conv1" |
31.5 | 31.5 | 12.1 | 12.1 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic3ih224oc64oh112kh7sh2ph3n"resnet-50:conv1" |
33 | 32 | 12.2 | 12.2 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic3ih224oc64oh112kh7sh2ph3n"resnet-50:conv1" |
33 | 32 | 12.2 | 12.2 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic64ih56oc256oh56kh1ph0n"resnet-50:res2a-branch1*4" |
5.49 | 5.49 | 7.57 | 7.57 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic64ih56oc256oh56kh1ph0n"resnet-50:res2a-branch1*4" |
5.5 | 5.49 | 7.611 | 7.609 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic64ih56oc64oh56kh1ph0n"resnet-50:res2a-branch2a" |
1.221 | 1.221 | 2.72 | 2.72 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic64ih56oc64oh56kh1ph0n"resnet-50:res2a-branch2a" |
1.22 | 1.22 | 2.733 | 2.732 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic256ih56oc64oh56kh1ph0n"resnet-50:res2b-branch2a*2" |
4.94 | 4.93 | 10.58 | 10.58 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic256ih56oc64oh56kh1ph0n"resnet-50:res2b-branch2a*2" |
4.96 | 4.95 | 10.67 | 10.66 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic256ih56oc512oh28kh1sh2ph0n"resnet-50:res3a-branch1" |
41.2 | 41 | 12.1 | 12.1 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic256ih56oc512oh28kh1sh2ph0n"resnet-50:res3a-branch1" |
41.2 | 40.9 | 12.1 | 12.1 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic256ih56oc512oh28kh1sh2ph0n"resnet-50:res3a-branch1" |
41.3 | 41.1 | 12.2 | 12.1 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic256ih56oc512oh28kh1sh2ph0n"resnet-50:res3a-branch1" |
41.4 | 41.1 | 12.2 | 12.1 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic256ih56oc128oh28kh1sh2ph0n"resnet-50:res3a-branch2a" |
7.92 | 7.91 | 3.06 | 3.06 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic256ih56oc128oh28kh1sh2ph0n"resnet-50:res3a-branch2a" |
7.92 | 7.91 | 3.06 | 3.06 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic256ih56oc128oh28kh1sh2ph0n"resnet-50:res3a-branch2a" |
7.98 | 7.97 | 3.08 | 3.08 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic256ih56oc128oh28kh1sh2ph0n"resnet-50:res3a-branch2a" |
8 | 8 | 3.08 | 3.08 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic128ih28oc512oh28kh1ph0n"resnet-50:res3a-branch2c*4" |
5.01 | 5.01 | 9.866 | 9.864 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic128ih28oc512oh28kh1ph0n"resnet-50:res3a-branch2c*4" |
5.02 | 5.02 | 9.891 | 9.889 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic512ih28oc128oh28kh1ph0n"resnet-50:res3b-branch2a*3" |
5.06 | 5.05 | 9.932 | 9.931 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic512ih28oc128oh28kh1ph0n"resnet-50:res3b-branch2a*3" |
5.06 | 5.06 | 9.932 | 9.931 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic512ih28oc1024oh14kh1sh2ph0n"resnet-50:res4a-branch1" |
24.6 | 24.6 | 13.3 | 13.2 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic512ih28oc1024oh14kh1sh2ph0n"resnet-50:res4a-branch1" |
24.6 | 24.6 | 13.3 | 13.2 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic512ih28oc1024oh14kh1sh2ph0n"resnet-50:res4a-branch1" |
24.7 | 24.7 | 13 | 13 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic512ih28oc1024oh14kh1sh2ph0n"resnet-50:res4a-branch1" |
24.7 | 24.7 | 13.3 | 13.3 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic512ih28oc256oh14kh1sh2ph0n"resnet-50:res4a-branch2a" |
6.78 | 6.77 | 3.3 | 3.3 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic512ih28oc256oh14kh1sh2ph0n"resnet-50:res4a-branch2a" |
6.78 | 6.77 | 3.3 | 3.3 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic512ih28oc256oh14kh1sh2ph0n"resnet-50:res4a-branch2a" |
6.8 | 6.79 | 3.32 | 3.32 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic512ih28oc256oh14kh1sh2ph0n"resnet-50:res4a-branch2a" |
6.8 | 6.8 | 3.32 | 3.32 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic256ih14oc1024oh14kh1ph0n"resnet-50:res4a-branch2c*6" |
5.094 | 5.091 | 9.908 | 9.906 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic256ih14oc1024oh14kh1ph0n"resnet-50:res4a-branch2c*6" |
5.1 | 5.1 | 9.917 | 9.914 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic1024ih14oc256oh14kh1ph0n"resnet-50:res4b-branch2a*5" |
5.43 | 5.42 | 9.961 | 9.958 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic1024ih14oc256oh14kh1ph0n"resnet-50:res4b-branch2a*5" |
5.43 | 5.43 | 9.971 | 9.966 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic1024ih14oc2048oh7kh1sh2ph0n"resnet-50:res5a-branch1" |
25.4 | 25.4 | 14.8 | 14.8 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic1024ih14oc2048oh7kh1sh2ph0n"resnet-50:res5a-branch1" |
25.42 | 25.41 | 14.8 | 14.8 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic1024ih14oc2048oh7kh1sh2ph0n"resnet-50:res5a-branch1" |
25.48 | 25.47 | 14.9 | 14.9 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic1024ih14oc2048oh7kh1sh2ph0n"resnet-50:res5a-branch1" |
25.48 | 25.47 | 14.9 | 14.9 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D g1mb50ic1024ih14oc512oh7kh1sh2ph0n"resnet-50:res5a-branch2a" |
11 | 10.9 | 3.69 | 3.69 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D --attr-fpmath=bf16 g1mb50ic1024ih14oc512oh7kh1sh2ph0n"resnet-50:res5a-branch2a" |
11 | 10.9 | 3.69 | 3.69 | |
conv--mode=P --max-ms-per-prb=300 --conv g1mb50ic1024ih14oc512oh7kh1sh2ph0n"resnet-50:res5a-branch2a" |
11 | 11 | 3.71 | 3.71 | |
conv--mode=P --max-ms-per-prb=300 --conv --attr-fpmath=bf16 g1mb50ic1024ih14oc512oh7kh1sh2ph0n"resnet-50:res5a-branch2a" |
11 | 11 | 3.71 | 3.71 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic512ih7oc2048oh7kh1ph0n"resnet-50:res5a-branch2c*3" |
5.1 | 5.09 | 9.908 | 9.905 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic512ih7oc2048oh7kh1ph0n"resnet-50:res5a-branch2c*3" |
5.1 | 5.09 | 9.914 | 9.912 | |
conv--mode=P --max-ms-per-prb=300 --conv --dir=FWD-D mb50ic2048ih7oc512oh7kh1ph0n"resnet-50:res5b-branch2a*2" |
5.5 | 5.5 | 10.09 | 10.09 | |
conv--mode=P --max-ms-per-prb=300 --conv mb50ic2048ih7oc512oh7kh1ph0n"resnet-50:res5b-branch2a*2" |
5.51 | 5.49 | 10.1 | 10.1 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ab --dtag=BA4b4a 384x384 |
0.0073 | 0.0073 | 0.0044 | 0.0044 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ba --dtag=BA8b4a 384x384 |
0.0071 | 0.0071 | 0.0044 | 0.0042 | |
reorder sdt=f32 ddt=bf16--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=bf16 --stag=ba --dtag=BA4b4a 384x384 |
0.0071 | 0.0071 | 0.0044 | 0.0042 | |
reorder sdt=bf16 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=bf16 --ddt=f32 --stag=BA8b4a --dtag=ba 384x384 |
0.0059 | 0.0059 | 0.0027 | 0.0027 | |
reorder sdt=bf16 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=bf16 --ddt=f32 --stag=BA4b4a --dtag=ba 384x384 |
0.0059 | 0.0059 | 0.0027 | 0.0027 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=abx --dtag=abx 8x256x15x15 |
0.0095 | 0.0093 | 0.0042 | 0.0042 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=axb --dtag=axb 8x256x15x15 |
0.0095 | 0.0093 | 0.0042 | 0.0042 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.012 | 0.012 | 0.0078 | 0.0078 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.0132 | 0.0132 | 0.0068 | 0.0068 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.0095 | 0.0093 | 0.0042 | 0.0042 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.012 | 0.012 | 0.0044 | 0.0042 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.012 | 0.012 | 0.0044 | 0.0044 | |
reorder sdt=f32 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=f32 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.0095 | 0.0093 | 0.0042 | 0.0042 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=axb --dtag=axb 8x256x15x15 |
0.016 | 0.015 | 0.013 | 0.013 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.0374 | 0.0374 | 0.013 | 0.013 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.0381 | 0.0381 | 0.013 | 0.013 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.016 | 0.015 | 0.013 | 0.013 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.0383 | 0.0383 | 0.013 | 0.012 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.0371 | 0.0371 | 0.013 | 0.012 | |
reorder sdt=f32 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=f32 --ddt=s8 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.016 | 0.016 | 0.013 | 0.013 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=abx --dtag=abx 8x256x15x15 |
0.0095 | 0.0095 | 0.0071 | 0.0068 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=axb --dtag=axb 8x256x15x15 |
0.0095 | 0.0095 | 0.0071 | 0.0068 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.0234 | 0.0234 | 0.0071 | 0.0071 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.0242 | 0.0242 | 0.0076 | 0.0076 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.0095 | 0.0095 | 0.0071 | 0.0068 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.024 | 0.023 | 0.0073 | 0.0071 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.023 | 0.023 | 0.00732422 | 0.00732422 | |
reorder sdt=s8 ddt=f32--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=f32 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.0095 | 0.0095 | 0.0071 | 0.0068 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=abx --dtag=abx 8x256x15x15 |
0.0093 | 0.0093 | 0.0024 | 0.0022 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=axb --dtag=axb 8x256x15x15 |
0.0093 | 0.009 | 0.0024 | 0.0022 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=axb --dtag=aBx4b 8x256x15x15 |
0.012 | 0.012 | 0.0049 | 0.0049 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=axb 8x256x15x15 |
0.012 | 0.012 | 0.0049 | 0.0049 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=aBx4b 8x256x15x15 |
0.0093 | 0.0093 | 0.002 | 0.002 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx4b --dtag=aBx8b 8x256x15x15 |
0.012 | 0.012 | 0.0037 | 0.0037 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx8b --dtag=aBx4b 8x256x15x15 |
0.012 | 0.012 | 0.0037 | 0.0037 | |
reorder sdt=s8 ddt=s8--mode=P --max-ms-per-prb=300 --reorder --allow-enum-tags-only=false --sdt=s8 --ddt=s8 --stag=aBx8b --dtag=aBx8b 8x256x15x15 |
0.0093 | 0.009 | 0.002 | 0.002 |