UL PE 256_16

Top: 10 lines / syttrea

Par: 42 lines

Problem Statement

LM に ((4_L2B:2, 64:2), (2:1, 4_PE:1, 2_W:1)) のレイアウトで分割されて配置された shape = (256, 16) の Float Tensor $L$ を、DRAM にある Tensor $D$ に指定のレイアウトで格納してください。

DL PE 256_16 の反対方向の問題です。Download 操作の逆に対応した命令があるので、それを使います。

考え方・方針

を使います。

PE→L1BM→L2BM の転送量が多いため、l1bmm@0, l2bm@0 命令は DL PE 256_16 と同様に複数発行する必要があります。

$L$ ($0 \le L[{i, j}] \le 4096$): Float $lm[0:256], (256,16)/((4_L2B:2, 64:2), (2:1, 4_PE:1, 2_W:1); B@[MAB,L1B])
?

testcase.vsm