Top: -
Par: 42 lines
LM に ((4_L2B:2, 64:2), (2:1, 4_PE:1, 2_W:1)) のレイアウトで分割されて配置された shape = (256, 16) の Float Tensor \(L\) を、DRAM にある Tensor \(D\) に指定のレイアウトで格納してください。
l1bmm@0 (MAB) 16x1 個別転送 命令 l1bmm@0l2bm@0 L1BM → L2BM 個別転送 l1bmm@0mvp/n512 $lc0@.0 $d0 L2BM → DRAM 並列個別転送命令 mvpを使います。
PE→L1BM→L2BM の転送量が多いため、l1bmm@0, l2bm@0 命令は DL PE 256_16 と同様に複数発行する必要があります。
$lm[0:256], (256,16)/((4_L2B:2, 64:2), (2:1, 4_PE:1, 2_W:1); B@[MAB,L1B])
$d[0:512]@0, (256,16)/((4_L2B:2, 64:8), (8:1, 2_W:1))