Top: -
Par: 7 lines
LM に ((2:1, 4_PE:1, 2_W:1)) のレイアウトで分割されて配置された shape = 16 の Float Tensor \(L\) を、DRAM にある Tensor \(D\) に指定のレイアウトで格納してください。
DL 16 では、1 枚の DRAM から 8 つの L2BM への放送を効率化するために、一旦 PDM を経由しましたが、今回の問題では PDM を経由せず、単に 0 番 L2BM の値を 0 番 DRAM に格納すれば良いでしょう。
l1bmm@0 (MAB) 16x1 個別転送 命令 l1bmm@0l2bm@0 L1BM → L2BM 個別転送 l2bm@0mvp/n64 $lc0@0.0 $d0@0 L2BM → DRAM 単独個別転送命令 mvpを使います。
$lm[0:4], (16)/((2:1, 4_PE:1, 2_W:1); B@[MAB,L1B,L2B])
$d[0:8]@0, (16)/((8:1, 2_W:1))