Top: -
Par: 18 lines
LM に ((16:2), (2:1, 4_PE:1, 2_W:1)) のレイアウトで分割されて配置された shape = (16, 16) の Float Tensor \(L\) を、DRAM にある Tensor \(D\) に指定のレイアウトで格納してください。
Download 操作の逆に対応した命令があるので、それを使います。
DL 16_16 では、DRAM → L2BM への放送を、PDM 経由で効率的に行う方法を紹介しましたが、今回の L2BM → DRAM に関しては PDM を経由せず、0 番 L2BM の内容だけを使って 4 グループの DRAM にそれぞれ個別転送する方法で良いでしょう。
$lm[0:64], (16,16)/((16:2), (2:1, 4_PE:1, 2_W:1); B@[MAB,L1B,L2B])
$d[0:32]@0, (16,16)/((4_L2B:2, 4:8), (8:1, 2_W:1))