Top: -
Par: 14 lines
DRAM に分割されて配置された shape = (256, 16) の Float Tensor \(D\) を、
LM にある Tensor \(L\) に((8_L2B:1, 32:2), (2:1, 4_PE:1, 2_W:1))のレイアウトで格納してください。
今回の 1 次元目の入出力は (4_L2B:2, 64:8) → (8_L2B:1, 32:2) です。 4 つの L2B にそれぞれ \(64\times8=512\) 長語ずつ分割して配置された DRAM の内容を、8 つの L2B に分割して転送する必要があります。
mvp/n256 $d0 $lc0@.0 DRAM → L2BM 並列個別転送命令 mvp 命令を 2 回用い、256 長語ずつ、グループ内の 2 つの L2B に分配すればよいでしょう。
その後の分割の方法は、DL PE 256_16 と同様なので、発行する命令数に気をつけながら同様に転送すればよいでしょう。
を使います。
$d[0:512]@0, (256,16)/((4_L2B:2, 64:8), (8:1, 2_W:1); B@[4_L2B:2])
$lm[0:128], (256,16)/((8_L2B:1, 32:2), (2:1, 4_PE:1, 2_W:1))