DL L2B 256_16

top Top: -

par Par: 14 lines

Problem Statement

DRAM に分割されて配置された shape = (256, 16) の Float Tensor \(D\) を、

LM にある Tensor \(L\) に((8_L2B:1, 32:2), (2:1, 4_PE:1, 2_W:1))のレイアウトで格納してください。

Explanation

DL 256_16 と問題文は一緒ですが、出力の LM レイアウトが異なります。

今回の 1 次元目の入出力は (4_L2B:2, 64:8)(8_L2B:1, 32:2) です。 4 つの L2B にそれぞれ \(64\times8=512\) 長語ずつ分割して配置された DRAM の内容を、8 つの L2B に分割して転送する必要があります。

mvp/n256 $d0 $lc0@.0 DRAM → L2BM 並列個別転送命令 mvp 命令を 2 回用い、256 長語ずつ、グループ内の 2 つの L2B に分配すればよいでしょう。

その後の分割の方法は、DL PE 256_16 と同様なので、発行する命令数に気をつけながら同様に転送すればよいでしょう。

使用する命令

を使います。

Inputs

Outputs

Testcases

testcase.vsm

Submission

ログイン / 新規登録