Top: -
Par: 43 lines
LM に ((16:1), (8_MAB:2, 8_L1B:1, 2_MAB:1, 4_PE:1, 2_W:1)) のレイアウトで分割されて配置された shape = (16, 1024) の Float Tensor \(L\) を、DRAM にある Tensor \(D\) に指定のレイアウトで格納してください。
DL 16_1024 では、8 つの L2BM への放送を効率化するために、一旦 PDM を経由しましたが、今回の問題では PDM を経由せず、単に 0 番 L2BM の値を各 DRAM に転送すれば良いでしょう。
を使用します。
$lm[0:32], (16,1024)/((16:1), (8_MAB:2, 8_L1B:1, 2_MAB:1, 4_PE:1, 2_W:1); B@[L2B])
$d[0:2048]@0, (16,1024)/((4_L2B:2, 4:512), (512:1, 2_W:1))