Top: -
Par: 160 lines
LM上に Float \(256\times16\) 行列 \(A\) が与えられます。2 次元目を最大値を求めて縮約して、ベクトル \(S\) (size:256)を LM に出力してください。
fvadd の代わりに ALU 命令の fmax を使うのがおすすめです。
実装にもよりますが、fvadd を単純に fmax に置き換えた場合、$mauf を使っていたのであれば MAU ではなく ALU のフォワーディングを使いたいので、代わりに $aluf を使う必要があります。
実装にもよりますが、$mauf を単純に $aluf に置き換えた場合、MAU 命令である fvpassa を使っていたのであれば代わりに ALU 命令の fpassa (もしくはipassa)命令を使う必要があります。
$lm[0:256], (256,16)/((4_L2B:2, 64:2), (2:1, 4_PE:1, 2_W:1); B@[MAB,L1B])
$ln[0:64], (256)/((4_L2B:2, 32:1, 2_W:1))