cublas の使い方メモ
この記事は書きかけです。
cublasSetMatrix()
cublasStatus_t
cublasSetMatrix(int rows, int cols, int elemSize,
const void *A, int lda, void *B, int ldb)
ホストメモリー上の行列 A
から、GPU メモリー上にある行列 B
に row
× col
の要素をコピーする関数。
各要素は elemSize
バイトであり、行列は列優先で格納され、
先頭の次元はそれぞれ lda
、ldb
で指定する。
参考: https://docs.nvidia.com/cuda/cublas/index.html#cublassetmatrix