feature为(3312, 3312)的稀疏特征矩阵,里面的值全为0或1。由于比较好奇各种存储矩阵的方式之间占用空间的差异,所以做了个实验:
1 | # env |
可见,csr与lil在这里的占用空间情况相近,list次之,ndarray为最,并且受数据类型影响明显。
按定义来看,lil的读写方式比csr的方便直观一些,csr会有点绕。
但行好事,莫问前程
feature为(3312, 3312)的稀疏特征矩阵,里面的值全为0或1。由于比较好奇各种存储矩阵的方式之间占用空间的差异,所以做了个实验:
1 | # env |
可见,csr与lil在这里的占用空间情况相近,list次之,ndarray为最,并且受数据类型影响明显。
按定义来看,lil的读写方式比csr的方便直观一些,csr会有点绕。