ML@python@稀疏矩阵的存储和表示@CSR格式

文章目录

ML@python@稀疏矩阵的存储和表示@CSR格式
- CSR格式
- - NNZ
  - Coordinate list (COO)
  - Compressed sparse row (CSR, CRS or Yale format)
  - 三个数组
  - 根据ROW_INDEX划分数组V或COL_INDEX
  - 数组名称
- demos in scipy
- - eg
  - eg
  - 冗余分析
  - Yale sparse matrix
  - CSR编码效益分析
  - 标准CSR编码和Scipy中的相关api
  - 将给定矩阵编码双向转换
- 其他稀疏系数矩阵的编码和存储

ML@python@稀疏矩阵的存储和表示@CSR格式

Sparse matrix - Wikipedia

CSR格式

CSR是Compressed Sparse Row的缩写，是一种稀疏矩阵的压缩存储格式。稀疏矩阵是指其中大部分元素为0的矩阵。在机器学习中，由于特征维度通常很高，因此特征矩阵往往是稀疏矩阵。使用CSR格式可以节省存储空间并加快矩阵运算的速度。

在CSR格式中，矩阵被视为三个数组的组合：data、indices和indptr。

data数组存储矩阵中所有非零元素的值，
indices数组存储每个非零元素所在的列号
indptr数组存储每一行的第一个非零元素在data和indices数组中的位置。

例如，对于一个3行4列的稀疏矩阵，其data、indices和indptr数组分别为：

from scipy.sparse import csr_matrix
data = [1, 2, 3, 4, 5]
indices = [0, 2, 1, 1, 2]#由于只有4列,所有indices数组中的元素在0,1,2,3中取值(这不是说元素个数不超过4)
indptr = [0, 2, 3, 5]
SM=csr_matrix((data, indices, indptr), shape=(3,4)).toarray()
SM

array([[1, 0, 2, 0],
       [0, 3, 0, 0],
       [0, 4, 5, 0]])

NNZ

NNZ是n维数组中非零元素的数量，是衡量稀疏矩阵中元素数量的一个指标。在稀疏矩阵中，大部分元素的值为0，因此NNZ通常远小于矩阵的总元素数。
NNZ可以用来衡量稀疏矩阵的稠密程度。通常情况下，NNZ与稀疏矩阵中非零元素的分布、密度以及矩阵的大小等因素有关。因为计算机存储非零元素需要占用内存空间，所以NNZ也可以用来评估稀疏矩阵的存储空间需求。
在机器学习中，很多算法都需要处理高维稀疏数据，例如文本分类、推荐系统等。因此，NNZ也是评估这些算法性能的一个重要指标之一。通常情况下，NNZ越小，算法处理稀疏数据的效率越高，但同时也可能会牺牲一定的精度。

例如，对于一个3行4列的稀疏矩阵，其NNZ为5，因为矩阵中共有5个非零元素。
NNZ:Number of nonzero matrix elements

Coordinate list (COO)

COO stores a list of (row, column, value) tuples. Ideally, the entries are sorted first by row index and then by column index, to improve random access times. This is another format that is good for incremental matrix construction

Compressed sparse row (CSR, CRS or Yale format)

The compressed sparse row (CSR) or compressed row storage (CRS) or Yale format represents a matrix M by three (one-dimensional) arrays, that respectively contain nonzero values, the extents of rows, and column indices.
It is similar to COO, but compresses the row indices, hence the name.
This format allows fast row access and matrix-vector multiplications ( $M x$ ). The CSR format has been in use since at least the mid-1960s, with the first complete description appearing in 1967.

三个数组

The CSR format stores a sparse $m \times n$ matrix M in row form using three (one-dimensional) arrays (V, COL_INDEX, ROW_INDEX).
- 其中,数组V和COL_INDEX是很好理解的
- 而ROW_INDEX数组中的值表示的是数组V或ROW_INDEX中元素的索引或者切片(这两个数组是对应的,编码的时候要看源矩阵M才可以确定ROW_INDEX),而不是矩阵M中的元素的行索引!(ROW_INDEX的两个相邻元素作为构成切片的一对索引值,用切片访问数组V或ROW_INDEX)
- ROW-INDEX是为了区分哪些元素是同一行的(或者说第i行包括哪些非零元素)
Let NNZ denote the number of nonzero entries in M.
- (Note that zero-based indices shall be used here.)
The arrays V and COL_INDEX are of length NNZ, and contain the non-zero values and the column indices of those values respectively.
The array ROW_INDEX is of length $m + 1$ and encodes the index in V and COL_INDEX where the given row starts.
- 简单说,就是如何划分数组V(和数组COL_INDEX)中哪些元素是属于同一行的
- This is equivalent to ROW_INDEX[j] encoding the total number of nonzeros above row j.
The last element is NNZ , i.e., the fictitious index in V immediately after(紧接) the last valid index NNZ - 1.
CSR格式使用三个一维数组（V、COL_INDEX和ROW_INDEX）以行形式存储稀疏矩阵M。其中，V数组和COL_INDEX数组的长度均为NNZ，分别存储非零元素的值和列索引。
ROW_INDEX数组的长度为m+1，编码了矩阵M的每一行(非零元素)在V数组和COL_INDEX数组中的开始索引。这相当于ROW_INDEX[j]编码了位于第j行上方的所有非零元素的总数。
- ROW_INDEX最后一个元素是NNZ，即最后一个有效索引NNZ-1之后的虚构索引。需要注意的是，这里使用基于0的索引。

根据ROW_INDEX划分数组V或COL_INDEX

由于R=ROW_INDEX有m+1个元素,如果将每两个向量的元素R[i],R[i+1]作为一个切片( $i=1,2,\cdots,m$ ),将产生m个切片
分别计算ri=R[i+1]-R[i],其中ri就表示第i行有ri个非0元素
而第i行的ri个非0元素分别要对齐(align)到哪一列(放到哪一列),则由c=COL_INDEX[R[i+1]:R[i]]中的元素决定(c中的元素格式也是ri个)

数组名称

scipy中V, COL_INDEX, ROW_INDEX三个数组的对应名称分别是data,indices,indptr

demos in scipy

eg

For example, the matrix
- ${\begin{pmatrix}5&0&0&0\\ 0&8&0&0\\ 0&0&3&0\\ 0&6&0&0\\ \end{pmatrix}}$
- 这个稀疏矩阵比较简单,它的SCR编码和COO编码恰好一致
- 这个例子似乎看不出来CSR和COO的区别,**Don’t worry about it **下一节将介绍更多例子
- is a 4 × 4 matrix with 4 nonzero elements, hence
  - ```
  V         = [ 5 8 3 6 ]
  COL_INDEX = [ 0 1 2 1 ]
  ROW_INDEX = [ 0 1 2 3 4 ] 
```
- assuming a zero-indexed language.
- 我查看wikipedie的这篇文章时,给出的ROW_INDEX是[0,1,2,3]这应该是错误的,长度上就不符合CSR编码特征
- 所以我将其纠正为[0,1,2,3,4],包含m+1=5个元素
- To extract a row, we first define:
  - ```
  row_start = ROW_INDEX[row]
  row_end   = ROW_INDEX[row + 1]
```
- ```
Vi=V[row_start:row_end]
```
- Then we take slices from V and COL_INDEX starting at row_start and ending at row_end.
To extract the row 1 (the second row) of this matrix we set row_start=1 and row_end=2. Then we make the slices V[1:2] = [8] and COL_INDEX[1:2] = [1].
- We now know that in row 1 we have one element at column 1 with value 8.

eg

Another example, the matrix
${\begin{pmatrix}10&20&0&0&0&0\\ 0&30&0&40&0&0\\ 0&0&50&60&70&0\\ 0&0&0&0&0&80\\ \end{pmatrix}}$

is a 4 × 6 matrix (24 entries) with 8 nonzero elements, so

V         = [ 10 20 30 40 50 60 70 80 ]
COL_INDEX = [  0  1  1  3  2  3  4  5 ]   
ROW_INDEX = [  0  2  4  7  8 ]

The whole is stored as 21 entries: 8 in V, 8 in COL_INDEX, and 5 in ROW_INDEX.
- ROW_INDEX splits the array V into rows: (10, 20) (30, 40) (50, 60, 70) (80), indicating the index of V (and COL_INDEX) where each row starts and ends;
- COL_INDEX aligns values in columns: (10, 20, …) (0, 30, 0, 40, …)(0, 0, 50, 60, 70, 0) (0, 0, 0, 0, 0, 80).

冗余分析

Note that in this format, the first value of ROW_INDEX is always zero and the last is always NNZ, so they are in some sense redundant (although in programming languages where the array length needs to be explicitly stored, NNZ would not be redundant).
Nonetheless, this does avoid the need to handle an exceptional case when computing the length of each row, as it guarantees the formula ROW_INDEX[i + 1] − ROW_INDEX[i] works for any row i.
Moreover, the memory cost of this redundant storage is likely insignificant for a sufficiently large matrix.

Yale sparse matrix

The (old and new) Yale sparse matrix formats are instances of the CSR scheme. The old Yale format works exactly as described above, with three arrays; （旧和新的）Yale稀疏矩阵格式是CSR格式的一种实例。旧的Yale格式与上述描述完全相同，使用三个数组表示；新的格式将行索引和列索引合并成一个单独的数组，并将矩阵的对角线单独处理。
the new format combines ROW_INDEX and COL_INDEX into a single array and handles the diagonal of the matrix separately.
For logical adjacency matrices, the data array can be omitted, as the existence of an entry in the row array is sufficient to model a binary adjacency relation.
It is likely known as the Yale format because it was proposed in the 1977 Yale Sparse Matrix Package report from Department of Computer Science at Yale University.
对于逻辑邻接矩阵，可以省略数据数组，因为在行数组中存在一个条目就足以表示二元邻接关系。

Yale格式可能因为它是在耶鲁大学的计算机科学系于1977年发布的Yale稀疏矩阵包报告中提出的，而得名。

CSR编码效益分析

编码任意一个矩阵为CSR格式需要的存储的entries为 $S = 2 NNT + (m + 1)$
In this case above, the CSR representation contains 13 entries, compared to 16 in the original matrix.
- The CSR format saves on memory only when $NNZ < (m (n - 1) - 1) /2$ .
- 只有满足上述等式的情况下,CSR

标准CSR编码和Scipy中的相关api

scipy.sparse.csr_matrix — SciPy v1.10.1 Manual
csr_matrix((data, indices, indptr), [shape=(M, N)])
- it is the standard CSR representation where :
  - 注意indices数组存储的是非零元素所在的列
- the column indices for row i are stored in
  - indices[indptr[i]:indptr[i+1]]
- and their corresponding values are stored in
  - data[indptr[i]:indptr[i+1]].
- If the shape parameter is not supplied, the matrix dimensions are inferred from the index arrays.

from scipy.sparse import csr_matrix
indptr = np.array([0, 2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csr_matrix((data, indices, indptr), shape=(3, 3)).toarray()
# array([[1, 0, 2],
#        [0, 0, 3],
#        [4, 5, 6]])

上述矩阵中,共有3行3列
第i行非零元素非零元素个数从0开始累加各行非零元素个数 indptr(index_column) slice

0 1,2 2 0+2=2 0 0:2

1 3 1 2+1=3 2 2:3

2 4,5,6 3 3+3=6 3 3:6

fictitious 6
- indptr数组就是以0开头作为第一个元素,然后依次收集累加列[2,3,6]的元素,得到一个长度为矩阵M的行数m再+1的向量,本例中m=3,indptr=[0,2,3,6]

第i行	非零元素	非零元素个数	从0开始累加各行非零元素个数	indptr(index_column)	slice
0	1,2	2	0+2=2	0	0:2
1	3	1	2+1=3	2	2:3
2	4,5,6	3	3+3=6	3	3:6
fictitious				6

现在,我们在第二行的位置插入一个全0向量:(只需要修改indptr数组)

from scipy.sparse import csr_matrix
indptr = np.array([0, 2,2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csr_matrix((data, indices, indptr), shape=(4, 3)).toarray()
# array([[1, 0, 2],
#        [0, 0, 0],
#        [0, 0, 3],
#        [4, 5, 6]])

还可以通过shape参数,追加全零列,而不需要改动三个数组

from scipy.sparse import csr_matrix
indptr = np.array([0, 2,2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
SM=csr_matrix((data, indices, indptr), shape=(4, 5)).toarray()
SM
# array([[1, 0, 2, 0, 0],
#        [0, 0, 0, 0, 0],
#        [0, 0, 3, 0, 0],
#        [4, 5, 6, 0, 0]])

观察每行的非零元素:

# 列出矩阵M每行的非零元素的列索引以及值
for i in range(len(indptr)-1):
    r_slice=slice(indptr[i],indptr[i+1])#r_slice表示row_slice
    print(f'{str(indices[r_slice]):>10}',
          f'{r_slice}',
          f'{str(data[r_slice])}'
          )

     [0 2] slice(0, 2, None) [1 2]
       [2] slice(2, 3, None) [3]
   [0 1 2] slice(3, 6, None) [4 5 6]

上面的输出分为3列,第一列是第i行非零元素的索引
第2列是第i行以及该行之前的非零元素,对indptr数组进行切片
第3列表示第i行非零元素的取值

将给定矩阵编码双向转换

由三个数组计算出系数矩阵

from scipy.sparse import csr_matrix
indptr = np.array([0, 2,2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
SM=csr_matrix((data, indices, indptr), shape=(4,3)).toarray()
print(SM)

将给定的稀疏矩阵编码成三个数组

SM=csr_matrix((data, indices, indptr), shape=(4, 3)).toarray()
res=csr_matrix(SM)
print(res)
print(f'{res.indices=}\n{res.indptr=}\n{res.data=}')

其他稀疏系数矩阵的编码和存储

可以参考wikipedia,scipy中的文档
- Sparse matrices (scipy.sparse) — SciPy Manual

【教程】如何使用 MYScrcpy，一行Python代码获取Android设备屏幕/摄像头 H264/H265 原始视频流 Me2sY MYScrcpy python android 开发语言智能手机扩展屏应用开发开源测试工具
MYScrcpy1.5.8Github/Gitee1.5.8版本新增获取原始视频流（H264/H265）方法，供小伙伴们在需要原生H264/H265串流时使用要求MYScrcpy>1.5.8pipinstall-Umysc安卓设备开启调试模式，安卓版本>5（摄像头需>11）H265需安卓设备支持H265编码步骤MYScrcpy从设计之初，就是想为小伙伴们打造一款好用易上手的工具包，所以使用起来也非
Python异步编程入门旖风刈草 Python python 开发语言个人开发
一、何为异步？说起异步模型，不得不提老生常谈的同步模型，此二者是相对的概念。同步模型即程序必须按照顺序依次执行，当程序在执行一个需要等待外部资源的操作时（网络数据收发、文件读写），会陷入阻塞状态，只有在外部资源到位后才会继续执行。与之相反，异步模型具有非阻塞的特点，程序在等待外部资源时，会继续执行其他代码。在3.4版本中，Python引入了对异步编程的支持，在同一个线程下通过事件循环对多个协程进行
pip 阿里云镜像报错 certificate verify failed: unable to get local issuer certificate Xheng1934 pip 阿里云
在没有管理员身份，且有防火墙限制的电脑上，pip安装python库包失败。但是在普通的电脑上安装正常。报错内容如下：(SSS_web)C:\Users\HXAIYVQ>pipinstallflask-ihttps://mirrors.aliyun.com/pypi/simple/Lookinginindexes:https://mirrors.aliyun.com/pypi/simple/WA
Python之cv2 deye1979 python
1.读取图片importcv2img=cv2.imread('./test.jpg')读取出来的图片是numpy.ndarray格式，值是0～255，img的形状是(图片高度，图片宽度，图片通道数），打印值出来发现通道的顺序是BGR，而不是RGB。2.改变图片大小importcv2width=100height=200img=cv2.imread('./test.jpg')img=cv2.resi
2019年，5本关于机器学习的免费电子书你应该知道头顶一根发的程序猿
为了帮助你开始机器学习，请看Packt提供的5本免费机器学习电子书。如今，机器学习是软件工程各个领域最重要的趋势之一。它不再局限于研究人员和分析师，而是对于从网络安全到网络开发等各个领域来说，它是非常重要的组成部分。为了帮助你开始机器学习，我们整理了Packt提供的5本免费机器学习电子书。你可以下载你想要的书籍——你所需要做的就是注册，然后下载你的第一本书。小编是个Python爱好者，目前建了一个
2025毕业设计指南：如何用Hadoop构建超市进货推荐系统？大数据分析助力精准采购计算机编程指导师 Java实战集 Python实战集大数据实战集课程设计 hadoop 数据分析 spring boot java 进货 python
✍✍计算机编程指导师⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！⚡⚡Java实战|SpringBoot/SSMPython实战项目|Django微信小程序/安卓实战项目大数据实战项目⚡⚡文末获取源码文章目录⚡⚡文末获取源码基于hadoop的超市进货推荐系
Python基础木啊木啊木 python jvm 开发语言
Python_name_javastring和字符串区别深浅拷贝内存池垃圾回收机制引用增减垃圾回收引用计数标记清除分代回收缓存机制池机制free_list装饰器迭代器提高运行效率的方法函数传递方式name当一个Python文件作为主程序运行时，name__属性的值将被设置为__main。这提供了一种方式，通过判断__name__来执行特定的代码块。如果一个Python文件被其他文件导入，name_
如何从0到1本地搭建whisper语音识别模型 MaxCode-1 搭建本地gpt whisper
文章目录环境准备1.系统要求2.安装依赖项1：安装Python和虚拟环境2：安装Whisper3：下载Whisper模型4：进行语音识别5：提高效率和精度6：开发和集成Whisper是OpenAI发布的一个强大的语音识别模型，它可以将语音转换为文本，支持多语言输入，并且可以处理各种音频类型。以下是一个从0到1的本地搭建Whisper模型进行语音识别教程环境准备1.系统要求操作系统：Linux、Ma
【Python系列】异步任务的终止 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
Python中cv2 (OpenCV, opencv-python)库的安装、使用方法demo最新详细教程猫头虎 AI人工智能技术专栏 python opencv 开发语言计算机视觉语音识别目标检测神经网络
Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程文章目录Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程摘要引言正文OpenCV库概述安装OpenCV环境要求安装命令验证安装基础使用方法读取和显示图像图像处理示例❓常见问题解答小结参考资料表格总结总结和未来展望温馨提示摘要本文全面介绍了Pyt
【机器学习】Python与深度学习的完美结合——深度学习在医学影像诊断中的惊人表现空白诗机器学习深度学习人工智能 python
个人主页：空白诗文章目录一、引言二、深度学习在医学影像诊断中的突破1.技术原理2.实际应用3.性能表现三、深度学习在医学影像诊断中的惊人表现1.提高疾病诊断准确率2.辅助制定治疗方案四、深度学习对医疗行业的影响和推动作用一、引言随着人工智能技术的不断发展，深度学习在医学影像诊断领域的应用日益广泛，其强大的特征提取能力和高效的学习机制为医学影像诊断带来了革命性的突破。本文将深入探讨深度学习在医学影像
【python】找不到DLL、缺少DLL、加载DLL失败 seuroger windows c++开发语言 python
前言以前玩单机游戏时，常常需要打补丁，修改注册表，但是有时候折腾半天，一点开exe弹出缺少xx.dll的提示。当时就很好奇，这个dll到底是什么东西。后来自己编码工作开始需要加载一些dll时，自己把一些代码打包成dll后，感觉稍微懂了一点。定义dll，动态链接库英文为DLL，是DynamicLinkLibrary的缩写。DLL是一个包含可由多个程序，同时使用的代码和数据的库。生成使用visuals
linux和Windows上安装MySQLdb 逍遥_yjz
1.Windows上安装MySQLdb1.1基于python2.7的安装下载MySQL_python‑1.2.5‑cp27‑none‑win_amd64.whlpythoninstallMySQL_python‑1.2.5‑cp27‑none‑win_amd64.whl或者pipinstallMySQL-python1.2基于python3.5的安装MySQLdb的安装很曲折，还是按照正常方法安装
python-pptx生成PPT报告雪夜行人 python模块使用心得 python powerpoint
文章目录前言一、python-pptx是什么？二、生成PPT的解决方案三、修改文本框的文本内容四、修改统计图表的数据五、删除元素六、删除某一页PPT总结前言存在这样一个需求，需要使用数据渲染生成一个PPT报告。经过一番查询，笔者决定使用python-pptx来完成这个需求。python-pptx作为一个功能强大的第三方库，完全可以满足笔者的需求。一、python-pptx是什么？python-pp
掌握python-pptx：打造专业PPT表格木头左 python办公自动化 python powerpoint 开发语言
哈喽，大家好，我是木头左！在python-pptx中，表格是由Table对象表示的，这个对象提供了对表格的各种属性和方法的访问。每个表格由多个行(Row对象)组成，每行又包含多个单元格(Cell对象)。安装和导入库开始前，确保已经安装了python-pptx库。如果尚未安装，可以使用pip进行安装：pipinstallpython-pptx然后，在你的Python脚本中导入必要的模块：frompp
【mysql】mysql之优化向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
python如何快速生成一个requirements.txt 钎散 python python windows linux pip
python如何快速生成一个requirements.txt一、使用方法二、实现原理一、文件夹遍历二、获取导入名三、获取安装名四、获取版本结束一、使用方法先安装pipinstallrequirementsGet-ihttps://pypi.tuna.tsinghua.edu.cn/simple/然后在你要生成requirements.txt的项目根目录下新建一个文件[make_requiremen
Python中requirement 的使用傻乎乎的胖鱼 Python python
Python中requirements.txt的生成requirements.txt是Python项目中包含的一个文件，作用：用于记录所有依赖包及其精确的版本号，以便新环境使用。在原来项目中生成requirements.txt文件Terminal中执行pipfreeze>requirements.txt则项目中生成该新文件在新项目中安装requirements.txt文件Terminal中执行pi
python----使用sqlalchemy操作mysql数据库 cheerfulCoder python
准备使用sqlalchemy前要先安装pymysql数据库我是使用docker快速创建的现在已经运行起来了开始1.创建表格fromsqlalchemyimportcreate_engine#初始化连接使用sqlalchemy时要先安装pymysql否则连接失败engine=create_engine('mysql+pymysql://root:[email protected]/user',
Python 中 lambda 的用法介绍 Persist_Zhang Python python 开发语言
Python中lambda的用法1.什么是lambda函数？lambda函数是Python中的一种匿名函数，也称为无名函数。与普通的def定义函数不同，lambda函数没有名字，且通常用来定义简单的、一次性的功能。语法格式如下：lambda参数:表达式参数：lambda函数可以有多个参数，参数之间用逗号分隔。表达式：lambda函数的主体是一条简单的表达式，不能包含复杂的语句。该表达式的值就是la
python pygame教程_【Python】Pygame入门 weixin_39677419 python pygame教程
Pygame的历史Pygame是一个利用SDL库的写的游戏库，SDL呢，全名SimpleDirectMediaLayer，是一位叫做SamLantinga的大牛写的，据说他为了让Loki(致力于向Linux上移植Windows的游戏的一家大好人公司，可惜已经倒闭，唉好人不长命啊……)更有效的工作，创造了这个东东。SDL是用C写的，不过它也可以使用C++进行开发，当然还有很多其它的语言，Pygame
python生成requirements.txt方法所谓向日葵族 python
python项目如何在另一个环境上重新构建项目所需要的运行环境依赖包？使用的时候边记载是个很麻烦的事情，总会出现遗漏的包的问题，这个时候手动安装也很麻烦，不能确定代码报错的需要安装的包是什么版本。这些问题，requirements.txt都可以解决！生成requirements.txt，有两种方式：第一种适用于单虚拟环境的情况：：pipfreeze>requirements.txt为什么只适用于单
公众号运营成功的秘诀是什么？氧惠帮朋友一起省
公众号运营已成为企业、个人品牌宣传与市场推广的重要渠道。然而，众多公众号如雨后春笋般涌现，如何在激烈的市场竞争中脱颖而出，实现运营成功，却是许多运营者面临的一大挑战。那么，公众号运营成功的秘诀究竟是什么呢？本文将对此进行深入探讨。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表
数模原理精解【8】叶绿先锋基础数学与应用数学人工智能统计分析概率论数学建模
文章目录协方差概述协方差的定义协方差的计算协方差的例子协方差矩阵协方差矩阵定义协方差矩阵的性质协方差矩阵的计算协方差矩阵的例子协方差矩阵的例题多元正态分布基础多元正态分布密度函数多元正态分布密度函数Julia实现详细解释定义计算例子例题参考文献协方差概述协方差是一种统计度量，用于描述两个变量之间的线性相关程度以及它们变化的趋势是否一致。具体来说，协方差计算的是两个变量同时偏离其均值的程度。如果两个
python——字符串&切片其实@qq.com python
字符串对象：1、字符串定义：(1)定义：字符串就是一系列字符，在python中，用引号(单引号，双引号，三引号都可以)括起来的都是字符串。例如：“kaikai”，“helloworld”，“xixiisagirl”(2)输出字符串直接在print函数中输出字符串。如：print(“kaikai”)(3)拼接字符串python中使用加号(+)来拼接字符串。如：2.字符串的常见方法：(1)字符串大小写
Python字符串的切片运算操作 MG_鹏鹏 Python学习笔记 python 开发语言
Python语言的字符串切片运算功能类比于Java等语言的字符串截取函数要简洁方使很多，使用起来很是顺手。一、语法格式：Python对字符的中的元素或者子串的访问使用方括号[]，类似于Java中的数组，但又青出于蓝而胜于蓝，通过索引值（下标）和：符灵活配合。格式：变量名[始下标：终下标：步长]其中始下标可以是0即从左往左开始，也可以是-1从右往左开始详见下图：从左往右01234567从右往左-8-
大模型时代，新手和程序员如何转型入局大模型行业？我爱学AI transformer 人工智能自然语言处理深度学习大模型训练转行大模型 LLM
在当今大模型迅猛发展的环境下，人工智能的应用越来越广泛。然而，这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术，不仅能够帮助我更好地使用大模型，还能为我提供创新和解决实际问题的能力。因此，在这个AI迅猛发展的时代，掌握传统机器学习和神经网络显得尤为重要。在近期的全国两会上，“人工智能”再次被提及，并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里，人工
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技前端收割机程序员 python 科技语言模型
ChatGPT是OpenAI推出的一种基于GPT-3/4的聊天机器人。chatgpt的颠覆性影响主要体现在提高语言交流的便捷性、个性化服务、自动化客服和教育娱乐等方面，这些应用可以为用户带来更多的便利和乐趣，同时也为企业提供了更多的服务和商机。本文收录于《100天精通Python专栏-快速入门到黑科技》，是由CSDN内容合伙人丨全站排名Top4的硬核博主不吃西红柿倾力打造，分基础知识篇和黑科技应用
Python项目中生成requirements.txt文件 Shy960418 python
一、生成requirements.txt文件首先，安装pipreqspipinstallpipreqs然后，在终端输入以下命令reqs./（问题1）当项目所在文件夹中已有requirement.txt时，会提示WARNING:requirements.txtalreadyexists,use--forcetooverwriteit这时需要将输入代码改为以下，即可更新已经存在的requirement
Pygame ，一个强大的游戏创作引擎李昕壑游戏 python
0.开篇废话（允许跳过）接下来，系列“游戏制作，但是使用Python，还能离线玩？干！”会为您介绍使用Python完成游戏创作的相关内容，但是，请注意：Python不能用于开发过度精细的3D游戏，如想尝试3D游戏，请移步：虚幻引擎5-UnrealEngine请认准系列名称，都在部分0.中，学习前请确认，以免造成内容不连续今天的内容为Pygame游戏库的简要介绍，后续更新的内容为Pygame优秀样例
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

ML@python@稀疏矩阵的存储和表示@CSR格式

文章目录

ML@python@稀疏矩阵的存储和表示@CSR格式

CSR格式

NNZ

Coordinate list (COO)

Compressed sparse row (CSR, CRS or Yale format)

三个数组

根据ROW_INDEX划分数组V或COL_INDEX

数组名称

demos in scipy

eg

eg

冗余分析

Yale sparse matrix

CSR编码效益分析

标准CSR编码和Scipy中的相关api

将给定矩阵编码双向转换

其他稀疏系数矩阵的编码和存储

你可能感兴趣的:(python,矩阵,机器学习)