ckllf

简单利用Python进行数据分析（NumPy基础：数组与向量化计算）

　　NumPy基础：数组与向量化计算

　　安装numpy及使用

　　pip install numpy

　　PyCharm无法使用numpy

　　File-->setting-->项目名-->Project Interpreter-->本地安装python-->应用

　　测试代码

　　import numpy as npdata = np.random.randn(2,3)print(data)

　　numpy简介

　　作用

　　ndarry，一种高效多维数组，提供了基于数组的边界算术操作及灵活的广播功能

　　对所有数据进行快速的矩阵计算，而无需编写循环程序

　　对硬盘中数组数据进行读写的工具，并对内存映射文件进行操作

　　线性代数、随机数生成以及傅里叶变换功能

　　用于连接NumPy到C、C++和FORTRAN语言类库的C语言API

　　数据分析应用

　　在数据处理。清洗、构造子集、过滤、变换以及其他计算中进行快速的向量化计算。

　　常见的数组算法，比如sort、unique以及set操作等

　　高效的描述性统计和聚合/概述数据

　　数据排列和相关数据操作，例如对异构数据进行merge和join

　　使用数组表达式来表明条件逻辑，代替if-elif-else条件分支的循环

　　分组数据操作(聚合、变换以及函数式操作)

　　python数组计算历程

　　Python中的数组计算方式要追溯到1995年，当时Jim Hugunin创造Numeric库。之后10年里，许多科研编制社区开始利用Python进行数组编程，但类库的生态在2000年之后都是碎片化的。2005年，Travis Oliphant在Numeric和Numarray项目之上打造了NumPy，将社区整合到用一个数组计算框架下。

　　NumPy重要原因

　　NumPy在内部将数据存储在连续的内存块上，这与其他的Python内建数据结构是不同的。NumPy的算法库是用C语言写的，所以在操作数据内存时不需要任何类型检查或者其他管理操作。NumPy数组使用的内存量也小于其他Pyhon内建序列。

　　Numpy可以针对全量数组进行复杂计算而不需要写Python循环。

　　性能对比代码

　　# NumPy性能和Python常规对比start = time.time()my_arr = np.arange(1000000)my_arr = my_arr * 2end = time.time()print('Running time: %s Seconds'%(end-start))start = time.time()my_list = list(range(1000000))my_list = my_list * 2end = time.time()print('Running time: %s Seconds' % (end - start))

　　NumPy ndarray:多维数组对象

　　ndarray

　　NumPy的核心特征之一就是N-维数组对象--ndarray。ndarray是Python中一个快速、灵活的大型数据集容器。数组允许你使用类似于标量的操作语法在整块数据上进行数学计算。

　　一个ndarray是一个通用的多维同类数据容器，也就是说，他包含的每一个元素均为相同类型。每一个数组都有一个shape属性，用来表征数组每一维度的数量;每一个数组都有一个dtype属性，用来描述数组的数据类型。

　　生成ndarray

　　生成数组最简单的方式就是使用array函数。array函数接收任意的序列型对象(当然也包括其他的数组)，生成一个新的包含传递数据的NumPy数组。

　　属性

　　ndim 数组纬度

　　shape 数组纬度和数量

　　dtype 数组类型

　　数组生成函数

　　array 将输入数据(可以是列表、元组、数组以及其他序列)转换为ndarray，如不显式指明数据类型，将自动判断;默认复制所有的输入数据。

　　asarray 将输入转换为ndarray，但如果输入已经是ndarray则不再复制

　　arange Python内建函数range的数组版，返回一个数组

　　ones 根据给定形状和数据类型生成全1数组

　　ones_like 根据所诶数组生成一个形状一样的全1数组

　　zeros 根据给定形状和数据类型生成全0数组

　　zeros_like 根据所给的数组生成一个形状一样的全0数组

　　empty 根据给定形状生成一个没有初始化数值的空数组

　　empty_like 根据所给数组生成一个形状一样但没有初始化数值的空数组

　　full 根据给定的形状和数据类型生成指定数值的数组

　　full_like 根据所给的数组生成一个形状一样但内容是指定数值的数组

　　eye，identity 生成一个N*N特征矩阵(对角线位置都是1，其余位置都是0)

　　使用np.empty 来生成一个全0数组，并不安全，有些时候他可能会返回未初始化的垃圾数值

　　ndarray数据类型

　　数据类型即dtype，是一个特殊的对象，他包含了ndarray需要为某一种类型数据所申明的内存块信息(也称为元数据，即表示数据的数据)

　　通常不需要担心如何记住NumPy数据类型，尤其当你还是新手的时候。通常你只需要关系数据的大类，比如浮点型、整数、布尔值、字符串或者某个Python对象。当你需要在内存或者硬盘上做更深入的存取操作时，尤其大数据集时，你才真正需要了解存储的数据类型。

　　数据类型

　　int8，uint8 类型代码il，ul 有符号和无符号的8数位整数

　　int16，uint16 类型代码i2，u2 有符号和无符号的16数位整数

　　int32，uint32 类型代码i4，u4 有符号和无符号的32数位整数

　　int64，uint64 类型代码i8，u8 有符号和无符号的64数位整数

　　float16 类型代码f2 半精度浮点数

　　float32 类型代码f4或f 标准单精度浮点数;兼容C语言float

　　float64 类型代码f8或d 标准双精度浮点数;兼容C语言double和Python float

　　float128 类型代码f16或g 拓展精度浮点数

　　complex64，complex128，complex256 类型代码c8，c16，c32 分别基于32位、64位、128位浮点数的复数

　　bool 类型代码? 布尔值，存储True或False

　　object 类型代码O Python object类型

　　string_ 类型代码S 修正的ASC II 字符串类型;例如生成一个长度为10的字符串类型使用S10

　　unicode_ 类型代码U 修改的Unicode类型，生成一个长度为10的Unicode类型使用U10

　　浮点数转换成整数则小数点后的部分将被消除

　　在NumPy中，当使用numpy.string_类型作字符串数据要小心，因为NumPy会修正他的大小或者删除输入切不发出警告。pandas在处理非数值数据时有更直观的开厢型操作

　　使用astype时总生成一个新的数组，即使你传入的dtype与之前一样

　　NumPy数组算术

　　数组之所以重要是因为他允许你进行批量操作而无需任何for循环，NumPy用户称这种特性为向量化

　　带有标量计算的算术操作，会把计算参数传递给数组的每个元素

　　同尺寸数组之间的比较，会产生一个布尔值数组

　　不同尺寸的数组间的操作，将会用到广播特性，将会在附录A中介绍。

　　基础索引与切片

　　数组切片是原数组的视图，意味着数据并不是被复制了任何对于视图的修改都会反应在原数组上

　　如果你还是想要一份数组切片的拷贝而不是一份视图的话，你就必须显式地复制这个数组。arr[5:8].copy()

　　在一个二维数组中，每个索引值对应的元素不是一个值而是一个一维数组。

　　在多维数组中，你可以省略后续索引值，返回对象将是降低一个维度的数组

　　数组切片索引

　　数组延着轴0进行切片，表达式arr[:2]的含义为选择arr的前两行

　　如果将索引和切片混合，就可以得到维度的切片

　　注意：单独一个冒号标识选择整个轴上的数组

　　arr[:2, 1:] 从开始到第二行，从第一列到最后一列

　　arr[2] 第三行数据

　　arr[2,:] 第三行数据

　　arr[2:,:] 第三行数据

　　arr[:,:2] 所有行数据和首列到第二列

　　布尔索引

　　布尔值数组的长度和数组轴索引长度一致。你甚至还可以用切片或者整数值对布尔值数组进行混合匹配

　　当布尔值数组的长度不正确时，布尔值选择数据的方法并不会报错，因此建议在使用该特性要注意

　　为了选择除条件以外的其他数据，你可以使用!=或者在条件表达式前使用~对条件取反

　　使用布尔值索引选择数据时，总是生成数据的拷贝，即使返回的数组并没有任何变化。

　　Python中的关键字and或or对布尔值数据并没有用，要使用&(and)和|(or)来代替

　　神奇索引

　　神奇索引时NumPy中的术语，用于描述使用整数数组进行数据索引。

　　神奇搜索与切片不同，他总是将数据复制到一个新的数组中。

　　正数数组从前索引，负数数组从后索引

　　数组转置和换轴

　　转置是一种特殊的数据重组形式，可以返回底层数据的视图而不需要复制任何内容。数组拥有transpose方法，也有特殊的T属性。

　　T属性就是数据反转

　　计算矩阵内积会使用np.dot

　　对于更高维度数组，transpose方法可以接收包含轴编号的元组，用于置换轴。

　　使用.T进行转置是换轴的一个特殊案例，ndarray有一个swapaxes方法，该方法接收一个对轴编号作为参数，并对轴进行调整用于重组数据

　　swapaxes返回的是数据视图，而没有对数据进行复制

　　通用函数：快速的逐元素数组函数

　　含义

　　通用函数，也可以称为ufunc，是一种ndarray数据中进行逐元素操作的函数。

　　某些简单函数接收一个或者多个标量数值，并产生一个或者多个标量结果，而通过函数就是对这些简单函数的向量化封装

　　一元通用函数

　　abs、fabs 逐元素地计算整数、浮点数或者复数的绝对值

　　sqrt 计算每个元素的平方根(与arr ** 0.5相等)

　　square 计算每个元素的平方(与arr ** 2相等)

　　exp 计算每个元素的自然数指数值ex

　　log、log10、log2、log1p 分别对应：自然数对数(e为底)、对数10位底、对数2为底、log(1+x)

　　sign 计算每个元素的符号值：1(整数)、0(0)、-1(负数)

　　ceil 计算每个元素的最高整数值(即大于等于给定数值的最小整数)

　　floor 计算每个元素的最小整数值(即小于等于给定元素的最大整数)

　　rint 将元素保留整数位，并保持dtype

　　modf 分别将数组的小数部分和整数部分按数组形式返回

　　isnan 返回数组中的元素是否是一个NaN(不是一个数值)，形式为布尔值数组

　　isfinite、isinf 分别返回数组中的元素是否有限(非inf、非NaN)、是否无线的，形式为布尔值数组

　　cos、cosh、sin、sinh、tan、tanh 常规的双曲三角函数

　　arccos、arccosh、arcsin、arcsinh、arctan、arctanh 反三角函数

　　logical_not 对数组的元素按位取反(与~arr效果一致)

　　二元通用函数

　　add 将数组的对应元素相加

　　subtract 在第二个数组中，将第一个数组中包含的元素去除

　　multiply 将数组的对应元素相乘

　　divide、floor_divide 除或者整除(放弃余数)

　　power 将第二个数组的元素作为第一个数组对应元素的幂次方

　　maximum、fmax 逐个元素计算最大值，fmax忽略NaN

　　minmum、fmin 逐个元素计算最小值，fmin忽略NaN

　　mod 按元素的求摸计算(即求除法的余数)

　　copysign 将第一个数组的符号值改为第二个数组的符号值

　　greater、greater_equal、less、less_equal、equal、not_equal 进行逐个元素的比较，返回布尔值数组(与数学操作符>、>=、<、<=、==、!=效果一致)

　　logical_and、logical_or、logical_xor 进行逐个元素的逻辑操作(与逻辑操作符&、|、^效果一致)

　　使用数组进行面向数组编程

　　含义

　　使用NumPy数组可以使你利用简单的数组表达式完成多种数据操作任务，而无需写些大量循环。这种利用数组表达式来替代显式循环的方法称为向量化

　　向量化的数组操作会比纯Python的等价实现在速度上快一到两个数量级(甚至更多)，这对多有种类的数值计算产生了最大的影响

　　将条件逻辑作为数组操作

　　numpy.where函数是三元表达式 x if condition else y的向量化版本

　　np.where 的第一个参数是条件，第二个和第三个参数并不一定是数组可以是标量

　　where在数据分析中一个典型的用法是根据一个数组来生成一个新的数组

　　传递给np.where的数组即可以是同等大小的数组，也可以是标量

　　数学和统计方法

　　许多关于计算整个数组统计值或者关于轴向数据的数学函数，可以作为数组类型的方法被调用。你可以使用聚合函数(通常也叫缩减函数)，比如sum、mean和std(标准差)，即可以直接调用数组实例的方法，也可以使用顶层的NumPy函数。

　　基础数组统计方法

　　sum 沿着轴向计算所有元素的累和，0长度的数组，累和为0

　　mean 数学平均，0长度的数组平均值为NaN

　　std、var 标准差和方差，可以选择自由度调整(默认分母n)

　　min、max 最小值和最大值

　　armin、armax 最小值和最大值的位置

　　cumsum 从0开始元素累积和

　　cumprod 从1开始元素累积积

　　布尔值数组的方法

　　布尔值会被强制为1(True)和0(False)。

　　可以通过sum用于计算布尔值数组中True的个数

　　any检查数组中是否至少有一个True

　　all检查是否每个值都是True

　　排序郑州人流医院 http://m.zzzy120.com/

　　和Python的内建列表类型相似，NumPy数组可以使用sort方法按位置排序。

　　在多维数组中根据传递的axis值，沿着轴向对每个一维数据段进行排序

　　顶层的np.sort方法返回的是已经排序号的数组拷贝，而不是对原数组按位置排序

　　唯一值与其他集合逻辑

　　NumPy包含一些针对一维ndarray的基础集合操作。

　　数组集合操作

　　unique(x) 计算x的唯一值并排序

　　intersect1d(x,y) 计算x和y的交集，并排序

　　union1d(x,y) 计算x和y的并集，并排序

　　inld(x,y) 计算x中的元素是否包含在y中，返回一个布尔值数组

　　setdiff1d(x,y) 差集，在x中但不在y中的x元素

　　setxor1d(x,y) 异或集，在x或y中，但不属于x、y交集的元素

　　使用数组进行文件输入和输出

　　NumPy可以在硬盘中将数据以文本或者二进制文件的形式进行存入银盘或者由硬盘载入。

　　大部分用户更倾向于与使用pandas或者其他工具来载入文本或者表格型数据

　　np.save和np.load是高效存取硬盘数据的两大工具函数。数组在默认情况下是以未压缩的格式进行存储的，后缀名.npy

　　压缩好的数据可能会想要使用numpy.savez_compressed将数据存入已经压缩的文件中

　　线性代数

　　线性代数比如矩阵乘法、分解、行列式等方阵数学，是所有数组类库的重要组成部分

　　NumPy的线性代数中所不同的是 * 是矩阵的逐元素乘积而不是矩阵的点乘积，因此NumPy的数组方法和numpy命名空间中都有一个函数dot

　　numpy.linalg 拥有一个矩阵分解标准的函数集，以及其他常用函数。

　　数组.T.dot(数组) 计算的是数组和它的转置矩阵数组.T的点乘积

　　特殊符号@也作为中缀操作符，用于点乘矩阵操作

　　常用numpy.linalg函数

　　diag 讲一个方阵的对角(或非对角)元素作为一维数组返回，或者将一维数组换成一个方阵，并且在非对角线上又零点

　　dot 矩阵点乘

　　trace 计算对角元素和

　　eig 计算方阵的特征值和特征向量

　　inv 计算方阵的逆矩阵

　　pinv 计算矩阵的Moore-Penrose伪逆

　　qr 计算QR分解

　　svd 计算奇异值分解(SVD)

　　solve 求解x的线性系统Ax = b ，其中A是方阵

　　lstsq 计算Ax = b 的最小二乘解

　　伪随机数生成

　　numpy.random模块填补了Python内建在random模块的不足，可以高效地生成多种概率分布下的完整样本值数组

　　Python内建random模块一次中能生成一个值

　　伪随机数他们是由具有确定性行为的算法根据随机数生成器中的随机数种子生成，可以通过np.random.seed更改NumPy的随机数种子

　　numpy.random中的数据生成函数使用一个全局随机数种子。为了避免全局状态，你可以使用numpy.random.RandomState创建一个随机数生成器，使数据独立于其他的随机数状态

　　numpy.random中的部分函数

　　seed 向随机数生成器传递随机状态种子

　　permutation 返回一个序列的随机排列，或者返回一个乱序的整数范围序列

　　shuffle 随机排列一个序列

　　rand 从均匀分布中抽取样本

　　randint 根据给定的由低到高的范围抽取随机整数

　　randn 从均值0方差1的正态分布中抽取样本(MATLAB型接口)

　　binomial 从二项分布中抽取样本

　　normal 从正态(高斯)分布中抽取样本

　　beta 从beta分布中抽取样本

　　chisquare 从卡方分布中抽取样本

　　gamma 从伽马分布中抽取样本

　　uniform 从均匀[0,1)分布中抽取样本

　　示例：随机漫步

　　随机漫步模型提供了一个适用数组操作的说明性应用

　　一次性模拟多次随机漫步

　　# 模拟多次随机漫步，比如说5000步，如果传入一个2个元素的元组# numpy.random中的函数可以生成一个二维抽取数组，并且我们可# 以一次性地跨行计算出全部5000个随机不的累积和n = 5000ns = 1000d = np.random.randint(0,2,size=(n,ns))s = np.where( d > 0,1,-1)w = s.cumsum(1)print(w)# 现在我们可以计算出这些随机步的最大值和最小值print(w.max())print(w.min())# 让我们在这些随机步中计算出30或者-30的最小穿越时间。这有点辣手# 因为我们不是所有的5000都达到了30.我们可以使用any方法来检查hi30 = (np.abs(w) >= 30).any(1)print(hi30)print(hi30.sum())# 我们可以使用布尔值数组来选出绝对不输超过30的步所在的行，并使用# argmax从轴向1上获取时间c_time = (np.abs(w[hi30]) >= 30).argmax(1)print(c_time.mean())

你可能感兴趣的:(Python,NumPy)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，