aabond

Python数据分析之Numpy

文章目录

前言
一、数组
- 1.1 数组创建
- 1.2 数组属性
- 1.3 数组切片和索引
- 1.4 数组广播
- 1.5 数组操作
- 1.6 数组迭代
二、数学函数
- 2.1 三角函数
- 2.2 运算函数
- 2.3 统计函数
- 2.4 排序及筛选函数
- 2.5 线性代数
三、随机数
- 3.1 简单随机数
- 3.2 随机排列
- 3.3 随机分布
四、字符串
- 4.1 字符串操作函数
- 4.2 字符串比较函数
- 4.3 字符串信息函数
五、傅里叶变换
- 5.1 标准FFT
- 5.2 real FFT
- 5.3 Hermitian FFT
六、输入和输出
- 6.1 输入
- 6.2 输出
参考

前言

NumPy 是使用 Python 进行科学计算的基本包，增加了对大型、多维数组和矩阵的支持，以及在这些数组上操作的大量高级数学函数。NumPy 最初是由 Jim Hugunin 和其他几个开发人员创建的。2005年，Travis Oliphant 结合了另一个同性质的程序库 Numarray 的特色，并加入了其它扩展而开发了 NumPy。NumPy 为开放源代码并且由许多协作者共同维护开发。

它提供了一些很实用的功能

功能强大的n维数组对象
复杂的（广播）功能
集成C/C++和Fortran代码的工具
有用的线性代数、傅里叶变换和随机数能力

github 地址： https://github.com/numpy/numpy

文档地址：https://numpy.org/doc/

API 文档地址：https://numpy.org/devdocs/reference/index.html#reference

安装：

pip install numpy

一、数组

NumPy 最重要的一个特点是其 N 维数组对象 ndarray，它是一系列同类型数据的集合，以 下标 0 为开始进行集合中元素的索引。

ndarray 和 python 中普通的数组(列表)的区别有

NumPy 数组在创建时具有固定的大小，这不像Python 列表，可以动态增长。更改 ndarray 的大小将创建一个新的数组并删除原始数组。
NumPy 数组中的元素都需要具有相同的数据类型，因此在内存中将具有相同的大小。例外情况：可以有（Python，包括NumPy）对象的数组，从而允许不同大小的元素的数组。
NumPy数组集成了对大量数据的高级数学和其他类型的操作。通常，与使用Python的内置序列相比，这样的操作执行效率更高，代码也更少。

越来越多的基于科学和数学的基于 python 的软件包正在使用 NumPy 数组；虽然这些输入通常支持 python 序列输入，但它们在处理之前将这些输入转换为 NumPy 数组，并且经常输出 NumPy 数组。换句话说，为了有效地使用当今许多（甚至是大多数）基于Python的科学/数学软件，仅仅知道如何使用Python的内置序列类型是不够的——人们还需要知道如何使用 NumPy 数组。

下面会介绍一些常用函数

1.1 数组创建

import numpy as np

np.array([1, 2, 3, 4, 5, 6])
np.array([[1, 2, 3], [4, 5, 6]], np.int32)

np.zeros((3,4))
np.ones((2,3))
np.empty(2)
np.arange(10, 30, 5)
np.linspace(0, 2, 9)

array

创建 1 个数组
```
numpy.array(object, dtype=None, *, copy=True, order='K', subok=False, ndmin=0, like=None)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.array.html#numpy.array
zeros

创建1个数组，充满0
```
numpy.zeros(shape, dtype=float, order='C', *, like=None)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.zeros.html
ones

创建1个数组，充满1
```
numpy.ones(shape, dtype=None, order='C', *, like=None)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.ones.html
empty

创建没有初始化的数组，内容随机
```
numpy.empty(shape, dtype=float, order='C', *, like=None)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.empty.html#numpy.empty
arange

创建在给定间隔内返回均匀间隔的值数组，不包含结束值，指定间隔
```
numpy.arange([start, ]stop, [step, ]dtype=None, *, like=None)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.arange.html
linspace

创建在指定间隔内返回均匀间隔的数字数组，包含结束值，指定个数
```
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)
```
具体文档：https://numpy.org/devdocs/reference/generated/numpy.linspace.html

1.2 数组属性

数组属性	含义	文档链接
ndarray.ndim	维度数量	https://numpy.org/devdocs/reference/generated/numpy.ndarray.ndim.html
ndarray.shape	数组的维度，对于矩阵，n 行 m 列	https://numpy.org/devdocs/reference/generated/numpy.ndarray.shape.html
ndarray.size	数组元素的总个数，相当于 .shape 中 n*m 的值	https://numpy.org/devdocs/reference/generated/numpy.ndarray.size.html
ndarray.dtype	ndarray 对象的元素类型	https://numpy.org/devdocs/reference/generated/numpy.ndarray.dtype.html
ndarray.itemsize	ndarray 对象中每个元素的大小，以字节为单位	https://numpy.org/devdocs/reference/generated/numpy.ndarray.itemsize.html
ndarray.flags	ndarray 对象的内存信息	https://numpy.org/devdocs/reference/generated/numpy.ndarray.flags.html
ndarray.real	ndarray元素的实部	https://numpy.org/devdocs/reference/generated/numpy.ndarray.real.html
ndarray.imag	ndarray 元素的虚部	https://numpy.org/devdocs/reference/generated/numpy.ndarray.imag.html
ndarray.data	包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性。	https://numpy.org/devdocs/reference/generated/numpy.ndarray.data.html
ndarray.strides	在遍历数组时在每个维度中步进的字节元组	https://numpy.org/devdocs/reference/generated/numpy.ndarray.strides.html
ndarray.T	转置数组	https://numpy.org/devdocs/reference/generated/numpy.ndarray.T.html

1.3 数组切片和索引

ndarray 支持索引和切片Slice 访问内部元素，下面会介绍一些简单用法，详细的具体文档可以见：https://numpy.org/devdocs/user/basics.indexing.html#basic-indexing

简单索引

x = np.arange(10)
x[0]
x[-2]
x.shape = (2, 5)
x[0,3]
x[1,-1]

切片

基本切片语法是i:j:k
- 其中i是起始索引，j是停止索引，k是步进（k != 0）。这将选择具有索引值 i，i+k，…，i+(m-1)*k的m个元素
- 如果j > N(元素个数)，则为N
- j也可以省略，默认为N
- 结果不包含停止索引
- :k 可以省略，默认步进为1。
- 如果 i 和 j 是负数，那么实际索引是指N+i, N+j。k如果是负数，那代表逆向
```
x = np.arange(10)
x[1:8:1]
x[1:8]
x[2:]
x[-2:1]
x[-2:1:-2]
x[:]
```

复合索引和切片

y=np.arange(35).reshape(5, 7)

y[[0,2,4], [0, 3, 5]]# 二维数组寻找坐标为(0,0) (2,3) (4,5) 三个数

y[1:3, 1:3]# 寻找二维数组第1,2行，再找第1,2列

y[1:3, [1,2]]# 等价上方
 
y[..., 1:] # ...用于 若干省略的维度保持原样，其他维度保留给定参数的元素

y[y > 5]
y[(y > 4) & (y < 10)]

y[:, np.newaxis] # 增加轴(维度)

1.4 数组广播

广播这个术语描述了 NumPy 在算术操作过程中如何处理具有不同形状的数组。在一定的约束下，较小的数组在较大的数组上“广播”，从而使它们具有兼容的形状。广播提供了一种向量化数组操作的方法，以便循环发生在C中而不是Python中。它在不制作不必要的情况下复制数据，通常会导致有效的算法实现。然而，在某些情况下，广播是一个坏主意，因为它会导致内存使用不足，从而降低计算速度。

如果两个数组 a 和 b 形状相同，即满足 a.shape == b.shape，那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同，且各维度的长度相同。当运算中的 2 个数组的形状不同时，numpy 将自动触发广播机制。

具体文档：https://numpy.org/devdocs/user/basics.broadcasting.html#broadcasting

a = np.array([1, 2, 3, 4])
b = 2
# 会触发广播
a * b 
a + b
a - b
a / b

# 形状不同，报错
y=np.arange(35).reshape(5, 7)
y + a

1.5 数组操作

下面会介绍常用的数组操作函数，具体文档：https://numpy.org/devdocs/reference/routines.array-manipulation.html

数组复制

A = np.array([[1, 2, 3], [4, 5, 6]])
B = [[4, 5, 6], [7, 8, 9]]
np.copyto(A, B)

数组形状修改

a = np.arange(6)

a.reshape((3, 2)) # 修改形状
a.reshape(3， -1) # -1会被推断为2

x = np.array([[1, 2, 3], [4, 5, 6]])
np.ravel(x) # 转为一维数组

x.flat[0] # 一维迭代器
x.flat[3]

np.swapaxes(x,0,1) # 交换数组的两个轴

数组维数扩充

a=np.arange(6)

np.expand_dims(a, axis=0) # 等价于  x[np.newaxis, :]
np.expand_dims(x, axis=1) # 等价于  x[:, np.newaxis]

数组连接和分割

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

np.vstack((a,b)) # 行连接
np.column_stack((a,b)) # 列拼接

x = np.arange(9)
np.split(x, 3) #分割

数组元素添加与删除

a=np.arange(10)
np.insert(a, 1, 5)
b=a.reshape(2, 5)
np.insert(b, 1, 5, axis=1)

np.append(b, [[1, 2, 3, 4, 5], [4, 5, 7, 8, 9]], axis=0)

np.delete(a, 1, 0)
np.delete(b, [1], axis=0)

数组重复构造

a = np.array([0, 1, 2])

np.tile(a, 2) 
np.tile(a, (3, 1, 2))

np.repeat(3, 4)

x = np.array([[1,2],[3,4]])

np.repeat(x, 2)
np.repeat(x, 2, axis=1)
np.repeat(x, [1, 2], axis=0)

1.6 数组迭代

数组迭代 nditer() 函数, 文档：https://numpy.org/devdocs/reference/generated/numpy.nditer.html#numpy.nditer

class numpy.nditer(op, flags=None, op_flags=None, op_dtypes=None, order='K', casting='safe', op_axes=None, itershape=None, buffersize=0)

下面会介绍常用的数组迭代，具体文档：https://numpy.org/devdocs/reference/arrays.nditer.html#arrays-nditer

简单数组迭代

a = np.arange(6).reshape(2,3)
for x in np.nditer(a):
    print(x, end=", ")
 
for x in np.nditer(a, order='C'):
    print(x, end=", ")

for x in np.nditer(a, order='F'):
    print(x, end=', ')

with np.nditer(a, op_flags=['readwrite']) as it:
   for x in it:
       x[...] = 2 * x
        
a = np.arange(6).reshape(2,3)   
for x in np.nditer(a, flags=['external_loop'], order='F'):
    print(x, end=', ')
    
it = np.nditer(a, flags=['multi_index'])
while not it.finished:
    print("%d <%s>" % (it[0], it.multi_index), end=' ')
    is_not_finished = it.iternext()

for x in np.nditer(a, flags=['buffered'], op_dtypes=['complex128']):
    print(np.sqrt(x), end=', ')

广播数组迭代

a = np.arange(3)
b = np.arange(6).reshape(2,3)

for x, y in np.nditer([a,b]):
    print("%d:%d" % (x,y), end=' ')

二、数学函数

具体文档：https://numpy.org/devdocs/reference/routines.math.html

2.1 三角函数

# 除了sin还有很多三角函数，具体可以查文档
np.sin(np.pi/2)
np.sin(np.array((0, 30, 45, 60, 90)) * np.pi / 180)

# 斜边
np.hypot(3*np.ones((3, 3)), 4*np.ones((3, 3)))

# 双曲函数
np.sinh(np.pi/2)

2.2 运算函数

np.round(16.055, 2)# 四舍五入

a = np.array([-1.7, -1.5, -0.2, 0.2, 1.5, 1.7, 2.0])
b = np.array([2.1, -2.5, -0.2, 1.2, 2.9, 1.0, 1.7])
             
np.floor(a) # 向上求整
np.ceil(a)  #向下求整       

np.sum(a) # 求和
np.prod(a)# 求积

#加减乘除
np.add(a,b) 
np.subtract(a,b)
np.multiply(a, b)
np.divide(a,b)

np.sqrt(a)
np.exp(a)
np.log(a)
np.log10(a)
np.log2(a)

2.3 统计函数

a = np.array([-1.7, -1.5, -0.2, 0.2, 1.5, 1.7, 2.0])
b = np.array([2.1, -2.5, -0.2, 1.2, 2.9, 1.0, 1.7])

np.maximum(a, b) # 两者较大值
np.amax(a) # 最大值
np.amin(a) # 最小值
np.median(a) # 中位数
np.mean(a) # 算术平均值
np.average(a) # 加权平均值
np.std(a) #标准方差
np.var(a) # 方差

2.4 排序及筛选函数

https://numpy.org/devdocs/reference/routines.sort.html

a = np.array([-1.7, -1.5, -0.2, 0.2, 1.5, 1.7, 2.0])
b = np.array([2.1, -2.5, -0.2, 1.2, 2.9, 1.0, 1.7])

np.sort(b) # 排序

np.argsort(b) # 排序元素的索引

np.lexsort((b,a))  # 先通过a排序，相等的元素再通过b排序确定索引，输出索引，稳定排序

np.where(a < b, a, 10 + b)

2.5 线性代数

https://numpy.org/devdocs/reference/routines.linalg.html

a = np.array([[1, 0], [0, 1]])
b = np.array([[4, 1], [2, 2]])

np.dot(a, b) # 点积
np.vdot(a, b) # 向量点积
np.inner(a, b) # 内积
np.matmul(a, b) # 矩阵乘积

np.linalg.det(a) # 计算行列式结果
np.linalg.solve(a, b) # 求解一个线性矩阵方程，或线性标量方程组。
np.linalg.inv(a) # 计算一个矩阵的（乘法）逆。

三、随机数

具体文档：https://numpy.org/devdocs/reference/random/index.html

3.1 简单随机数

https://numpy.org/devdocs/reference/random/legacy.html

https://numpy.org/devdocs/reference/random/generated/numpy.random.rand.html

np.random.rand(3,2) # 生成[0, 1)随机浮点数，形状3x2
np.random.randint(10, 100, size=10) # 生成[10,100),10个整数随机数
np.random.randn(10) # 正态分布随机数

3.2 随机排列

np.random.permutation(10)
np.random.permutation([1, 4, 9, 12, 15])

a=np.arrange(10)
np.random.shuffle(a)

3.3 随机分布

np.random.random_sample(10) # [0.0,1.0) 随机浮点数
np.random.standard_cauchy(10) # 柯西分布
np.random.standard_exponential(10) # 指数分布

四、字符串

https://numpy.org/devdocs/reference/routines.char.html

4.1 字符串操作函数

np.char.add(["num", "doc"], ["py", "umentation"])
np.char.capitalize(["python", "numpy"])
np.char.join(['-', '.'], ['ghc', 'osd'])

a = np.array(["That is a mango", "Monkeys eat mangos"])
np.char.replace(a, 'mango', 'banana')
np.char.split(a, ' ')

4.2 字符串比较函数

np.char.equal(['str', '1', 'TRUE'], ['abc', '1', 'FALSE'])

4.3 字符串信息函数

a='Python And Numpy Aabond  Learn Python A GOOD'
np.char.count(a, 'A')
np.char.find(a, "Python", start=0, end=None)
np.char.rfind(a, "Python", start=0, end=None)

五、傅里叶变换

https://numpy.org/devdocs/reference/routines.fft.html

5.1 标准FFT

%matplotlib notebook
import matplotlib.pyplot as plt
t = np.arange(256)
sp = np.fft.fft(np.sin(t))
freq = np.fft.fftfreq(t.shape[-1])
plt.plot(freq, sp.real, freq, sp.imag)
plt.show()

5.2 real FFT

np.fft.fft([0, 1, 0, 0])
np.fft.ifft([1, -1j, -1, 1j])
np.fft.irfft([1, -1j, -1])

5.3 Hermitian FFT

signal = np.array([1, 2, 3, 4, 3, 2])
np.fft.fft(signal)
np.fft.hfft(signal[:4]) 
np.fft.hfft(signal, 6)


spectrum = np.array([ 15, -4, 0, -1, 0, -4])
np.fft.ifft(spectrum)
np.fft.ihfft(spectrum)

六、输入和输出

Numpy 可以读写磁盘上的文本数据或二进制数据。
NumPy 为 ndarray 对象引入了一个简单的文件格式：npy。
npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。
常用的 IO 函数有：

load() 和 save() 函数是读写文件数组数据的两个主要函数，默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。
savez() 函数用于将多个数组写入文件，默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为 .npz 的文件中。
loadtxt() 和 savetxt() 函数处理正常的文本文件(.txt 等)

具体 IO 函数相关文档可以见：

https://numpy.org/devdocs/user/basics.io.html
https://numpy.org/devdocs/reference/routines.io.html

6.1 输入

from io import StringIO
data = u"1, 2, 3\n4, 5, 6"
np.genfromtxt(StringIO(data), delimiter=",")

data = u"\n".join(str(i) for i in range(10))
np.genfromtxt(StringIO(data))
np.genfromtxt(StringIO(data), skip_header=3, skip_footer=5)

c = StringIO("1,0,2\n3,0,4")
np.loadtxt(c, delimiter=',', usecols=(0, 2), unpack=True)

6.2 输出

x = np.arange(10)
np.save('D:\\x.npy', x)

x = y = z = np.arange(0.0,5.0,1.0)
filePath='D:\\test.txt'
np.savetxt(filePath, x, delimiter=',') 
np.savetxt(filePath, (x,y,z))   
np.savetxt(filePath, x, fmt='%1.4e')

参考

https://www.runoob.com/numpy/numpy-tutorial.html

python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
淘宝/天猫店铺订单数据导出、销售报表设计与数据分析指南不会玩技术的技术girl API 数据分析人工智能数据库
在电商运营中，订单数据是店铺运营的核心资产之一。通过对订单数据的导出、整理和分析，商家可以更好地了解销售情况、优化运营策略、提升客户满意度，并制定科学的业务决策。本文将详细介绍淘宝/天猫店铺订单数据的导出方法、销售报表的设计思路以及数据分析的实用技巧，帮助电商从业者高效管理店铺数据。一、订单数据导出（一）手动导出订单数据淘宝和天猫平台提供了手动导出订单的功能，适用于数据量较小或临时性需求的场景。商
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
安心联车辆管理系统在汽车金融领域的应用安心联-车辆监控管理系统汽车金融人工智能
安心联车辆管理系统在汽车金融领域的应用主要体现在通过智能化监控与数据分析技术，提升金融风控能力、优化资产管理和降低运营风险。以下从核心功能、技术赋能和实际场景三个方面展开分析：一、核心功能适配金融场景车辆资产动态监控实时定位与电子围栏：系统基于北斗/GPS双模定位技术，可实时追踪车辆位置，并设置电子围栏限制车辆行驶区域。若车辆驶出授权范围（如贷款合同约定的使用区域），系统立即触发报警并留存轨迹证据
清华大学第四发《DeepSeek+DeepResearch 让科研像聊天一样简单》人工智能
当下科研领域，传统模式急需改变，清华大学第四版《DeepSeek+DeepResearch：让科研像聊天一样简单》全文一共86页，以下是文档的关键内容总结：一、智能组合优势DeepSeek与DeepResearch构建先进技术体系，有强大模型运算、智能数据处理和友好交互界面。模型在数据处理速度、精准度和泛化能力上远超传统模型。数据采集渠道广、处理快，能读取多种格式文件。数据分析深入，可视化直观，还
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
【Linux】删除Conda虚拟环境不是伍壹 Linux linux conda 运维
1、查看当前系统的conda虚拟环境condainfo--envscondaenvlist2、创建虚拟的环境condacreate-n（你的环境名字）python=（你需要的版本号，如（3.7,3.8,3.10））3、查看安装了哪些包condalist4、删除虚拟环境condaremove-nname--all5、删除虚拟环境中的包condaremove--name$（需要删除的环境名字）$（需要
动态规划之背包问题--python版本我是小码搬运工 #python基础动态规划背包问题 python版本
动态规划之背包问题–python版本问题已知一个最大量的背包，给定一组给定固定价值和固定体积的物品，求在不超过最大值的前提下，能放入背包中的最大总价值。解题思路该问题是典型的动态规划问题，分为三种不同的类型（0-1背包问题、完全背包和多重背包问题）解题关键–状态转移表达式：B(k,C)=max(B(k−1,C),B(k−1,C−ci)+vi)B(k,C)=max(B(k-1,C),B(k-1,C-
Centos7 搭建 Jupyter + Nginx 服务某龙兄 python nginx linux centos
JupyterNotebook（此前被称为IPythonnotebook）是一个交互式笔记本，支持运行40多种编程语言。JupyterNotebook的本质是一个Web应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和markdown。用途包括：数据清理和转换，数值模拟，统计建模，机器学习等等。本文讲述如何搭建Jupyter+Nginx服务,仅供学习与交流，请勿用于商业用途一
智能化工作流：探索顶尖工作流管理软件的核心优势团队协作工具
工作流管理软件是一种用于规划、执行和监控业务流程的软件应用程序。以下是关于工作流管理软件的详细介绍：一、定义与功能工作流管理软件旨在帮助团队和企业优化工作流程，提高工作效率。它通常包括任务分配、进度追踪、团队协作、自动化流程、数据分析等功能。通过这类软件，企业可以更好地管理内部流程，确保任务的顺利进行，并实时监控项目的进展情况。二、主要软件推荐板栗看板：可视化管理与团队协作的利器核心功能：板栗看板
动态规划之背包问题的Python实现名侦探debug Python 数据结构 python 数据结构动态规划求解
目录1.问题描述2.动态规划之网格法3.python实现1.问题描述题目来源于《算法图解》第9章练习题9.2，如下图所示。对于背包问题，通常的做法有列举法、贪婪算法和动态规划（1）列举法：列举出所有的可能情况，再选择最优解，但当情况很多时，这种算法复杂度很高（2）贪婪算法：在容量允许范围内，每次都拿剩余物品中价值最高的，贪婪算法能够快速解决复杂度很高的问题，但通常得到的是次优解，但就对这个题目而言
总结10个Python赚钱的接单平台兼职月入5000+ begefefsef 面试学习路线阿里巴巴 android 前端后端
前言“如果说当下什么编程语言最靠谱或者比较适合搞副业？”答案肯定100%是：Pythonpython是所有语法中最简单易上手的语言，不需要特别的的英语词汇量，逻辑思维也不需要很差就能上手。而且学会了之后就能编写代码爬取各种数据，制作各种图表，提升工作效率。而且还能利用业余时间接点私活，一个月轻松收入过万不是问题，这样的生活他不香吗？今天就给大家盘点几个基本入门接私活的资源，让你轻松学python，
大学生学完python靠几个接单网站兼职，实现经济独立「已注销」 python 开发语言
大学生学完python靠几个接单网站兼职，实现经济独立程序员就是当今时代的手艺人，程序员可以通过个人的技术来谋生。而在工作之余接私单可以作为一种创富的途径，受到程序员的广泛认可。说句实在话，现在这个时代，很多人仅靠主业顶多维持基本生活，想让自己、家人生活好一点很难。我接的私活并不算多，加起来也就几万左右，只能算一半，我想把一些经验分享出来，毕竟现在生活都不容易，能赚一点是一点。一、程序员接活、新手
Conda 常用命令全解析 melck conda
在Windows系统中，Conda是一款功能强大的包管理和环境管理工具，尤其对于数据分析、科学计算等场景有着重要的作用。本文将详细介绍Conda在Windows系统中的常用命令，帮助你高效地管理虚拟环境和软件包。一、环境管理命令1.1查看Conda版本conda--version该命令用于确认Conda是否成功安装以及查看其版本号。这对于确保Conda的兼容性和功能性非常重要。1.2创建新环境co
Python wifi 安装手机app yichengace python
目的当测试机数量越来越多时，测试包的安装会成为一个问题，用wifi安装来解决这个问题，并且用脚本语言来批量控制思路思路就是py调用pc端的adb命令，向手机发送请求，无线是因为，如果未来测试机越来越多，一台电脑的usb接口数量肯定不够准备工具python，adb，pycharm，测试用app，这里选择qq（https://qd.myapp.com/myapp/qqteam/AndroidQQ/mo
深度学习之目标检测的常用标注工具铭瑾熙人工智能机器学习深度学习深度学习目标检测目标跟踪
1LabelImgLabelImg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用Python编写的，并使用Qt作为其图形界面，简单好用。注释以PASCALVOC格式保存为XML文件，这是ImageNet使用的格式。此外，它还支持COCO数据集格式。2labelmelabelme是一款开源的图像/视频标注工具，标签可用于目标检测、分割和分类。灵感是来自于MIT开源的一款标注工具Label
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
Python 舆论风向分析爬虫：全流程数据获取、清洗与情感剖析西攻城狮北 python 爬虫开发语言实战案例
引言在当今信息爆炸的时代，互联网上充斥着海量的用户言论和观点。了解舆论风向对于企业、政府机构以及研究者等具有重要的意义，可以帮助他们及时把握公众情绪、调整策略与决策。Python作为一种强大的编程语言，在数据爬取与分析方面具有得天独厚的优势，能够助力我们高效地实现舆情监测与深入剖析。一、环境搭建与目标确定1.环境搭建为了顺利完成爬虫与数据分析任务，首先需要确保你的开发环境已经安装了以下Python
PyCharm 集成 DeepSeek：本地运行 or API 直连？打造你的 AI 编程神器！ AI云极【AI智能系列】pycharm 人工智能 ide deepseek
在AI赋能编程的时代，如何让AI辅助写代码，提升开发效率？DeepSeek作为一款开源、强大、免费的AI编程助手，结合PyCharm，能够大幅提升Python编程体验。今天，我们就来详细讲解如何在PyCharm中接入DeepSeek，无论你想使用本地部署的DeepSeek，还是官方API版本，都能轻松实现！为什么选择DeepSeek+PyCharm？DeepSeekR1采用6710亿参数的MoE（
Python3.5源码分析-sys模块及site模块导入小屋子大侠 python Python分析 python源码
Python3源码分析本文环境python3.5.2。参考书籍>python官网Python3的sys模块初始化根据分析完成builtins初始化后，继续分析sys模块的初始化，继续分析_Py_InitializeEx_Private函数的执行，void_Py_InitializeEx_Private(intinstall_sigs,intinstall_importlib){...sysmod=
RealtimeSTT：实时语音转文本的开源神器，轻松实现高效语音处理 AI云极【开源系列】语音识别开源
在语音技术飞速发展的时代，实时语音转文本（Speech-to-Text，简称STT）技术已逐渐成为语音助手、在线会议记录、字幕生成等应用的核心功能。今天要为大家推荐的是一款开源的实时语音转文本工具——RealtimeSTT，它功能强大且易于集成，为开发者提供了快速构建实时语音处理应用的能力。项目地址：GitHub-RealtimeSTT一、什么是RealtimeSTT？RealtimeSTT是一款
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
centos操作系统安装R包单细胞拟时序分析CytoTRACE2 探序基因 centos linux 运维
探序基因肿瘤研究院整理作者操作系统为centosstream8，R版本为4.3.3devtools::install_github("digitalcytometry/cytotrace2",subdir="cytotrace2_r")中途出现错误：*installing*source*package‘RcppGSL’...**成功将‘RcppGSL’程序包解包并MD5和检查**usingstag
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
TCP 握手数据包分析 inquisiter tcp/ip 网络 linux
一、客户端数据分析：spu@spu:~/code/pcap$tcpdump-rclient_all.pcap-Xreadingfromfileclient_all.pcap,link-typeEN10MB(Ethernet)17:58:56.346748IP192.168.1.178.55814>192.168.1.117.socks:Flags[S],seq2615205588,win64240
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl