pythob数据分析之函数

1.numpy

1.1 介绍

Numpy:Numerical python的简称。
Numpy系统是python的一种开源的数值计算框架，这种工具可用来存储和处理大型矩阵，相当于python边成一种免费的更强大的MatLab系统

1.2 安装

pip install numpy
官方文档：
https://numpy.org/doc/stable/user/quickstart.html

1.3 具体使用

import numpy as np
# 1. 基本用法
# 创建数组array
# 一维数组
data1 = [1, 2, 8, 6]
data1_arr = np.array(data1)
print(data1_arr.ndim)
print(data1_arr.itemsize)
print(data1_arr)  # [1 2 8 6]
print(type(data1_arr))  # 
 
# 二维数组
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
data2_arr = np.array(data2)
print(data2_arr)
# 数组维度
print(data2_arr.ndim)
# 一个一维数组的元素个数
print(data2_arr.itemsize)
# 数组中的所有元素个数
print(data2_arr.size)
"""
[[1 2 3 4]
 [5 6 7 8]]
"""
 
# dtype数据类型
print(data2_arr.dtype)  # int32
# shape属性
print(data2_arr.shape)  # (2, 4):2行4列的数组
 
# 指定数据类型创建数组
arr3 = np.array(data2, dtype=np.int64)
print(arr3.dtype)  # int64
 
# 创建浮点类型数组
data4 = [6, 1.5, 8, 9.6]
data4_arr = np.array(data4)
print(data4_arr.dtype)  # float64
 
# 创建复数数组
c = np.array([ [1, 0 + 2j], [3, 1 + 4j] ], dtype=complex)
print(c)
# 转换数据类型
arr5 = data4_arr.astype(np.int64)
print(arr5)  # [6 1 8 9]
print(arr5.dtype)  # int64
 
# ones生成全为1的数组
arr6 = np.ones(10)
print(arr6)  # [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
print(np.ones((4, 5)))
"""
[[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]
"""
# zeros生成全为0的数组
arr7 = np.zeros(10) 
print(arr7)  # [0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
print(np.zeros((2, 3)))
"""
[[0. 0. 0.]
 [0. 0. 0.]]
"""
 
# 数组与标量之间的运算
# 对数组元素进行运算
# 特性：大小相等的数组之间的任何运算都会应用到元素级
# 使得我们不用编写循环即可对数组中的元素执行批量运算
 
nd = np.array([1, 2, 3, 4])
print(nd * 2)  # [2 4 6 8]
print(nd * nd)  # [ 1  4  9 16]
print(nd ** 2)  # [ 1  4  9 16]
print(nd + 1)  # [2 3 4 5]
print(nd - 1)  # [0 1 2 3]
print(nd / 2)  # [0.5 1.  1.5 2. ]
print(nd + nd)  # [2 4 6 8]
# 取倒数
print(1 / nd)  # [1.         0.5        0.33333333 0.25      ]
 
# 2. 基本的索引和切片
# arage: 相当于range函数的数组版
print(np.arange(5))  # [0 1 2 3 4]
nd1 = np.arange(1, 20, 2) 
print(nd1)  # [ 1  3  5  7  9 11 13 15 17 19]
# 通过索引获取元素
# 一维
print(nd1[1])  # 3
print(nd1[2:5])  # [5 7 9]
# 二维
nd2 = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])
print(nd2[1, 1])  # 6,第一行，第一列 （从0开始）
print(nd2[1])  # [5,6,7,8]
print(nd2[:1])  # [[1 2 3 4]]
# 通过索引赋值
# 一维
nd1[2:5] = 10
print(nd1)  # [ 1  3 10 10 10 11 13 15 17 19]
# 多维
nd2[1] = 10
print(nd2)
"""
[[ 1  2  3  4]
 [10 10 10 10]]
"""
nd2[0][1:3] = 5
print(nd2)
"""
[[ 1  5  5  4]
 [10 10 10 10]]
"""
# 3. 花式索引
# 指的是利用整数数据进行索引
# reshape
nd = np.arange(12)
print(nd)  # [ 0  1  2  3  4  5  6  7  8  9 10 11]
nd1 = np.reshape(nd, (3, 4))  # 将一维数据变为二维数组：3行4列
print(nd1)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
#ravel：恢复一维数组
print(123456)
print(nd1.ravel())  #
#转置矩阵
print(nd1.T)
"""
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]
"""
 
# 选取特定的行子集    #花式索引，传入一个数组进行索引
print(nd1[[0, 2]])  # 得到第一行和第三行
"""
[[ 0  1  2  3]
 [ 8  9 10 11]]
"""
print(nd1[[0, 2][1]])  # [ 8  9 10 11]
 
# 选取多行，多列交叉处元素(类比坐标)
print(nd1[[0, 2, 1], [1, 1, 2]])  # [1 9 6]
"""
(0,1)---1
(2,1)---9
(1,2)---6
"""
# 选取矩形区域的两种方法
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 1.
print(nd1[[0, 1]][:, [1, 2]])
"""
[[1 2]
 [5 6]]
"""
# 2. np.ix_
print(nd1[np.ix_([0, 1], [1, 2])])
"""
[[1 2]
 [5 6]]
"""
 
# 4.通用函数
# nfunc(universal functions)是一种对ndarray中的数据执行元素级别运算的函数，如sqrt,exp
# sqrt开根号
nd = np.arange(9)
nd1 = nd ** 2
print(nd1)  # [ 0  1  4  9 16 25 36 49 64]
print(np.sqrt(nd1))  # [0. 1. 2. 3. 4. 5. 6. 7. 8.]

#exp:自然常数e为底的指数函数
print(np.exp(np.array([1,2])))  #[2.71828183 7.3890561 ]

# add:相加
a = np.arange(3)  # 0,1,2
b = np.array([1, -1, 2])
c = np.add(a, b)
print(c)  # [1 0 4]
 
# maximum:比较对应元素,取最大值
print(np.maximum(a, b))  # [1 1 2]


#vstack:按照垂直方向堆栈数组
a = np.array([[0,1],[2,3]])
b = np.array([[4,5],[6,7]])
print(np.vstack((a,b)))
"""
[[0 1]
 [2 3]
 [4 5]
 [6 7]]
"""
#hstack：按照水平方向堆栈数组
print(np.hstack((a,b)))
"""
[[0 1 4 5]
 [2 3 6 7]]
"""
 
# 5.常用的数学和统计方法
# 一维
# 生成随机数组
nd = np.random.randn(9)
print(nd)  # [ 0.57073301 -0.69598833 -0.20702626 -0.86582638 -0.09858326  0.08781526 0.25506694  1.58026149  0.35448699]
# max最大值
print(np.max(nd))  # 1.5802614926823562
# 最小值
print(np.min(nd))  # -1.4584447066232877
# 求均值
print(np.mean(nd))
# 求和
print(np.sum(nd))
# 排序
print(np.sort(nd))
 
# 二维
# nd = np.random.randn(5,3)
# print(nd)
arr = np.array([[1, 5, 0, 3], [5, 8, 12, 9], [0, 0, -9, 55]])
print(np.max(arr))  # 55
print(np.sort(arr))  # 每行按照升序排列
"""
[[ 0  1  3  5]
 [ 5  8  9 12]
 [-9  0  0 55]]
"""
print(np.sort(arr, axis=0))  # 按照列排序
"""
[[ 0  0 -9  3]
 [ 1  5  0  9]
 [ 5  8 12 55]]
"""
 
# linspace等分区间
arr = np.linspace(0, 10, 2)
print(arr)  # [ 0. 10.]
arr = np.linspace(0, 10, 3)
print(arr)  # [ 0.  5. 10.]
# 生成0~10之间均匀分布的11个数
arr = np.linspace(0, 10, 11)
print(arr)  # [ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
 
# 计算
print("***")
a = np.arange(1,25, 2).reshape(3,4)
c = np.arange(5,17).reshape(3,4)
b = a > 4
print(b)
"""
[[False False False False]
 [False  True  True  True]
 [ True  True  True  True]]
 """
#所有超过4的元素都改为0
a[b] = 0
print(a)
 
#对应元素比较
print(a>c)
"""
[[False False False False]
 [False  True  True  True]
 [ True  True  True  True]]
"""
# 线性代数
# 矩阵乘法 dot
a = np.array([[1, 2, 3], [4, 5, 6]])  # 2*3
print(a)
"""
[[1 2 3]
 [4 5 6]]
"""
b = np.array([[0, 1], [2, 3], [-1, 6]])  # 3*2
print(b)
"""
[[ 0  1]
 [ 2  3]
 [-1  6]]
"""
print(a.dot(b))
"""
[[ 1 25]
 [ 4 55]]
"""
d1 = 1 * 0 + 2 * 2 + 3 * -1
d2 = 1 * 1 + 2 * 3 + 3 * 6
d3 = 4 * 0 + 5 * 2 + 6 * -1
d4 = 4 * 1 + 5 * 3 + 6 * 6
print(d1)
print()
 
# 矩阵求逆:inv
from numpy.linalg import inv
a = np.array([[4, 2], [3, 1]])  # 2*3
print(a)
"""
[[1 2 3]
 [4 5 6]]
"""
b = inv(a)
print(b)
"""
[[-0.5  1. ]
 [ 1.5 -2. ]]
"""
 
# cumsum:累计求和
b = np.arange(12).reshape(3,4)
print(b.cumsum(1))  #各行累计合计
"""
[[ 0  1  3  6]
 [ 4  9 15 22]
 [ 8 17 27 38]]
"""
print(b.cumsum(0))  #各列求和
"""
[[ 0  1  2  3]
 [ 4  6  8 10]
 [12 15 18 21]]
 """
# 7.随机数的生成
from numpy import random
# normal
arr = random.normal(size=(4, 4))
print(arr)
"""
[[-0.6731776  -0.77674242  0.15674769  0.65875012]
 [ 0.47656572  0.7074826  -0.59584356 -0.10902432]
 [-0.18324892 -0.93819386 -0.16716246  1.84150379]
 [-1.53836002  0.95684367  1.44417437 -2.43975145]]
"""
# randint给帝国上下限范围内的随机选取整数
arr = random.randint(0, 8)
print(arr)

2. pandas

import numpy as np
import pandas as pd
from pandas import Series

#pandas数据结构
#创建Series序列
s1 = Series([4,7,-5,3])
print(s1)   #前面是索引，后面为值
"""
0    4
1    7
2   -5
3    3
dtype: int64
"""
#获取index
print(s1.index)     #RangeIndex(start=0, stop=4, step=1)

#获取values
print(s1.values)    #[ 4  7 -5  3]

#指定index
s2 = Series([4,7,-5,3], index=["3月1日","3月2日","3月3日","3月4日"])
print(s2)
"""
3月1日    4
3月2日    7
3月3日   -5
3月4日    3
dtype: int64
"""
#通过索引获取值
print(s2["3月2日"])   #7

#通过条件筛选
print(s2[s2>0])
"""
3月1日    4
3月2日    7
3月4日    3
dtype: int64
"""

#in
print("3月2日" in s2) #True

#通过字典创建Series
dict1 = {
     "user1":4,
         "user2":7,
         "user3":-5,
         "user4":3}
s3 = Series(dict1)
print(s3)
"""
user1    4
user2    7
user3   -5
user4    3
dtype: int64
"""

#DataFrame 数据框架
from pandas import DataFrame
#创建数据框
positions = ["产品经理","数据分析师","UI","产品经理"]
companys = ["百度","三星","腾讯","华为"]

df = DataFrame([positions,companys])
print(df)
"""
    0      1       2         3
0  产品经理      数据分析师      UI      产品经理
1    百度         三星                  腾讯                华为
"""
#转置
job_info = DataFrame([positions,companys]).T
print(job_info)
"""
    0       1
0   产品经理          百度
1  数据分析师      三星
2     UI    腾讯
3   产品经理          华 为
"""

# 设置列名
job_info.columns = ["职位","公司"]
print(job_info)

#设置序号
job_info.index = ["a","b","c","d"]
print(job_info)

#重置index
job_info.reset_index(drop=True)
print(job_info)

#展示数据条数
print(job_info.head(2))

#tail显示后面几条数据
print(job_info.tail(2))

#获取某列的值
print(job_info["职位"])
print(job_info.职位)

#获取某行的值(索引名)
print(job_info.loc["c"])
#获取某行的值(索引序号)
print(job_info.iloc[2])

#返回固定频率的日期索引
dates = pd.date_range('20201101', periods=6)
print(dates)
print(dates[0])

df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
"""
                   A         B         C         D
2020-11-01  0.511831  1.902508 -0.601631 -1.275379
2020-11-02  0.081817 -0.734119  1.201803  0.148207
2020-11-03 -0.746071  0.550262 -0.035730 -1.275730
2020-11-04  2.014247  0.066116  0.581703  0.361273
2020-11-05  0.131509  0.122587  1.049349 -0.761779
2020-11-06  0.395198 -0.587009  0.216365 -0.853146
"""

#常用方法
data = np.arange(16).reshape((4,4))
print(data)
df = DataFrame(data=data,index=['a','b','c','d'], columns=list('ABCD'))
print(df)
"""
    A   B   C   D
a   0   1   2   3
b   4   5   6   7
c   8   9  10  11
d  12  13  14  15
"""
#删除指定轴上的项
df1 = df.drop('b')  #删除索引是b的行
print(df1)
"""
    A   B   C   D
a   0   1   2   3
c   8   9  10  11
d  12  13  14  15
"""
df1 = df.drop('C', axis=1)  #删除索引是C的列,axis=1b=表示按列执行
print(df1)
"""
    A   B   D
a   0   1   3
b   4   5   7
c   8   9  11
d  12  13  15
"""
#查找列D，值为11的行内容
print(df[df["D"]==11])
"""
   A  B   C   D
c  8  9  10  11
"""
print(df[df>5])
"""
      A     B     C     D
a   NaN   NaN   NaN   NaN
b   NaN   NaN   6.0   7.0
c   8.0   9.0  10.0  11.0
d  12.0  13.0  14.0  15.0
"""
df['E'] = [2,5,9,45]    #新增或修改列
print(df)
"""
    A   B   C   D   E
a   0   1   2   3   2
b   4   5   6   7   5
c   8   9  10  11   9
d  12  13  14  15  45
"""
#删除没有数值的数据NaN
print("****************")
df2 = df[df>9]
"""
      A     B     C     D     E
a   NaN   NaN   NaN   NaN   NaN
b   NaN   NaN   NaN   NaN   NaN
c   NaN   NaN  10.0  11.0   NaN
d  12.0  13.0  14.0  15.0  45.0
"""
print(df2.dropna(how='any'))
"""
      A     B     C     D     E
d  12.0  13.0  14.0  15.0  45.0
"""
#填充缺失的数据
print(df2.fillna(value=13))
"""
      A     B     C     D     E
a  13.0  13.0  13.0  13.0  13.0
b  13.0  13.0  13.0  13.0  13.0
c  13.0  13.0  10.0  11.0  13.0
d  12.0  13.0  14.0  15.0  45.0
"""

#判断数值是否为NaN
print(pd.isna(df2))
"""
       A      B      C      D      E
a   True   True   True   True   True
b   True   True   True   True   True
c   True   True  False  False   True
d  False  False  False  False  False
"""
#唯一值，unique
obj = Series([1,2,2,5,6,3,5])
print(obj.unique())     #[1 2 5 6 3]

#频率统计。value_counts
print(obj.value_counts())   #按照品=频率降序排列，如果不做排序，obj.value_counts(sort=False)
"""
5    2
2    2
6    1
3    1
1    1
dtype: int64
"""

#获取指定内容
print(df["A"])
"""
a     0
b     4
c     8
d    12
Name: A, dtype: int32
"""
#根据索引序号切片获取行
print(df[0:3])
"""
   A  B   C   D
a  0  1   2   3
b  4  5   6   7
c  8  9  10  11
"""

#根据索引切片获取行
print(df["b":"c"])
"""
   A  B   C   D
b  4  5   6   7
c  8  9  10  11
"""


#常用的数学和统计函数
#describe:一些数据的统计量
print(df.describe())
"""
               A          B          C          D
count   4.000000   4.000000   4.000000   4.000000
mean    6.000000   7.000000   8.000000   9.000000
std     5.163978   5.163978   5.163978   5.163978
min     0.000000   1.000000   2.000000   3.000000
25%     3.000000   4.000000   5.000000   6.000000
50%     6.000000   7.000000   8.000000   9.000000
75%     9.000000  10.000000  11.000000  12.000000
max    12.000000  13.000000  14.000000  15.000000
"""
#求和，sum,每列求和
print(df.sum())     #添加参数axis=1，每列求和
"""
A    24
B    28
C    32
D    36
dtype: int64
"""
#均值，mean
print(df.mean())
"""
A    6.0
B    7.0
C    8.0
D    9.0
dtype: float64
"""
#累计求和, cumsum
print(df.cumsum())  #每一列累计求和
"""
    A   B   C   D
a   0   1   2   3
b   4   6   8  10
c  12  15  18  21
d  24  28  32  36
"""

#最值
print(df.max()) #每列最大值
"""
A    12
B    13
C    14
D    15
dtype: int32
"""
#非数值的信息描述
positions = ["产品经理","数据分析师","UI","产品经理"]
companys = ["百度","三星","腾讯","华为"]

df = DataFrame([positions,companys])
print(df.describe())
"""
           0      1   2     3
count      2      2   2     2
unique     2      2   2     2
top     产品经理  数据分析师  UI  产品经理
freq       1      1   1     1        #频率
"""
#to_numpy,将Dataframe转换为一个小阵列。
data = df.to_numpy()
print(data)     
"""
[['产品经理' '数据分析师' 'UI' '产品经理']
 ['百度' '三星' '腾讯' '华为']]
"""

#按照某列排序
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
"""                A         B         C         D
2020-11-01  0.511831  1.902508 -0.601631 -1.275379
2020-11-02  0.081817 -0.734119  1.201803  0.148207
2020-11-03 -0.746071  0.550262 -0.035730 -1.275730
2020-11-04  2.014247  0.066116  0.581703  0.361273
2020-11-05  0.131509  0.122587  1.049349 -0.761779
2020-11-06  0.395198 -0.587009  0.216365 -0.853146
"""
print(df.sort_values(by='B'))
"""
                   A         B         C         D
2020-11-02 -0.299943 -0.627584  0.417651 -0.006916
2020-11-06 -0.583363 -0.056184  1.941390  1.350911
2020-11-04 -0.486949  0.160367  1.178660 -0.572378
2020-11-03  0.449339  0.772650 -0.106306 -0.964246
2020-11-05 -1.358415  1.033476 -0.218945 -1.207231
2020-11-01  1.818069  1.197937  1.800319 -0.017046
"""
print(df.sort_index(axis=1, ascending=False))


#合并
df1 = DataFrame(np.random.randn(2, 4))
df2 = DataFrame(np.random.randn(3, 4))
print(pd.merge(df1,df2))

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Numpy 学习沐辰老爹
创建指定数值的数组a=np.full((3,5),np.pi)高级通用函数的特性#1.指定输出x=np.arange(10)y=np.empty(10)np.multiply(x,10,out=y)#2.聚合x=np.arange(10)x_sum=np.add.reduce(x)#类似的可用于logical_and等np.logical_and([condition1,condition2,co
pythonpandas函数详解_Python pandas常用函数详解 Senvn
本文研究的主要是pandas常用函数，具体介绍如下。1import语句importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportdatetimeimportre2文件读取df=pd.read_csv(path='file.csv')参数：header=None用默认列名，0，1，2，3...names=['A','B','C'
python画出分子化学空间分布（UMAP） Sakaiay python
利用umap画出分子化学空间分布图安装pipinstallumap-learn下面是用一个数据集举的例子importtorchimportumapimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfromsklearn.manifoldimportTSNEfromrdkit.Chemimport
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
python绘制等高线和等值面初步 bcbobo21cn 图形学和3D python 开发语言 Matplotlib NumPy 等高线
importmatplotlib.pyplotaspltimportnumpyasnpx=np.linspace(-5,6,210)y=np.linspace(-5,6,210)x,y=np.meshgrid(x,y)z=(1-x/2+x**5+y**4)*np.exp(-x**2-y**2)plt.contour(x,y,z,levels=9,colors='black')plt.show()i
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
【Python】np.hstack()和np.vstack函数详解和示例木彳 Python学习和使用过程积累 python 开发语言
本文通过函数原理和运行示例，对np.hstack()和np.vstack函数进行详解，以帮助大家理解和使用。更多Numpy函数详解和示例，可参考【Python】Numpy库近50个常用函数详解和示例，可作为工具手册使用目录np.hstack()函数解析运行示例一维数组二维数组np.vstack()函数解析运行示例np.hstack()np.hstack()是NumPy库中的一个函数，用于将两个或更
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

pythob数据分析之函数

1.numpy

1.1 介绍

1.2 安装

1.3 具体使用

2. pandas

你可能感兴趣的:(数据分析,numpy)