violette_lx

Pandas入门——Series和DataFrame的创建、索引、基本操作

Pandas

Pandas基于Numpy构建，是数据分析的核心模块，可直接读取数据进行处理，兼容各种数据库，支持各种分析算法。因为之前了解到Python安装Pandas很慢，所以直接下载了Anaconda，感觉自己很机智哈哈哈！
因为各种镜像源都挂了，下载真的好慢，所以分享一个Anaconda3-5.1.0-Windows-x86_64网盘链接：https://pan.baidu.com/s/1Pj6Kmk6Tur3iMXLxxcRGJA
Series和DataFrame是Pandas中最主要的两种数据结构，个人抽象理解为带索引的一维数组和带索引的表格。

Series

Series类似一维数组，由带索引index的一组values构成，values可以是任何数据类型。可以将Series理解为带索引的ndarray，也可以将Series理解为有顺序的dict字典。
s.index可以查看索引，是pandas中所有对象都具有的属性，返回索引的生成器
s.values可以查看值，返回numpy.ndarray，默认数据类型是float64
name是数据表名称属性，可以看作数据表的表名

import numpy as np
import pandas as pd
ar=np.random.rand(10)
s=pd.Series(ar,name='Series s')
print(ar,type(ar))
print(s,type(s))
print('------------')
print(s.index)# index可以看做标签的生成器，所有pandas中的数据结构都有index
print(list(s.index),type(s.index))
print(s.values,type(s.values))#values实际上是numpy.ndarray

生成Series

公式
pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
index默认从0编号，可以自定义list，index可以不唯一，但尽量唯一
dtype与data的数据类型相同，一般默认float64
创建
Series可以通过字典、一维数组、标量来创建。
字典创建时，字典的key是Series的index，字典的values是Series的values。
一维数组创建时，自定义index必须和values长度相同。
标量创建时，index长度是values长度。

#用字典创建
dic={'a':1,'b':2,'c':3}
s=pd.Series(dic)
print(s)
#用一维数组创建
ar=np.random.rand(5)*100
s=pd.Series(ar,index=list('abcde'))
print(s)
#标量创建
s=pd.Series(100,index=range(4))
print(s)

Series索引

和ndarray，list类似，可以使用位置下标、标签、切片、bool索引。
需要注意多个标签需要用s[[‘a’,‘b’]]，索引顺序不一定要按照index顺序

# 位置下标
s=pd.Series(np.random.rand(5)*10,index=list('abcde'))
print(s)
print(s[0])#位置下标从0开始
print(s[3],type(s[3]),s[3].dtype)
# 不能被逆序排列print(s[-1])

#标签索引
print(s['a'])
print(s[['c','a']])#多个标签需要用[[]]表示列表，索引顺序不一定要按照series的顺序

#切片
print(s[1:3])#位置索引左闭右开，不含右侧边际
print(s['b':'d'])#index索引闭区间
print(s[:2])

#添加空值
# (None代表空值，NaN代表有问题的数值，两个都会识别为空值)
print('---------')
s['a']=None
print(s)
s[2]=np.nan
print(s)
#.isnull() 空值为Ture/ .notnull()非空为True 
print(s.isnull())
print(s.notnull())

#bool型
print(s>3)
print(s[s>1])
print(s[s.isnull()])
print(s[s.notnull()])

Series基本操作

查看数据头尾
s.head() 查看数据头，默认查看5行，可赋值
s.tail(3) 查看数据尾，默认查看5行，可赋值
依据索引排序 s.reindex()
保留已有索引及对应value，增加不存在索引及对应values为空值NaN

# reindex 依据索引重新排序，而非重命名索引index，也增加index数目
s=pd.Series(np.random.rand(5))
print(s)
s1=s.reindex([0,2,1,'a','b'])#保留数据已有索引，不存在索引返回空值NaN
print(s1)
s2=s.reindex([0,2,1,'a','b','c'],fill_value=1)#保留数据已有索引，不存在索引返回fill_value
print(s2)

#将series作为参数调用Series无法改变原有对象索引
s3=pd.Series(s,index=list('abcde'))
print(s3)

#改变原有对象的索引
s.index=['a','b','c','d','e']
print(s)
'''
0    0.996371
1    0.274122
2    0.688167
3    0.813712
4    0.780905
dtype: float64
0    0.996371
2    0.688167
1    0.274122
a         NaN
b         NaN
dtype: float64
0    0.996371
2    0.688167
1    0.274122
a    1.000000
b    1.000000
c    1.000000
dtype: float64
a   NaN
b   NaN
c   NaN
d   NaN
e   NaN
dtype: float64
a    0.996371
b    0.274122
c    0.688167
d    0.813712
e    0.780905
dtype: float64
'''

对齐
只保留两个Series中都存在的index对应的数据，其余填充NaN

s1=pd.Series(np.random.rand(3),index=['a','b','c'])
s2=pd.Series(np.random.rand(3),index=['b','c','d'])
print(s1+s2)#缺失值将显示Nan
'''
a         NaN
b    0.674737
c    1.297640
d         NaN
'''

删除 s.drop
drop默认inplace=False生成新对象，若inplace=True则更改原有对象
drop的参数是index的索引名
多个参数需要增加[]，作为list参数

s=pd.Series(np.random.rand(5),index=[0,1,2,'a','b'])
print(s)
s1=s.drop(0)#drop默认inplace=False生成新对象，若inplace=True则更改原有对象
s2=s.drop([0,'a','b'])#drop多个元素需要列表作为参数
print(s1)
print(s2)
'''
dtype: float64
0    0.525237
1    0.082962
2    0.826343
a    0.644302
b    0.942987
dtype: float64
1    0.082962
2    0.826343
a    0.644302
b    0.942987
dtype: float64
1    0.082962
2    0.826343
'''

添加和修改 s.append

s1=pd.Series(np.random.rand(5))
print(s1)
s1[4]=5 #如果series中存在该索引则更改对应values 
print(s1)
s1[[1,5]]=0#如果series中不存在该索引则增加索引及value
print(s1)
s2=pd.Series({'a':1,'b':2,'c':3})
print(s1.append(s2))#append可以增加一个series，指向新数组
print(s1)

运算
将计算结果返回新对象，不改变原有series

s=pd.Series([1,2,3,4,5])
print(s)
print(s+2)
print(s*2)
print(s/2)#除
print(s**2)# 幂

DataFrame

Dataframe是一个表格型的数据结构，包含一组有序的列，每一列的数据类型可以不同，可以是数值、字符串、布尔值等。
Dataframe中index是索引，columns是列标签（key），values是值。

df = pd.DataFrame({'name':['Alice','Bob','Cathy'],
                   'gender':['female','male','female'],
                   'score':[40,70,80],
                   'valid':[False,True,True]})
print(df)
print(type(df))
print('index\n',df.index,type(df.index),list(df.index))#RangeIndex
print('columns\n',df.columns,type(df.columns))#Index
print('values\n',df.values,type(df.values))#ndarray
'''
  name  gender  score  valid
0  Alice  female     40  False
1    Bob    male     70   True
2  Cathy  female     80   True

index
 RangeIndex(start=0, stop=3, step=1)  [0, 1, 2]
columns
 Index(['name', 'gender', 'score', 'valid'], dtype='object') 
values
 [['Alice' 'female' 40 False]
 ['Bob' 'male' 70 True]
 ['Cathy' 'female' 80 True]] 
'''

创建

DataFrame创建主要通过dict和二维数组，也可以通过由字典组成的列表或由字典组成的字典。

dict创建DataFrame

当使用dict组成DataFrame时，dict的key对应dataframe的columns，具体可以分为以下两种情况：

dict的values是list或者np.ndarray
1、dict的key对应dataframe的columns
2、dict不同key对应各个value的长度相同
3、columns不能改变，可以增删，新标签值为NaN
4、index可以被改变但不能增减，必须与dict中value长度相同。
dict的value是Series
1、dict的key对应dataframe的columns，key对应的Series的index是生成dataframe的index
2、dict不同key对应Series的长度不必相同
3、columns不能改变，可以增删，新标签对应NaN
4、当dict中的Series标签相同且长度相同时，可以声明时赋值index，当Series长度不同，标签不同，生成datafram可以看作并集，没有对应index标签的values被赋值NaN。
5、有标签的Series的index可以增删，新标签对应NaN。

#dict的values是list
dict1={'a':[1,2,3,4],'b':[2,3,4,5],'c':[3,4,5,6]}#字典中值必须相同长度
print(data1)
print(pd.DataFrame(dict1))
print(pd.DataFrame(dict1,index=['aaa','bbb','ccc','ddd']))#index必须与行数相同
print(pd.DataFrame(dict1,columns=['a','b','d']))#colums参数选择部分列,如果有不存在的参数时则填充NaN

#dict的values是np.ndarray
dict2={'x':np.random.rand(3),'y':np.random.rand(3)}
print(dict2)
print(pd.DataFrame(dict2))
'''
{'a': [1, 2, 3, 4], 'b': [2, 3, 4, 5], 'c': [3, 4, 5, 6]}
   a  b  c
0  1  2  3
1  2  3  4
2  3  4  5
3  4  5  6
     a  b  c
aaa  1  2  3
bbb  2  3  4
ccc  3  4  5
ddd  4  5  6
   a  b    d
0  1  2  NaN
1  2  3  NaN
2  3  4  NaN
3  4  5  NaN
{'x': array([0.64433399, 0.55618886, 0.74822528]), 'y': array([0.41651619, 0.66279534, 0.37896431])}
          x         y
0  0.644334  0.416516
1  0.556189  0.662795
2  0.748225  0.378964
'''

#dict的value是Series，不同key对应的Series的长度不必一样

#两个Series的标签相同且长度相同，无自定义index则默认从0开始编号
dict1={'X':pd.Series(np.random.rand(4)*10),
      'Y':pd.Series(np.random.rand(4)*10)}
print(pd.DataFrame(dict1))

#Series中如果自定义index，则生成的dataframe的index也变成series中自定义
dict2={'X':pd.Series(np.random.rand(4)*10,index=list('abcd')),
      'Y':pd.Series(np.random.rand(4)*10,index=list('abcd'))}
print(pd.DataFrame(dict2))

#两个Series长度不同，标签不同，生成datafram可以看作并集
#没有对应index标签的values被赋值NaN
dict3={'X':pd.Series(np.random.rand(4),index=list('abcd')),
      'Y':pd.Series(np.random.rand(3),index=list('abe'))}
print(pd.DataFrame(dict3))
print(pd.DataFrame(dict3,index=['a','b',0]))
print(pd.DataFrame(dict3,columns=['X']))
'''
X         Y
0  1.346173  2.366167
1  0.507209  5.003882
2  3.113913  5.879678
3  8.061057  9.573074
          X         Y
a  0.718481  7.559523
b  3.376450  8.906252
c  8.825367  3.104184
d  4.299418  3.715730
          X         Y
a  0.610915  0.267013
b  0.993462  0.987552
c  0.793687       NaN
d  0.728292       NaN
e       NaN  0.228734
          X         Y
a  0.610915  0.267013
b  0.993462  0.987552
0       NaN       NaN
          X
a  0.610915
b  0.993462
c  0.793687
d  0.728292
'''

二维数组创建DataFrame

因为DataFrame可以被看做一个表格，二维数组创建方法最便于理解，即数组作为构造函数的data，为其添加行索引index和列索引columns。

ndarray的行对应dataframe的index，列对应columns
构造函数中index和columns应于ndarray的形状对应
index和columns可以通过赋值改变，但不能增删。

ar=np.random.rand(12).reshape(4,3)
#默认index和columns索引都从0排序
df1=pd.DataFrame(ar)
print(df1)
#index长度必须和二维数组行数相同，columns长度必须和二维数组列数相同
df2=pd.DataFrame(ar,
                index=['a','b','c','d'],
                columns=['x','y','z'])
print(df2)
'''
   0         1         2
0  0.256452  0.550808  0.619352
1  0.529326  0.734800  0.450460
2  0.392424  0.273264  0.928764
3  0.771616  0.772426  0.594913
          x         y         z
a  0.256452  0.550808  0.619352
b  0.529326  0.734800  0.450460
c  0.392424  0.273264  0.928764
d  0.771616  0.772426  0.594913
'''

其他

字典组成的字典
1、字典组成的字典，外层字典长度可不同
2、字典最外层的key对应dataframe的columns
3、字典内层的key对应dataframe的index
字典组成的列表
1、字典的长度可以不相同
2、字典dict的key是dataframe的columns
3、列表每一个元素（dict），是dataframe的一行数据

#字典组成的字典
data = {'Jack':{'math':90,'english':89,'art':78},
       'Marry':{'math':82,'english':95,'art':92},
       'Tom':{'math':78,'english':67}}
df1 = pd.DataFrame(data)
print(df1)
'''
 Jack  Marry   Tom
math       90     82  78.0
english    89     95  67.0
art        78     92   NaN
'''
#字典组成的列表
data = [{'a': [1,2], 'b': [2,3]}, {'a': 6, 'b': 7, 'c': 8}]
print(pd.DataFrame(data))
'''
   a       b    c
0  [1, 2]  [2, 3]  NaN
1       6       7  8.0’
'''

DataFrame 索引

将DataFrame理解为表格，每一行是一组数据，每一列是一个字段

直接索引

单个标签索引，多个标签索引，切片索引。
按columns选择列：df[‘a’]单独一列为Series，df[[‘a’,‘b’]]选择多列为dataframe。
按index索引名选择行df.loc[1:3]:单独选择一行为Series，选择多行为dataframe
按index位置坐标选择行df.iloc[0:3]:行标从0开始标号

# 直接索引选择列
df=pd.DataFrame(np.random.randint(1,100,size=(4,5)),columns=list('abcde'))
print(df)
#直接索引为选择列,不能增加新的列
print(df['a'],type(df['a']))
print(df[['a','b']],type(df[['a','b']]))
'''
  a   b   c   d   e
0  40  86  98  82  81
1  37  28  52  32  68
2  40  56  52  33  46
3  61  49  58  64  83
0    40
1    37
2    40
3    61
Name: a, dtype: int32 
    a   b
0  40  86
1  37  28
2  40  56
3  61  49 
'''
#选择行
#df.loc索引选择行，选择一行为series，多行为DataFrame
df=pd.DataFrame(np.random.randint(1,100,size=(4,5)),
                columns=list('abcde'),index=('AAA','BBB','CCC','DDD'))
print(df)
print(df.loc['AAA'])#单个标签索引
print(df.loc[['DDD','AAA']])#多个标签索引
print(df.loc['AAA':'CCC'])#切片索引

#df.iloc[]按照整数位置（0开始）选择行
print(df.iloc[0:3])
print(df.iloc[-1])
'''
 a   b   c   d   e
AAA  65  22  92  89  34
BBB  57  69  51  11  79
CCC  87  75  87   8  89
DDD  70  20  75  62  12
a    65
b    22
c    92
d    89
e    34
Name: AAA, dtype: int32
      a   b   c   d   e
DDD  70  20  75  62  12
AAA  65  22  92  89  34
      a   b   c   d   e
AAA  65  22  92  89  34
BBB  57  69  51  11  79
CCC  87  75  87   8  89
      a   b   c   d   e
AAA  65  22  92  89  34
BBB  57  69  51  11  79
CCC  87  75  87   8  89
a    70
b    20
c    75
d    62
e    12
Name: DDD, dtype: int32
'''

bool型索引

在进行单列判断的时候，不保留全部数据，结果只保留判断列中满足条件的对应行。
其他情况均返回所有数据，但False对应空值NaN。

#bool型索引
df=pd.DataFrame(np.random.randint(1,100,size=(3,4)),
                index=['x','y','z'],columns=list('abcd'))
print(df)
#所有元素
#结果保留所有元素，不满足条件显示NaN
print(df[df>50],'\n')#所有大于50

#单列判断(唯一不保留全部数据)
#结果只保留判断列中满足条件的对应行
mask1=df['a']>50
print(mask1)
print(df[mask1],'\n')

#多列判断
#结果保留所有元素，True显示元素，其余均为NaN
mask2=df[['a','b']]>30
print(mask2)
print(df[mask2],'\n')#单列判断，保留满足判断条件的对应行

#多行判断
mask4 = df.loc[['x','y']] < 50
print(mask4)
print(df[mask4]) 
'''
  a   b   c   d
x   6  39  76  81
y  13   2  80  35
z  61  88  17  43
      a     b     c     d
x   NaN   NaN  76.0  81.0
y   NaN   NaN  80.0   NaN
z  61.0  88.0   NaN   NaN 

x    False
y    False
z     True
Name: a, dtype: bool
    a   b   c   d
z  61  88  17  43 

       a      b
x  False   True
y  False  False
z   True   True
      a     b   c   d
x   NaN  39.0 NaN NaN
y   NaN   NaN NaN NaN
z  61.0  88.0 NaN NaN 

      a     b      c      d
x  True  True  False  False
y  True  True  False   True
      a     b   c     d
x   6.0  39.0 NaN   NaN
y  13.0   2.0 NaN  35.0
z   NaN   NaN NaN   NaN
'''

多重索引

bool型索引、行索引、列索引可以复合使用，先列索引后行索引。

df=pd.DataFrame(np.random.randint(1,100,size=(3,4)),
                index=['x','y','z'],columns=list('abcd'))
print(df)
print(df['a'].loc[['x','y']])
print(df[['b','c','d']].iloc[0:3])
print(df[df['a']>20].iloc[:2])
'''
  a   b   c   d
x  83  19  12  35
y  63  17  83  92
z  30  93  65  71
x    83
y    63
Name: a, dtype: int32
    b   c   d
x  19  12  35
y  17  83  92
z  93  65  71
    a   b   c   d
x  83  19  12  35
y  63  17  83  92
'''

DataFrame基本操作

查看数据
基本同Series，使用df.head()查看前五行，df.tail()查看末尾五行，df.T生成一个转置后的新对象。

df=pd.DataFrame(np.random.randint(1,100,size=(6,5)),
                columns=list('abcde'))
print(df)
print(df.T)#转置生成新对象
print(df.head())#head读取前5行，默认参数是5行
print(df.tail(2))#tail读取末尾2行

添加与修改
当使用新的行索引或列索引时，增加该行/列，可以通过使用标量或者使用list（长度相同）的方法。
而如果索引已存在，则对原油数据进行修改。

df=pd.DataFrame(np.random.randint(1,100,size=(3,4)),
                columns=list('abcd'))
print(df)
#增加行或列
df.loc[4]=20#使用标量增加行
df['e']=[10,20,30,40]#使用list增加列
print(df)
#赋值修改
df['a']=10
df['e'].loc[4]=0
print(df)
'''

   a   b   c   d
0  10  40  39  52
1  60   6  11  15
2   9  80  30  56
    a   b   c   d   e
0  10  40  39  52  10
1  60   6  11  15  20
2   9  80  30  56  30
4  20  20  20  20  40
    a   b   c   d   e
0  10  40  39  52  10
1  10   6  11  15  20
2  10  80  30  56  30
4  10  20  20  20   0
'''’

删除
del删除一列，drop根据参数删除行或列。
df.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=‘raise’)
axis=0，默认删除行，axis=1删除列
inplace=False，默认生成新对象，inplace=True则改变原有对象。

df=pd.DataFrame(np.random.randint(1,100,size=(3,4)),columns=list('abcd'))
print(df,'\n')
#删除列 del 
del df['a']
print(df,'\n')

#drop关键参数axis inplace
df2=df.drop(0)#默认删除行 默认创建新对象
print(df2)
print(df,'\n')
df3=df.drop('b',axis=1)#axis=1删除列，默认创建新对象
print(df3)
df4=df.drop('b',axis=1)#axis=1删除列，默认创建新对象
print(df4,'\n')
df.drop('b',axis=1,inplace=True)#inplace=True则改变原有对象
print(df)

对齐
两组数据不必形状相同，只保留索引相同位置的数据叠加，缺失填充NaN

df1 = pd.DataFrame(np.random.randn(3,4), columns=['A', 'B', 'C', 'D'])
df2 = pd.DataFrame(np.random.randn(4,5), columns=['A', 'B', 'C','D','E'])
print(df1 + df2)
''

          A         B         C         D   E
0 -0.606321  0.375047 -0.163161 -2.222533 NaN
1  1.654818 -0.061153 -0.729434  1.265396 NaN
2 -1.059547  1.270026  1.139287 -0.282398 NaN
3       NaN       NaN       NaN       NaN NaN
'''

排序
df.sort_values 按所选列的值排序，ascending=True默认升序，inplace=False默认生成新对象。
df.sort_index索引排序，默认升序，指向新对象。当索引为数值类则按大小排序，当索引为字母则按字母排序

#按值排序.sort_values，默认升序，指向新对象
df = pd.DataFrame(np.random.rand(3,4)*100, columns=['A', 'B', 'C', 'D'])
print(df)
#按照所选列，排序整个表格
print(df.sort_values(['A'],ascending=True))#升序
print(df)
df.sort_values(['A'],ascending=False,inplace=True)#降序
print(df)
#列中存在相同值的时候，可以多列排序

#索引排序.sort_index，默认升序，指向新对象
df=pd.DataFrame(np.random.rand(3,4)*100,
               index=[2,3,1])
print(df)
print(df.sort_index())#按index升序排列，如果是字母则按字母排序
df.sort_index(inplace=True,ascending=False)
print(df)

Python虚拟环境和包管理，到底怎么选？ Python资讯站 python 开发语言 python学习编程学习虚拟环境搭建虚拟环境包包管理
包含编程资料、学习路线图、源代码、软件安装包等！【[点击这里]】！在Python开发中，虚拟环境和包管理工具是必不可少的利器。它们帮助我们隔离项目依赖，避免版本冲突，提高开发效率。然而，面对众多工具如"venv"、“virtualenv”、“conda”、“pipenv”、“poetry"和"uv”，许多开发者常常感到困惑：到底该选择哪一个？本文将从优势、使用方法和适用场景等方面，深度对比这些工具
Python包管理不再头疼：uv工具快速上手马岛 python uv 开发语言
Python包管理生态中存在多种工具，如pip、pip-tools、poetry、conda等，各自具备一定功能。而今天介绍的uv是Astral公司推出的一款基于Rust编写的Python包管理工具，旨在成为“Python的Cargo”。它提供了快速、可靠且易用的包管理体验，在性能、兼容性和功能上都有出色表现，为Python项目的开发和管理带来了新的选择。1.为什么用uv与其他Python中的包管
Java对比Python，谁才是编程王者？ Java学研大本营 python java 开发语言
Python和Java是目前编程最受欢迎的两种语言，本文从多角度比较二者的相同点和差异，帮助你更深入地了解两种语言的特点，最终能根据你自身的需求来进行选择。微信搜索关注《Java学研大本营》Python和Java是当今世界上最流行的两种编程语言。两者都被广泛用于各种行业和应用，从网络开发到机器学习再到数据分析。但是这两种语言哪个更好呢？在这本中，我们将多方面比较Python和Java，探索二者的历
利用python 执行统计模型: 渔好学 python
利用python执行统计模型:http://www.statsmodels.org/stable/index.html
Python广东广州二手房源爬虫数据可视化分析大屏全屏系统开题报告 2401_84688466 程序员信息可视化 python 爬虫
如果需要联系我，可以在CSDN网站查询黄菊华老师在文章末尾可以获取联系方式Python****广东广州二手房源爬虫数据可视化分析大屏全屏系统开题报告XXXX大学**/学校/**学院毕业论文（设计）开题报告书学生姓名所属学院学号专业班级论文（设计）题目Python广东广州二手房源爬虫数据可视化分析大屏全屏系统设计与实现指导教师姓名（职称）开题日期选题依据：1.研究背景与意义；2.国内外研究（应用与发
Python江苏南京二手房源爬虫数据可视化分析大屏全屏系统开题报告 2401_84562041 程序员信息可视化 python 爬虫
Python****江苏南京二手房源爬虫数据可视化分析大屏全屏系统开题报告XXXX大学**/学校/**学院毕业论文（设计）开题报告书学生姓名所属学院学号专业班级论文（设计）题目Python江苏南京二手房源爬虫数据可视化分析大屏全屏系统设计与实现指导教师姓名（职称）开题日期选题依据：1.研究背景与意义；2.国内外研究（应用与发展）现状。1**：研究背景与意义**Python江苏南京二手房源爬虫数据可
python和java的本质区别,python和java有什么关系 2301_81900386 python 开发语言人工智能
本篇文章给大家谈谈python和java的本质区别，以及python和java有什么关系，希望对各位有所帮助，不要忘了收藏本站喔。一、主要区别：1.Python比Java简单，学习成本低，开发效率高2.Java运行效率高于Python，尤其是纯Python开发的程序，效率极低3.Java相关资料多，尤其是中文资料4.Java版本比较稳定，Python2和3不兼容导致大量类库失效5.Java开发偏向
Python多版本环境管理UV 坐吃山猪 Python python uv 开发语言
Python多版本环境管理UV1-参考网址Python虚拟环境UV管理工具-官网Python虚拟环境UV管理工具-快速开始pyproject.toml使用指导2-核心知识点1）python项目维护requirements.txt2）python机器学习环境Anaconda3）python轻量级环境管理uv4）uvx快速上手使用3-上手实操1-安装UV虚拟环境管理工具UV官网安装教程#Windows
数据结构 -- 字符串 _安晓数据结构数据结构
字符串串的定义串，即字符串（String）是由零个或多个字符组成的有限序列，一般记为S=‘a1a2a3a4’（n≥0）其中，S是串名，单引号括起来的是字符序列是串的值；ai可以是字母、数字或是其他字符；串中字符的个数n称为串的长度。n=0时的串称为空串（用∅表示）。例：（不同语言可能使用的边界符不同，Java、c等使用双引号（“”）Python等使用单引号（’‘））S="HelloWorld！"T
Python湖南长沙二手房源爬虫数据可视化分析大屏全屏系统开题报告黄菊华老师大数据库可视化二手房源数据可视化系统
博主介绍：《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，免费项目配有对应开发文档、开题报告、任务书、PPT、论文模版等项目都录了发布和功能操作演示视频；项目的界面和功能都可以定制，包安装运行！！！在文章末尾可以获取联系方式Python湖南长沙二手房源爬虫
Java与Python详细比对 -- Java与Python优缺点知之为 python 开发语言 java
系列文章-Java与PythonPython和Java都是比较流行的编程语言，它们各自有着独特的特性和应用场景。python用途最多的是脚本，java用途最多的是web。文章目录系列文章目录-Java与Python前言一、Java与Python整体区别二、Java与Python详细区别2.1语法结构方面2.2编程特性方面2.3语言执行及内存管理方面2.4多线程及网络编程方面2.5开发工具及相关功能
Development Problems Based On PyTorch woxiwangxuehaocpp pytorch 深度学习人工智能
问题解决RuntimeError:unabletowritetofile:Nospaceleftondevice(28)问题描述：Traceback(mostrecentcalllast):File"/opt/conda/lib/python3.10/multiprocessing/queues.py",line244,in_feedobj=_ForkingPickler.dumps(obj)Fi
如何使用Flask或Django框架构建一个简单的Web应用？清水白石008 Python题库 python flask django 前端
如何使用Flask或Django框架构建一个简单的Web应用？Flask和Django是两个流行的PythonWeb框架，用于构建Web应用。Flask是一个轻量级、易于扩展的框架，而Django则是一个功能全面的框架，包含了更多开箱即用的工具和功能。下面将分别介绍如何使用Flask和Django构建一个简单的Web应用。使用Flask构建简单Web应用1.安装Flask首先，确保安装了Flask
Flask 高并发部署方案详细教程！爬遍天下无敌手
前言虽然标题写的是Flask，但是下面这个教程不仅仅只适用于Flask,还适用于其他Pythonweb框架，记得帮忙点赞！众所周知Flask是一个同步的框架，处理请求的时候是以单进程的方式，当同时访问的人数过多时，Flask服务就会出现阻塞的情况。就像我们买火车票一样，当买火车票的人多的时候，排队的人就会很多，队伍就会很长，相应的等待的时间会变得很长！因此Flask,Django，webpy等框架
flask mysql orm_Flask的ORM和查询操作碍事的尾巴 flask mysql orm
Flask的ORMSQLAlchemySQLAlchemy是Python编程语言下的一个嵌入式软件。提供了SQL工具包以及对象关系映射(ORM)工具。SQLAlchemy“采用简单的Python语言，为高效和高级的数据库访问设计，实现完整的企业级持久模型”。SQLAlchemy首次发行于2006年2月，并迅速地在Python社区中最广泛使用的ORM工具之一，不亚于Django的ORM框架。Flas
解锁高性能Web应用：Gunicorn、Flask与Docker的高并发部署秘籍我是瓦力前端 gunicorn flask
引言在当今的互联网时代，高并发Web应用已成为许多企业的核心需求。无论是电商平台、社交网络还是实时数据分析系统，高并发能力直接影响到用户体验和业务成败。本文将带你深入探讨如何利用Gunicorn、Flask和Docker，实现高性能、高并发的Web应用部署。Gunicorn、Flask和Docker的基本概念Gunicorn：GreenUnicorn(简称Gunicorn)是一个PythonWSG
【python】setuptools Eternal-Student Python python 开发语言
setuptools是Python的一个核心工具包，用于构建、打包和分发Python项目。它是Python生态系统中最重要的工具之一，主要用于定义项目的元数据（如名称、版本、依赖等）以及构建和安装过程。以下是关于setuptools的详细介绍：1.setuptools的主要功能setuptools提供了以下核心功能：项目元数据管理：定义项目的名称、版本、作者、描述、依赖等信息。通过setup()函
【Visual Studio 2019 C++ 编译器的路径添加到系统 PATH 环境变量】 Eternal-Student Windows visual studio c++java
对于某些Python包，特别是那些涉及本地扩展或需要编译C/C++代码的包，需要一个支持C++开发的环境。VisualStudio是一个全面的开发环境，它提供了编译器、调试器以及其他许多工具，这些工具对于开发和编译C++代码非常有用。下载网址：ThankYouforDownloadingVisualStudioCommunityEdition(microsoft.com)以下是安装VisualSt
元组（tuple）转换为列表（list） Eternal-Student Python list windows 数据结构
在编程中，特别是在Python中，经常需要将元组（tuple）转换为列表（list）。元组通常使用圆括号()表示，如(x,y)，而列表使用方括号[]表示，如[x,y]。以下是如何将(x,y)转换为[x,y]的详细方法和示例。一、单个元组转换为列表方法1：使用list()函数Python提供了内置的list()函数，可以将元组直接转换为列表。示例代码：#定义一个元组tuple_point=(3,5)
【python】flask-Web 应用程序框架 3L_csdn #python flask python 前端 python web框架 http
目录简介一、简单示例二、Flask详细使用总结1、HTML转义2、路由2.1、使用route()装饰器将函数绑定到URL。2.2、变量规则2.3、唯一的URLs/重定向行为2.4、网址构建2.5、HTTP方法2.5、有json体返回的HTTPGET请求示例(请求中不带参数)2.6、有json体返回的HTTPGET请求示例(请求中带参数)简介Flask是一个轻量级的WSGIWeb应用程序框架。它旨在
超详细的Numpy基础教程！！！不会爬虫的闲鱼 numpy 数据分析 python
Numpy是一个开源的Python库，用于支持大型多维数组和矩阵运算，同时提供了大量的数学函数库。它是科学计算中非常重要的工具。Numpy在数据科学中非常重要，因为它提供了高效的数组处理能力和广泛的数学函数库，这对于处理大规模数据集、进行科学计算和机器学习等任务至关重要。一、安装与设置如何安装Numpypipinstallnumpy验证安装的方法importnumpyprint(numpy.__v
Pycharm中import torch报错解决方案（Python+Pycharm+Pytorch cpu版）波波仔86 人工智能 python pycharm pytorch import 解释器配置
pycharm环境搭建完毕后，编写一个py文件demo，importtorch报错，提示没有。设置python解释器：选择conda环境，使用现有环境，conda执行文件找到Anaconda安装路径下Scripts文件夹内的conda.exe，最后选择含有torch软件包的虚拟环境，题主创建名为pytorch。创建完解释器后，下方会显示出该解释器/虚拟环境下的所有软件包，看到有pytorch包即选
flask--基础知识点--6--flask高并发处理 Raging__Fire #flask python flask
Flask是一个轻量级的PythonWeb框架，适合构建中小型应用。但是，对于高并发场景，Flask本身可能需要一些辅助工具和配置来提升性能。以下是一些优化Flask应用以处理高并发的方法：1.使用WSGI服务器Flask自带的开发服务器性能和稳定性不足以应对生产环境中的高并发请求，可以考虑使用更强大的WSGI服务器，如：Gunicorn:一个基于Python的WSGIHTTP服务器。uWSGI:
【python error】cannot import name ‘TorchDispatchMode‘ from ‘torch.utils._python_dispatch‘ Eternal-Student Jetson Orin NX Python python 开发语言
报错：cannotimportname‘TorchDispatchMode’from‘torch.utils._python_dispatch’(/home/nvidia/.conda/envs/pytorch/lib/python3.8/site-packages/torch/utils/_python_dispatch.py)File“/media/nvidia/Ubuntu/xxxxx/ev
全自动量化交易软件是否真的可靠？使用过程中有哪些潜在风险需要注意财云量化 python炒股自动化量化交易程序化交易全自动量化交易软件可靠性潜在风险数据准确性股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
【测试语言篇四】Python进阶篇之json模块 m0_37135615 编程语言 python php 开发语言
一、json模块介绍JSON（JavaScript对象表示法）是一种轻量级数据格式，用于数据交换。在Python中具有用于编码和解码JSON数据的内置json模块。只需导入它，就可以使用JSON数据了：importjsonJSON的一些优点：JSON作为“字节序列”存在，在我们需要通过网络传输（流）数据的情况下非常有用。与XML相比，JSON小得多，可转化为更快的数据传输和更好的体验。JSON非常
DeepSeek API 客户端使用文档老大白菜 python 人工智能数据库
1.简介deep.py是一个用于与DeepSeekAPI交互的Python客户端封装。它提供了简单易用的接口，支持对话历史管理、日志记录等功能，使得与DeepSeekAPI的交互更加便捷和可靠。2.功能特点简单的接口设计自动管理对话历史完整的日志记录灵活的配置选项异常处理机制3.安装依赖pipinstallopenai4.配置环境在项目根目录创建.env文件：#WindowssetDEEPSEEK
信息检索系统评估指标的层级分析：从单点精确度到整体性能度量人工智能深度学习llm检索系统
在构建搜索引擎系统时，有效的评估机制是保证系统质量的关键环节。当用户输入查询词如"machinelearningtutorialspython"，系统返回结果列表后，如何客观评估这些结果的相关性和有效性？这正是信息检索评估指标的核心价值所在。分析用户与搜索引擎的交互模式，我们可以观察到以下行为特征：用户主要关注结果列表的前几项对顶部结果的关注度显著高于底部结果用户基于多次搜索体验形成对搜索系统整体
python系列【仅供参考】：python tornado 集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案坦笑&&life #python python tornado redis
pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类sys_redis_helper.pyimportredis
Python通过SSH隧道访问数据库 Java菜鸟在北京 python sshtunnel paramiko SSH隧道访问数据库
本文介绍通过sshtunnel类库建立SSH隧道，使用paramiko通过SSH来访问数据库。实现了两种建立SSH方式：公私钥验证、密码验证。公私钥可读本地，也可读取AwsS3上的私钥文件。本质上就是在本机建立SSH隧道，然后将访问DB转发到本地SSH内去访问数据库。简单易懂，上代码：fromsshtunnelimportSSHTunnelForwarderfromsqlalchemyimport
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交