污浊的双黑

Python数据分析步骤(入门学习)

数据可视化

$可清晰有效的解读、传递、解释信息。\\在前期数据整理阶段，通过数据可视化模型，\\可发现一些数据的问题（如异常值、缺失值等）；\\后期完成数据建模预测后，\\可通过数据可视化来解释预测的结果。\\总的来说，不论是在做数据分析专案、\\论文数据量化的过程，\\数据可视化都是非常实用和提高解释力的方式。$

用Python实现数据可视化

$用Python实现数据可视化的过程中，常用的功能包是：\\Matplotlib和Seaborn。\\前者比较基础与实用；后者则拥有多种特性，\\适用于创建复杂的可视化图形。\\Seaborn是Python的数据统计图形库，是kaggle比赛中最常用的可视化库。\\是在matplotlib基础上进行了高级API封装，图表装饰更加容易，\\可以用更少的代码做出更美观的图。\\高度兼容了numy、pandas、scipy等库，使得数据可视化更加方便快捷。$

$P y t h o n 可视化, M a t p l o t l i b 作柱状图$

#设置模块
import matplotlib.pyplot as plt
import pandas as pd
import matplotlib.dates as mdates # 设置日期格式

#加载数据
data=pd.read_csv ('*** / cars.csv')
#数据文件所在路径
#将”Year"字段转成时间格式
data['date']=pd.to_datetime(data['Year'])
data

#汇总得到每年的"Miles_per_Gallon”平均值
data_new=data.qroupby('date')['Miles_per_Gallon'].mean().reset_index()
data_new

#设置画布
fig,ax=plt.subplots(figsize=(10,6))
#绘制柱状图
ax.bar(data_new['date'],data_new['Miles_per_Gallon'],width=300)
#设置x轴按照年月日格式显示
ax.xaxis.set_major_formatter(mdates.DateFormatter('%Y-%m-%d'))
#设置图表标题
ax.set_title('CARS')
#设置y轴数据区间
ax.set_ylim (0,50)
#设置网格
ax.grid(True)
#添加数据标签
for x,y in zip(data_new['date'],data_new['Miles_per_Gallon']):
plt.text (x,y+3,ha='center',va='top')

# x 数据在x轴上的位置

# y+3 数据在Y轴上的位置，向上偏移3个单位

# '%.2f'%y 数据保留2位小数点

# ha='center' 居中对齐

# va='top' 在条形的上方

$16 个 m a t p l o t l i b 绘图技巧$

如何添加标题-title

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(0,10)
plt.title('chenqionghe')
plt.plot(x,x*x)
plt.show()

如何添加文字-text

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-10,11,1)
y=x*x
plt.plot(x,y)
plt.title('chenqionghe')
plt.text(-2.5,30,'function y=x*x')
# plt.show()
plt.savefig('test.jpg')

如何添加注释-annotate

#xy:为备注的坐标点
#xytext:备注文字的坐标(默认为xy的位置)
#arrowprops:在xy和xytext之间绘制一个箭头

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-10,11,1)
y=x*x
plt.title('chenqionghe')
plt.plot(x,y)
plt.annotate('chenqionghe is a kind man',xy=(0,1),xytext=(-4,20),arrowprops={'headwidth':10,'facecolor=red'})
plt.show()

如何设置坐标轴名称-xlabel/ylabel

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(1,20)
plt.xlabel('chenqionghe')
plt.ylabel('muscle')
plt.plot(x,x*x)
plt.show()

如何添加图例-legend

import numpy as np
import matplotlib.pyplot as plt
plt.plot(x,x)
plt.plot(x,x*2)
plt.plot(x,x*3)
plt.plot(x,x*4)
#直接传入Legend
plt.legend(['chenqionghe','light','weight','baby'])
plt.show()

如何调整颜色-color

import numpy as np
import matplotlib.pyplot as plt
x=np. arange(1,5)
#频色的几种方式
plt.plot(x,color='g')
plt.plot(x+1,color='0.5')
plt.plot(x+2,color='#FFOBFF')
plt.plot(x+3,color=(0.1,0.2,0.3))
plt.show()

如何切换线条样式-marker

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(1,5)
plt.plot(x,marker='o')
plt.plot(x+1,marker='>')
plt.plot(x+2,marker='s')
plt.show()

如何显示数学公式-mathtext

import numpy as np
import matplotlib.pyplot as plt
plt.title('chenqionghe')
plt.xlim([1,8])
plt.ylim([1,5])
plt.text(2,4,r'$ \alpha \beta \pi \lambda lomega $',size=25)
plt.text(4,4,r'$ \sin(0)=\cos(\frac{\pi){2}) $',size=25)
plt.text(2,2,r'$ \lim_{x \rightarrow y} \frac{1}{x^3} $',size=25)
plt.text(4,2,r'$ \sqrt[4]{x}=\sqrt{y} $',size-25)
plt.show()

如何显示网格-grid

import numpy as np
import matplotlib.pyplot as plt
x='chenqionghe','light','weigtht','baby'
y=[15, 30,45,10]
#pLt-grid()
#也可以设置颌色、线条宽度、线条祥式
plt.grid(color='g',linewidth='1',linestyle='-.')
plt.plot(x,y)
plt.show()

如何调整坐标轴刻度-locator_params

#同时调整x轴和y轴: plt.locator_params(nbins=20)
#只调整x轴: plt.locator_params('x',nbins=20)
#只调整y轴: plt.locator_params('y',nbins=20)

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(0,30,1)
plt.plot(x,y)
#x知和y轴分别显示20个
plt.locator_params(nbins=20)
plt.show()

如何调整坐标轴范围-axis/xlim/ylim

#axis:[0,5,0,10]，x从0到5，y从0到10
#xlim:对应参数有xmin和xmax，分别能调整最大值最小值
#ylim:同xlim用法

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(0,30,1)
plt.plot(x,x*x)
#显示坐标釉,plt.axis(),4个数字分别代表x轴和y抽的最小坐标，最大坐标

#调整x为10到25
plt.xlim(xmin=15,xmax=25)
plt.plot(x,x*x)
plt.show()

如何调整日期自适应-autofmt_xdate

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
x=pd.date_range('2020/01/01', periods=30)
y=np.arange(0,30,1)
plt.plot(x,y)
plt.gcf().autofmt_xdate()
plt.show()

如何添加双坐标轴-twinx

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(1,20)
y1=x*x
y2-np.log(x)
plt.plot(x,y1)
#添加一个坐标轴,，默认0到1
plt.twinx()
plt.plot(x,y2,'r')
plt.show()

如何填充区域-fill/fill_beween

import numpy as np
import matplotlib.pyplot as plt
x=np.linspace(0,5*np.pi,1000)
y1=np.sin(x)
y2=np.sin(2*x)
plt.plot(x,y1)
plt.plot(x,y2)
plt.fill(x,y1,'g')
plt.fill(x,y2,'r')

plt.title('chenqionghe')
plt.show()

如何画一个填充好的形状-matplotlib.patche

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mptaches
xy1=np.array([0.2,0.2])
xy2-np.array([0.2,0.8])
xy3-np.array([0.8,0.2])
xy4=np.array([0.8,0.8])

fig,ax=plt.subplots()

#圆形，指定坐标和半径
circle=mptaches.circle(xy1,0.15)
ax.add_patch(circle)

#长方形
rect=mptaches.Rectangle(xy2,0.2,0.1,color='r')
ax.add_patch(rect)

#多边形
polygon=mptaches.RegularPolygon(xy3,6,0.1,color='g')
ax.add_patch(polygon)

#椭圆
ellipse=mptaches.Ellipse(xy4,0.4,0.2,color='c')
ax.add_patch(ellipse)

ax.axis('equal')
plt.show()

如何切换样式-plt.style.use

#matplotlib支持多种样式，可以通过plt.style.use切换样式，例如:

plt.style.use('seaborn-whitegrid')

#输入plt.style.available可以查看所有的样式

Step1. 导入功能包

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

$线性图$


X = np.linspace(-np.pi,np.pi,256,endpoint=True)
C,S = np.cos(X),np.sin(X)
#在-Tt和之间产生256个均匀的数值,C是256个余弦值，X是256个正弦值
plt.plot(X,C)
plt.plot(X,S)
#注:将C和S的数值分配形成线性图
#查看及保存图片为png格式
plt.show()
savefig("./path/name.png",dpi=72)
#若要修改线条的颜色等属性,可用以下代码代替。
plt.plot(X,C,color="blue",linewidth=2.5,linestyle="-")
plt.plot(X,S,color="red",linewidth=2.5,linestyle="-")

$散点图$

N=10 #点的数量
x = np.random.rand(N) #随机形成数字作为x轴
y = np.random.rand(N) #随机形成数字作为y轴
x2 = np.random.rand(N) #随机形成数字
y2 = np.random.rand(N) #随机形成数字
area = np.random.rand(N)*1000 #设置每个点的面积大小
fig = plt.figure()
ax = plt.subplot()
ax.scatter(x,y,s=area, alpha=0.5) #绘制散点图,面积随机
ax.scatter(x2,y2,s=area, c='green',alpha=0.6) 
#改变x2，y2的颜色
plt.show()

$条形图$

df = DataFrame(np.random.rand(6,4),
Index['one','two','three','four','five','six'],
columns=pd.Index(['A','B','C','D'],
name='Genus'))
df.plot(kind='bar')
plt.show()

$饼图$

labels = 'x','y','Z'
sizes = [31.4,15.7,52.9]
fig1,ax1 = plt.subplots()
ax1.pie(sizes,labels=labels,
shadow=True, startangle=90,
autopct='%.1f')
ax1.axis('equal')
ax1.legend(labels,
title="variables:",
loc="center left",
bbox_to_anchor=(1,0,0.5,1))
ax1.set_title("pie chart with percentage")
plt.show()

$文字云$


from wordcloud import WordCloud
import matplotlib.pyplot as plt
text=("I want to study Python by following
Cathy is posts. ...........")
wordcloud =
WordCloud(background_color="white”,
width=480, height=480,
margin=0).generate(text)
plt.imshow(wordcloud,
interpolation='bilinear')
plt.axis("off")
plt.margins(x=O,y=O)
plt.show()

使用Python进行数据分析

调用第三方库

$包的使用:\\ 当提供的功能比较复杂，一个py文件写不下时就需要包，\\本质上包也是由模块组成的。$

导入包:导入包则执行包下的__init__.py
import glance.api
from glance import api

$调用使用包$

#调用pandas模块,命名别名为pd
import pandas as pd
#调用matplotlib中的pyplot .命名别名为plt
import matplotlib.pyplot as plt
#调用matplotlib模块
import matplotlib

数据读取和预处理、数据统计

$主要思路：\\ 1、对存在Excel中的数据进行读取,通过pandas的read-excel函数实现,\\得到一个Dataframe；\\2、再对空值进行预处理通过fillna对所有空值赋0；\\3、再对数据进行整理通过自定义函数和Apply实现按照年龄分段；\\4、接下来是通过以年龄段按照人员编号进行分组计数，统计每个年龄段对应的人数，\\这里使用到了groupby和count函数，这一点跟SQL是一致的，\\类似于Excel中的透视表或者countifs，实现的功能都是一样的。$

$具体代码$

#读取Excel
df = pd.read_excel('例子.xlsx')
#空值处理，全部改变为0
df.fillna(空,inplace=True)
#函数应用,新增年龄分段列
df[’年龄段]= df.apply (lambda x:nianling(x['年龄’]), axis=1)
#建立空Dataframe
data = pd. DataFrame()
#按照年龄段分组计数
data['人数']= df.groupby(['年龄段])[’人员编号'].count ()

数据整理

$主要思路\\ 这部分主要用到两个知识点：\\1、是自定义函数def，结合Apply可以返回自己需要的数值;\\ 2、同时这里用到IF判断语句，与SQL中的IF类似，\\与Excel的IF功能也相同，起到判断数据作用，\\具体结构包含IF，ELIF，ELSE结构。$
$具体代码$

def nianling(x):#自定义函数
if x<20:
    return'20以下'
elif 20<= x <=29:
    return'20_29'
elif 30<= x <=39:
    return'30_39'
elif 40<= x <=49:
    return'40_49'
elif 50<= x:
    return'50岁以上'
else:
    pass

数据数据输出、可视化

$主要思路\\ 数据分析的最后一步是数据可视化，这里采用了基本的matplotlib包，\\优势是函数都是固定的，可复制性强，每次只需更改X和Y轴列表即可。\\Matplotlib输出的图片可以保存，同时也可以对图片进行多维度的修饰， \\使用的matplotlib,构建柱形图来展现数据，\\Excel能实现的标题、标签、图表颜色、横纵坐标坐标都可以通过代码实现，\\同时可以对图表图片进行基本的设置以及保存到指定位置。$
$具体代码$

#正常显示中文标签,包括:x轴，y铀，标题，图例
matplotlib.rcParams['font.sans-serif']=['simHei']
#有时候x轴或者y轴刻度负号不能显示
matplotlib.rcParams['axes.unicode_minus'] = False
#设置Y轴人数列表
renshu =[5000,15000,35000,50000,2000]
#从下往上画
plt.barh(range(5),renshu,height=0.7,color='blue',alpha=0.8)
#设置X轴列表
plt.yticks(range(5),['50岁以上','40_49','30_39','20_29','20以下'])
#设置Y翱起始值
plt.xlim (30,60000)
#设置x轴标题
plt.xlabel("年龄段")
#设置总标题
plt.title("分段年龄人数分布")
#没置标签
for x, y in enumerate(renshu) :
plt.text(y +0.2,x -0.1,'%s'% y)
plt.show ()#展现图片

Python数据处理函数

总结了这67个pandas函数，完美解决数据处理，拿来即用！

df #DataFrame,对象

$一、导入数据： 7 个常见用法 :$

pd.DataFrame() #自己创建数据框,用于练习

pd.read_csv(filename) #从CSV文件导入数据

pd.read_table(filename) #从限定分隔符的文本文件导入数据

pd.read_excel(filename) #从Excel文件导入数据

pd.read_sql(query,connection_object) #从SQL表/库导入数据

pd.read_json(json_string) #从JSON格式的字符串导入数据

pd.read_html(url) 
#解析URL、字符串或者HTML文件，抽取其中的tables表格

$二、导出数据, 5 个常见用法 :$

df.to_csv(filename) #导出数据到CSV文件

df.to_excel(filename) #导出数据到Excel文件

df.to_sql(table_name,connection_object) #导出数据到SQL表

df.to_json(filename) #以Json格式导出数据到文本文件

writer=pd.ExcelWriter('test.xlsx',index=False)
df.to_excel(writer,sheet_name='单位')
writer.save() 
#将多个数据帧写入同一个工作簿的多个sheet(工作表)

$三、查看数据, 11 个常见用法 :$

df.head(n) #查看DataFrame对象的前n行

df.tail(n) #查看DataFrame对象的最后n行

df.shape() #查看行数和列数

df.info() #查看索引、数据类型和内存信息

df.columns() #查看字段（首行）名称

df.describe() #查看数值型列的汇总统计

s.value_counts(dropna=False) #查看Series对象的唯一值和计数

df.apply(pd.Series.value_counts)
#查DataFrame对象中每一列的唯一值和计数

df.isnull().any() #查看是否有缺失值

df[df[column_name].duplicated()]
#查看column_name字段数据重复的数据信息

df[df[column_name].duplicated()].count()
#查看column_name字段数据重复的个数

$四、数据选取, 10 个常见用法 :$

df[col] #根据列名,并以Series的形式返回列

df[[col1,col2]] #以DataFrame形式返回多列

s.iloc[0] #按位置选取数据

s.loc['index_one'] #按索引选取数据

df.iloc[0;:] #返回第一行

df.iloc[0,0] #返回第一列的第一个元素

df.loc[0,:]
#返回第一行(索引为默认的数字时，用法同df.iloc),但需要注意的是loc是按索引,iloc参数只接受数字参数

df.ix[[:5],["col1","col2"]]
#返回字段为col1和col2的前5条数据，可以理解为loc和iloc的结合体。

df.at[5,"col1"] #选择索引名称为5，字段名称为col1的数据

df.iat[5,0] #选择索引排序为5，字段排序为0的数据

$五、数据处理, 15 个常儿用法 :$

df.columns=['a','b','c']
#重命名列名(需要将所有列名列出,否则会报错)

pd.isnull() #检查DataFrame对象中的空值,并返回一个Boolean数组

pd.notnull()
#检查DataFrame对象中的非空值,并返回一个Boolean数组

df.dropna() #删除所有包含空值的行

df.dropna(axis=1)#删除所有包含空值的列

df.dropna(axis=1,thresh=n) #删除所有小于n个非空值的行

df.fillna(value=x)
#用x替换DataFrame对象中所有的空值,支持 df[column_name].fillna(x)

s.astype(float) #将Series中的数据类型更改为float类型

s.replace(1,'one') #用'one'代替所有等于1的值

s.replace([1,3],['one','three'])
#用'one'代替1，用'three'代替3

df.rename(columns=lambdax:x+1) #批量更改列名

df.rename(columns={'old_name':'new_name'}) #选择性更改列名

df.set_index('column_one')
#将某个字段设为索引，可接受列表参数，即设置多个索引

df.reset_index("col1")
#将索引设置为col1字段，并将索引新设置为0,1,2...

df.rename(index=lambdax:x+1) #批量重命名索引

$举例：$

数据读取

$文件。\\因为 dask 库的好处是：1、分块；2、并行化计算\\然而：先尝试了用 pandas 读取数据，\\读入整个 CSV 占用内存 76 MB。算是比较小的了。\\鉴于其可直接放入内存之中，因此就不需要分块了，\\因为反而会因为与硬盘交互，消耗 CPU 资源。\\经过测试，用 dask 读取数据，虽然可以分块，\\但需要启动并行化客户端，所以占用内存共 490 MB，\\而用 pandas 读取，仅占用了 230 MB，\\因此，选择 pandas 库。$

%%time
df = pd.read_csv(r'../泰迪杯/泰迪杯 A 题/附件/附件2.csv')
df    # 可视化头五行数据

分析数据

数据类型和缺失值

print(df.dtypes)    # 查看各行的类型

为何要没事找事，打印出数据类型呢？为了节省内存呀…，这里先按下不表。
$再看数据各列的缺失值数量如何：$

print(df.isna().sum())    #缺失值计算

$看一下有多少数据没有 X X X$

print(df['XXX'].isna().sum())    #缺失值计算、数量

可视化：Python Seaborn 8大常见图表绘制

$Seaborn是Python的数据统计图形库，是kaggle比赛中最常用的可视化库;\\是在matplotlib基础上进行了高级API封装，\\图表装饰更加容易，可以用更少的代码做出更美观的图;\\高度兼容了numy、pandas、scipy等库，\\使得数据可视化更加方便快捷。$

1、散点图
函数sns.scatterplot

import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
#小费数据集
tips = sns.load_dataset('tips')
ax = sns.scatterplot(x='total_bill',y='tip',data=tips)
plt.show()

2、条形图
函数sns.barplot

显示数据平均值和置信区间
import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
#小费数据集
tips = sns.load_dataset('tips')
ax = sns.barplot(x='day',y='total_bill',data=tips)
plt.show ()

3、线型图
函数sns.lineplot

#绘制折线图和置信区间

import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
fmri = sns.load_dataset("fmri")
ax = sns.lineplot(x="timepoint", y="signal", data=fmri)
plt.show()

4、箱线图
函数seaborn.boxplot

import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
tips = sns.load_dataset("tips")
ax = sns.boxplot(x="day", y="total_bill", data=tips)
plt.show()

5、直方图
函数seaborn.distplot

import seaborn as snsimport numpy as np
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
np.random.seed(0)
x = np.random.randn(1000)
ax = sns.distplot(x)
plt.show()

6、热力图
函数 seaborn.heatmap

import numpy as np
np.random.seed(0)
import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
uniform_data = np.random.rand(10，12)
ax = sns.heatmap(uniform_data)
plt.show()

7、散点图矩阵
函数sns.pairplot

import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
iris = sns. load_dataset("iris")
ax = sns.pairplot(iris)
plt.show()

8、分类散点图
函数seaborn.catplot

import seaborn as sns
sns.set()
import matplotlib.pyplot as plt
%matplotlib inline
exercise = sns.load_dataset("exercise")
ax = sns.catplot(x="time", y="pulse", hue="kind", data=exercise)
plt.show()

你可能感兴趣的:(python,数据分析,matplotlib)

python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
视频下载插件：yt-dlp 小怪兽长大啦 python
Yt-dlp插件使用下载方法方法一：Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量，下载yt-dlp时不需要配置。方法二：直接下载EXE可执行文件网上下载yt-dlp应用程序：https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令（配置好环境变量后，控制台下输入命令即可）直接下载视频
Python __init__.py 模块详解鱼丸丶粗面 Python __init__.py
文章目录1概述2导入演示2.1执行顺序：先父后子2.2导入所有模块（含子模块）1概述1.工具:Pycharm场景:在创建一个PythonPackage时，会默认在该包下生成一个'__init__.py'文件2.目的:'进行一些初始化操作'(1)当importpackage时，"自动"执行'__init__.py'文件中的内容(2)常用于导入模块2导入演示2.1执行顺序：先父后子目录结构：目录结构简
Python __init__.py 愚昧之山绝望之谷开悟之坡 python init
Python__init__.py作用详解尼古拉苏关注12018.06.1012:57:34字数745阅读45,278转载于：https://www.cnblogs.com/tp1226/p/8453854.html__init__.py该文件的作用就是相当于把自身整个文件夹当作一个包来管理，每当有外部import的时候，就会自动执行里面的函数。1.标识该目录是一个python的模块包（modul
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
机器学习之线性代数珠峰日记 AI理论与实践机器学习线性代数人工智能
文章目录一、引言：线性代数为何是AI的基石二、向量：AI世界的基本构建块（一）向量的定义（二）向量基础操作（三）重要概念三、矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉（五）自然语言处理一、引言：线性代数为何是AI的基石在人工智能领
有趣的学习Python-第十篇：Python的“魔法宝库”：标准库之旅王盼达有趣的学习Python 学习 python 开发语言
Python不仅是一门强大的编程语言，更像是一座充满宝藏的“魔法宝库”，里面装满了各种各样的“魔法工具”（标准库）。这些“魔法工具”可以帮助你轻松地完成各种任务，从文件操作到网络编程，从数据处理到性能优化。接下来，让我们一起探索Python的“魔法宝库”，看看这些“魔法工具”到底有多神奇！10.1操作系统接口：与“魔法世界”互动os模块就像是一个“魔法接口”，可以帮助你与操作系统进行互动。你可以用
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
Python字符串操作 weixin_30871905 python
转自http://blog.chinaunix.net/u/19742/showart_382176.html#Python字符串操作'''1.复制字符串'''#strcpy(sStr1,sStr2)sStr1='strcpy'sStr2=sStr1sStr1='strcpy2'printsStr2'''2.连接字符串'''#strcat(sStr1,sStr2)sStr1='strcat'sSt
零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
一文理清：阿里系数据中台-数据治理工具集(傻傻也能分清楚） Debug_Snail Hadoop Big Data 技术工具人工智能 hadoop 数据仓库
阿里云提供的大数据与数据分析产品种类较多，各产品的定位和核心功能有所不同。以下是对DataWorks、MaxCompute、Dataphin、AnalyticDBforMySQL（ADB）、QuickBI、EMR的详细梳理。一、核心产品定位与功能DataWorks定位：一站式大数据开发治理平台，提供数据集成、开发、调度、治理、服务等全链路能力。核心功能：数据集成：支持异构数据源（如数据库、OSS、
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
使用 Python 合并微信与支付宝账单，生成财务报告 python后端
最近用思源笔记记东西上瘾，突然想每个月存一份收支记录进去。但手动整理账单太麻烦了，支付宝导出一份CSV，微信又导出一份，格式还不一样，每次复制粘贴头都大。干脆写了个Python脚本一键处理，核心就干两件事：把俩平台的CSV账单合并到一起自动生成带分类表格的Markdown（直接拖进思源就能渲染）代码主要折腾了这些：支付宝账单前24行都是废话，直接skiprows=24跳过去，GBK编码差点让我栽跟
Python Flask 在网页应用程序中处理错误和异常 dowhileprogramming python flask 开发语言
PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常在我们所有的代码示例中，我们没有注意如何处理用户在浏览器中输入错误的URL或向我们的应用程序发送错误的参数集的情况。这不是设计意图，但目的是首先关注网页应用程序的关键组件。网页框架的美妙之处在于，它们通常默认支持错误处理。如果发生任何错误，将自
农业生产模拟和农业政策分析：WOFOST模型与PCSE模型安装、运行、数据准备；农田农作物生长模拟和产量预测等 WangYan2022 作物模型农业 WOFOST模型 PCSE模型农田生态系统作物模型农业生产模拟
WOFOST（WorldFoodStudies）和PCSE（PythonCropSimulationEnvironment）是两个用于农业生产模拟的模型：WOFOST是一个经过多年开发和验证的模型，被广泛用于全球的农业生产模拟和农业政策分析；采用了模块化的结构，可以对不同的农作物和环境条件进行参数化和适应；WOFOST可用于长期模拟，能够模拟整个作物生长周期，包括播种、生长、收获等各个阶段；WOF
探索R语言：经典案例解析与源代码翠绿探寻 r语言信息可视化开发语言 R语言
探索R语言：经典案例解析与源代码引言：R语言是一种流行的数据分析和统计建模工具，具有丰富的功能和广泛的应用领域。在本文中，我们将通过经典案例来探索R语言的一些重要功能和技术。我们将提供相应的源代码，以便读者能够实际运行并理解这些示例。案例一：数据导入与处理在数据分析中，数据导入和处理是首要任务。R语言提供了丰富的函数和包，用于处理各种数据格式。下面是一个简单的示例，演示了如何导入和处理CSV格式的
数据分析与AI丨AI Fabric：数据和人工智能架构的未来 Altair澳汰尔数据分析 ai RapidMiner 知识图谱人工智能
AIFabric架构是模块化、可扩展且面向未来的，是现代商业环境中企业实现卓越的关键。在当今商业环境中，数据分析和人工智能领域发展可谓日新月异。几乎每天都有新兴技术诞生，新的应用场景不断涌现，前沿探索持续拓展。可遗憾的是，众多企业在利用数据和人工智能方面，脚步总是滞后。这是每个行业进行创新和获得竞争优势的冲刺阶段，但正如大多数企业时常感受到的那样，大规模实施下一代数据和AI工具说起来容易做起来难。
基于Python+Vue开发的电影订票管理系统源码+运行步骤冷琴1996 Python系统设计 python vue.js 开发语言
项目简介该项目是基于Python+Vue开发的电影订票管理系统（前后端分离），这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能，同时锻炼他们的项目设计与开发能力。通过学习基于Python的电影订票管理系统项目，大学生可以在实践中学习和提升自己的能力，为以后的职业发展打下坚实基础。技术学习之路主要功能影片管理：管理系统可以录入、修改和查询影片的基本信息，如
Linux下安装Mysql环境软件分享工作室 Linux linux mysql 运维
1.mysql说明MySQL是一种开源的关系型数据库管理系统，它具有高性能、可靠性和灵活性的特点。MySQL支持多种操作系统，包括Windows、Linux和MacOS等。它是最流行的数据库管理系统之一，被广泛应用于网站开发、数据存储和数据分析等领域。2.mysql优点1.开源免费：MySQL是开源软件，可以免费使用和修改，没有任何使用限制。2.跨平台：MySQL可以在多种操作系统上运行，包括Wi
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option