不秃头小白

利用python进行数据分析之绘图和可视化--小白笔记

%matplotlib notebook

matplotlib API入门

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

data=np.arange(10)
data

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

plt.plot(data)

[]

Figure和Subplot

matplotlib的图像都位于Figure对象中。你可以用plt.figure创建一个新的Figure：

fig=plt.figure()

fig=plt.figure()
ax1=fig.add_subplot(2,2,1)
ax2=fig.add_subplot(2,2,2)
ax3=fig.add_subplot(2,2,3)

如果这时执行一条绘图命令（如plt.plot([1.5, 3.5, -2, 1.6])），matplotlib就会在最后
一个用过的subplot（如果没有则创建一个）上进行绘制，隐藏创建figure和subplot
的过程。

fig=plt.figure()
ax1=fig.add_subplot(2,2,1)
ax2=fig.add_subplot(2,2,2)
ax3=fig.add_subplot(2,2,3)
plt.plot(np.random.randn(50).cumsum(),'k--')

[]

fig=plt.figure()
ax1=fig.add_subplot(2,2,1)
ax2=fig.add_subplot(2,2,2)
ax3=fig.add_subplot(2,2,3)
plt.plot(np.random.randn(50).cumsum(),'k--')
ax1.hist(np.random.randn(100), bins=20, color='k', alpha=0.3)
ax2.scatter(np.arange(30), np.arange(30) + 3 * np.random.randn(30))

参数	说明
nrows	subplot的行数
ncols	subplot的列数
sharex	所有subplot应该使用相同的X轴刻度
subplot_kw	用于创建个subplot的关键字字典
fig_kw	创建figure时的其他关键字，如plt.subplots(2,2,figsize=(8,6))

调整subplot周围的间距

默认情况下，matplotlib会在subplot外围留下一定的边距，并在subplot之间留下一
定的间距。间距跟图像的高度和宽度有关，因此，如果你调整了图像大小（不管是
编程还是手工），间距也会自动调整。利用Figure的subplots_adjust方法可以轻而
易举地修改间距，此外，它也是个顶级函数：
subplots_adjust(left=None, bottom=None, right=None, top=None,wspace=None, hspace=None)
wspace和hspace用于控制宽度和高度的百分比，可以用作subplot之间的间距

fig, axes = plt.subplots(2, 2, sharex=True, sharey=True)
for i in range(2):
    for j in range(2):
        axes[i, j].hist(np.random.randn(500), bins=50, color='k', alpha=0.5)
plt.subplots_adjust(wspace=0, hspace=0)

颜色、标记和线型

matplotlib的plot函数接受一组X和Y坐标，还可以接受一个表示颜色和线型的字符串
缩写。
ax.plot(x,y,‘g–’)ax.plot(x,y,linestyle=‘–’,color=‘g’)
常用的颜色可以使用颜色缩写，你也可以指定颜色码（例如，‘#CECECE’）。你可
以通过查看plot的文档字符串查看所有线型的合集


plt.plot(np.random.randn(30).cumsum(),'ko--')

[]

plt.plot(np.random.randn(30).cumsum(),color='k',linestyle='--',marker='o')

[]

data = np.random.randn(30).cumsum()
plt.plot(data, 'k--', label='Default')
plt.plot(data, 'k-', drawstyle='steps-post', label='steps-post')
plt.legend(loc='best')

设置标题、轴标签、刻度以及刻度标签

fig=plt.figure()
ax=fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum())

[]

要改变x轴刻度，最简单的办法是使用set_xticks和set_xticklabels

fig=plt.figure()
ax=fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum())
ticks=ax.set_xticks([0,250,500,750,1000])
labels=ax.set_xticklabels(['one','two','three','four','five'],rotation=30,fontsize='small')
#rotation选项设定x刻度标签倾斜30度
ax.set_xlabel('Stages')
ax.set_title('My first matplotlib plot')

Text(0.5, 1.0, 'My first matplotlib plot')

Y轴的修改方式与此类似，只需将上述代码中的x替换为y即可。轴的类有集合方
法，可以批量设定绘图选项。
props={
‘title’:‘My first matplotlib plot’
‘xlabel’:‘Stages’

}
ax.set(**props)

添加图例

图例（legend）是另一种用于标识图表元素的重要工具。添加图例的方式有多种。
最简单的是在添加subplot的时候传入label参数：

fig=plt.figure()
ax=fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum(),'k',label='one')
ax.plot(np.random.randn(1000).cumsum(),'k--',label='two')
ax.plot(np.random.randn(1000).cumsum(),'k.',label='three')
ax.legend(loc='best')

注解以及在Subplot上绘图

除标准的绘图类型，你可能还希望绘制一些子集的注解，可能是文本、箭头或其他
图形等。注解和文字可以通过text、arrow和annotate函数进行添加
ax.text(x, y, ‘Hello world!’,family=‘monospace’, fontsize=10)

from datetime import datetime
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
data = pd.read_csv('F:/项目学习/利用Pyhon进行数据分析（第二版）/利用Pyhon进行数据分析/pydata-book-2nd-edition/examples/spx.csv', index_col=0, parse_dates=True)
spx = data['SPX']
spx.plot(ax=ax, style='k-')
crisis_data = [
    (datetime(2007, 10, 11), 'Peak of bull market'),
    (datetime(2008, 3, 12), 'Bear Stearns Fails'),
    (datetime(2008, 9, 15), 'Lehman Bankruptcy')
]
for date, label in crisis_data:
    ax.annotate(label, xy=(date, spx.asof(date) + 75),
                xytext=(date, spx.asof(date) + 225),
                arrowprops=dict(facecolor='black', headwidth=4,
                                width=2,
                                headlength=4),
                horizontalalignment='left', verticalalignment='top')
# Zoom in on 2007-2010
ax.set_xlim(['1/1/2007', '1/1/2011'])
ax.set_ylim([600, 1800])
ax.set_title('Important dates in the 2008-2009 financial crisis')

Text(0.5, 1.0, 'Important dates in the 2008-2009 financial crisis')

fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
rect = plt.Rectangle((0.2, 0.75), 0.4, 0.15, color='k', alpha=0.3)
circ = plt.Circle((0.7, 0.2), 0.15, color='b', alpha=0.3)
pgon = plt.Polygon([[0.15, 0.15], [0.35, 0.4], [0.2, 0.6]],color='g', alpha=0.5)
ax.add_patch(rect)
ax.add_patch(circ)
ax.add_patch(pgon)

将图表保存到文件

利用plt.savefig可以将当前图表保存到文件。该方法相当于Figure对象的实例方法
savefig。例如，要将图表保存为SVG文件，你只需输入
plt.savefig(‘figpath.svg’)
文件类型是通过文件扩展名推断出来的。因此，如果你使用的是.pdf，就会得到一
个PDF文件。我在发布图片时最常用到两个重要的选项是dpi（控制“每英寸点数”分
辨率）和bbox_inches（可以剪除当前图表周围的空白部分）
plt.savefig(‘figpath.png’, dpi=400, bbox_inches=‘tight’)

savefig并非一定要写入磁盘，也可以写入任何文件型的对象，比如BytesIO：

from io import BytesIO
buffer = BytesIO()
plt.savefig(buffer)
plot_data = buffer.getvalue()
savefig的其它选项

参数	说明
fname	含有文件路径的字符串或python的文件型对象
dpi	图像分辨率（每英寸点数），默认为100
facecolor、edgecolor	图像的背景色，默认为‘w’（白色）
format	显式设置文件格式（png、pdf、svg…）
bbox_inches	图表需要保存的部分

使用pandas和seaborn绘图

线形图

s=pd.Series(np.random.randn(10).cumsum(),index=np.arange(0,100,10))
s.plot()

df = pd.DataFrame(np.random.randn(10, 4).cumsum(0),
                  columns=['A', 'B', 'C', 'D'],
                  index=np.arange(0, 100, 10))
df

	A	B	C	D
0	-0.328178	-0.937408	1.069664	0.446050
10	0.082734	-0.519257	-0.287599	0.759948
20	-1.470532	-1.130326	-1.128459	0.276776
30	-2.338755	-2.276585	-0.284231	-1.064264
40	-2.770433	-0.352019	-0.990814	-1.536565
50	-3.497771	0.149083	-2.079692	-0.078499
60	-2.293681	0.075971	-2.276931	-0.519354
70	0.061288	0.558535	-3.195277	-0.183334
80	1.643792	-0.434300	-2.232554	-0.217443
90	1.326786	1.084292	-0.950808	-1.909138

df.plot()

柱状图

plot.bar()和plot.barh()分别绘制水平和垂直的柱状图。这时，Series和DataFrame的
索引将会被用作X（bar）或Y（barh）刻度

fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.bar(ax=axes[0], color='k', alpha=0.7)
data.plot.barh(ax=axes[1], color='k', alpha=0.7)

df = pd.DataFrame(np.random.rand(6, 4),
                  index=['one', 'two', 'three', 'four','five', 'six'],
                  columns=pd.Index(['A', 'B', 'C', 'D'],name='Genus'))

df

Genus	A	B	C	D
one	0.421760	0.183322	0.938769	0.358988
two	0.295460	0.382762	0.021034	0.178810
three	0.055834	0.862129	0.079981	0.832899
four	0.935701	0.262838	0.818458	0.628460
five	0.077205	0.571542	0.221106	0.805360
six	0.636606	0.767645	0.485035	0.865025

df.plot.bar()

设置stacked=True即可为DataFrame生成堆积柱状图，这样每行的值就会被堆积在
一起

df.plot.barh(stacked=True,alpha=0.7)

笔记：柱状图有一个非常不错的用法：利用value_counts图形化显示Series中
各值的出现频率，比如s.value_counts().plot.bar()。

tips=pd.read_csv('F:/项目学习/利用Pyhon进行数据分析（第二版）/利用Pyhon进行数据分析/pydata-book-2nd-edition/examples/tips.csv')
tips

	total_bill	tip	smoker	day	time	size
0	16.99	1.01	No	Sun	Dinner	2
1	10.34	1.66	No	Sun	Dinner	3
2	21.01	3.50	No	Sun	Dinner	3
3	23.68	3.31	No	Sun	Dinner	2
4	24.59	3.61	No	Sun	Dinner	4
...	...	...	...	...	...	...
239	29.03	5.92	No	Sat	Dinner	3
240	27.18	2.00	Yes	Sat	Dinner	2
241	22.67	2.00	Yes	Sat	Dinner	2
242	17.82	1.75	No	Sat	Dinner	2
243	18.78	3.00	No	Thur	Dinner	2

244 rows × 6 columns

party_counts=pd.crosstab(tips['day'],tips['size'])
party_counts

size	1	2	3	4	5	6
day
Fri	1	16	1	1	0	0
Sat	2	53	18	13	1	0
Sun	0	39	15	18	3	1
Thur	1	48	4	5	1	3

party_counts=party_counts.loc[:,2:5]
party_counts

size	2	3	4	5
day
Fri	16	1	1	0
Sat	53	18	13	1
Sun	39	15	18	3
Thur	48	4	5	1

#进行规格化，使得各行的和为1，并生成图表
party_pcts=party_counts.div(party_counts.sum(1),axis=0)
party_pcts

size	2	3	4	5
day
Fri	0.888889	0.055556	0.055556	0.000000
Sat	0.623529	0.211765	0.152941	0.011765
Sun	0.520000	0.200000	0.240000	0.040000
Thur	0.827586	0.068966	0.086207	0.017241

party_pcts.plot.bar()

import seaborn as sns
tips['tip_pct'] = tips['tip'] / (tips['total_bill'] - tips['tip'])
tips.head()

	total_bill	tip	smoker	day	time	size	tip_pct
0	16.99	1.01	No	Sun	Dinner	2	0.063204
1	10.34	1.66	No	Sun	Dinner	3	0.191244
2	21.01	3.50	No	Sun	Dinner	3	0.199886
3	23.68	3.31	No	Sun	Dinner	2	0.162494
4	24.59	3.61	No	Sun	Dinner	4	0.172069

sns.barplot(x='tip_pct',y='day',data=tips,orient='h')

sns.barplot(x='tip_pct', y='day', hue='time', data=tips, orient='h')

直方图和密度图

直方图（histogram）是一种可以对值频率进行离散化显示的柱状图。数据点被拆分
到离散的、间隔均匀的面元中，绘制的是各面元中数据点的数量

tips['tip_pct'].plot.hist(bins=50)

tips['tip_pct'].plot.density()

comp1 = np.random.normal(0, 1, size=200)
comp2 = np.random.normal(10, 2, size=200)
values = pd.Series(np.concatenate([comp1, comp2]))
sns.distplot(values, bins=100, color='k')

散布图或点图

点图或散布图是观察两个一维数据序列之间的关系的有效手段。

macro=pd.read_csv('F:/项目学习/利用Pyhon进行数据分析（第二版）/利用Pyhon进行数据分析/pydata-book-2nd-edition/examples/macrodata.csv')
data=macro[['cpi','m1','tbilrate','unemp']]
trans_data=np.log(data).diff().dropna()
trans_data[-5:]

	cpi	m1	tbilrate	unemp
198	-0.007904	0.045361	-0.396881	0.105361
199	-0.021979	0.066753	-2.277267	0.139762
200	0.002340	0.010286	0.606136	0.160343
201	0.008419	0.037461	-0.200671	0.127339
202	0.008894	0.012202	-0.405465	0.042560

sns.regplot(x='m1', y='unemp', data=trans_data)
plt.title('Changes in log m1 versus log unemp')

Text(0.5, 1.0, 'Changes in log m1 versus log unemp')

在探索式数据分析工作中，同时观察一组变量的散布图是很有意义的，这也被称为
散布图矩阵（scatter plot matrix）。纯手工创建这样的图表很费工夫，所以
seaborn提供了一个便捷的pairplot函数，它支持在对角线上放置每个变量的直方图
或密度估计

sns.pairplot(trans_data, diag_kind='kde', plot_kws={'alpha': 0.2})

分面网格（facet grid）和类型数据

seaborn有一个有用的内置函数catplot，可以简化制作多种分面图

sns.catplot(x='day', y='tip_pct', hue='time', col='smoker',kind='bar', data=tips[tips.tip_pct < 1])

除了在分面中用不同的颜色按时间分组，我们还可以通过给每个时间值添加一行来
扩展分面网格：

sns.catplot(x='day', y='tip_pct', row='time',col='smoker',kind='bar', data=tips[tips.tip_pct < 1])

sns.catplot(x='tip_pct', y='day', kind='box',data=tips[tips.tip_pct < 0.5])

你可能感兴趣的:(python,数据分析,matplotlib)

特征选择（机器学习）赵孝正机器学习算法机器学习人工智能
目录1.为什么需要特征选择2.常见的特征选择方法2.1过滤式（FilterMethods）小示例（用Python伪代码表达）：2.2包裹式（WrapperMethods）小示例（RFE伪代码示例）：2.3嵌入式（EmbeddedMethods）小示例（Lasso伪代码示例）：3.实践建议4.小结1.为什么需要特征选择在机器学习任务中，经常会遇到以下问题：特征（变量）数量过多，导致计算量大、训练速度
python创建python.py时遇到的问题 name is not defined 江大倩 python python
创建py文件之后，运行文件时报错：是一个nameerror，说var为定义，所以执行不成功。这是因为将var定义在了函数里面，即return后一行的代码缩进了，导致var没有定义成功，只需要去除缩进就可以了。更改如下：
python中name is not defined怎么解决_python name 'file' is not defined的解决办法 weixin_39900582 python中name is not defined怎么解决
python版本3.11源码：poem='''\ProgrammingisfunWhentheworkisdoneifyouwannamakeyourworkalsofun:usePython!'''f=file('poem.txt','w')#openfor'w'ritingf.write(poem)#writetexttofilef.close()#closethefilef=file('po
【Python】解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9A in position xxx: illegal multibyte 云天徽上 python运行报错解决记录 python numpy 机器学习深度学习 pandas
【Python】解决UnicodeDecodeError:‘gbk’codeccan’tdecodebyte0x9Ainpositionxxx:illegalmultibytesequence博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人
python中pywt库全称为PyWavelets ayiyiyiyi python
环境：pycharm2020.2在网上找到小波分析的程序，运行出现错误：未找到‘pywt’这个模块。于是利用pycharm中的settings添加模块搜索pywt出现pywt，但是安装失败。上网查，发现程序importpywt中pywt指的是Python小波分析库Pywavelets。安装成功，程序运行成功。
python中pywt库安装吟风忆柳 python
python中pywt库安装pipinstallPyWaveletscondainstallPyWavelets
Python清华镜像源使用方法（python 安装包) 程序代码狂人 linux 运维服务器
pipinstallpandas-ihttps://pypi.tuna.tsinghua.edu.cn/simple/把红字用要下载的包名替换掉即可pip：这是Python的包管理工具，用于安装和管理Python包。pip允许你从Python包索引（PythonPackageIndex，简称PyPI）下载和安装库。install：这是pip的一个子命令，用于安装包。当你指定install时，pip
大屏幕排队叫号小程序系统产品核心功能需求规划开发实例分享 v.15889726201 小程序
系统概述大屏幕排队叫号系统借助先进的信息技术，将排队、叫号、信息展示与数据分析等功能集于一体，为服务场所构建一个有序、高效的排队环境。通过自动化的排队叫号流程，减少人工干预，提高服务的准确性和效率；通过大屏幕实时展示排队信息，让客户对等待情况一目了然，增强信息透明度；通过数据分析功能，为服务场所提供决策依据，助力其优化服务流程与资源配置，从而全方位提升服务质量与客户满意度。以下我将详细介绍该系统的
python怎么处理表格的去重 Rhys.. python pandas 开发语言
在Python处理表格时，可以使用pandas库中的drop_duplicates方法对一个表格进行去重。这个方法能够根据某些列或者所有列的重复值来删除重复的行，并保留第一次出现的行或指定保留的情况。让我们来看一下如何对一个Excel表格去重的示例。假设你有一个Excel文件data.xlsx，我们要对其中的数据进行去重。首先，请确保你已经安装了pandas库。如果尚未安装，请使用以下命令进行安装
『OpenCV-Python』色彩空间及色彩转换 opencv
点赞+关注+收藏=学会了在计算机图像处理中，色彩空间是理解和操作图像色彩的重要基础。每一种色彩空间都有自己的适用范围。RGB是比较常见的色彩空间，除此之外比较常见的色彩空间还有GRAY、HSV、Lab、YUV等。为什么会有这么多色彩空间呢？有兼容性的原因，也有为了方便计算的原因。比如YUV这个是电视信号系统采用的，以前的老电视是黑白电视，只需要一个颜色通道，后来出现了彩色电视，为了使视频信号能够兼
Python如何写日志文件测试小白2951 python 开发语言
改目录加testcase加common，存放log6/写日志log.pyimportloggingimportosimporttimeclassLoggingUtil():def__init__(self,logger=None):#创建一个loggerself.logger=logging.getLogger(logger)level='INFO'iflevel=='DEBUG'orlevel=
PYTHON UI自动化，selenium第一节，登录测试小白2951 python 开发语言
'''1/安装Selenium库：使用pip工具来安装Selenium库。在命令行中输入以下命令：pipinstallselenium/requestspip常用基础命令查看已经安装的第三方库:piplist直接安装库：pipinstall库名指定版本安装：pipinstallrobotframework==2.8.7卸载已安装的库：pipuninstallrequests更新某个库：pipins
python怎样读取数据类型_python相关的几种数据类型的存储读取方式瘦下来 python怎样读取数据类型
归纳一下python中不同数据保存格式的存储和读取，旨在方法整理和速度比较。从数据角度分两种，一是ndarray格式的纯数值数据的读写，二是对象(数据结构)如dict的文件存取。数值数据的读写.bin格式，np.tofile()和np.fromfile()importnumpyasnpa=np.random.randint(0,100,size=(10000,5000))print(a.dtype
Python 3 基本数据类型详解 ivwdcwso 开发 python windows 开发语言
Python是一种简单而强大的编程语言，具有丰富的数据类型来处理不同类型的数据。在本文中，我们将介绍Python3中的基本数据类型，包括整数、浮点数、字符串、列表、元组、集合和字典，并举例说明它们的使用方法和应用场景。1.整数（int）整数是Python中最基本的数据类型之一，用于表示没有小数部分的数字。整数可以是正数、负数或零。x=10y=-5z=0应用场景：计数器和计数器变量。代表物品的数量或
Python的旅游网站数据爬虫分析与可视化大屏展示论文 IT实战课堂—x小凡同学 Python毕业设计项目 python 旅游爬虫
摘要随着互联网技术的迅猛发展，旅游行业也逐渐实现了数字化转型。旅游网站作为游客获取旅游信息的主要渠道，蕴含着丰富的旅游数据资源。本文旨在通过Python技术，实现旅游网站数据的爬虫分析，并利用可视化大屏展示分析结果，为旅游行业的数据驱动决策提供支持。关键词：Python；旅游网站；数据爬虫；可视化大屏一、引言旅游行业作为服务业的重要组成部分，其发展水平直接关系到国家经济的繁荣和人民生活的质量。随着
Python学习-九大数据类型整合，详细讲解小伙儿. Python python 开发语言学习
目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)（字典，列表，元组，字符串知识点可能不全，可以参考本人之前发的博客进行学习，加油。）1.int(整型)特点和用途：1.可以表示正整数、负整数和零，没有小数部分。2.取值范围取决于您所使用的Python版本和
[碎碎念] 重启学习与博客之旅-我的每日计划言午coding 碎碎念碎碎念
好久没在写博客了，今天我下定决心，要重新开始。我给自己定了个小目标，从今天起，每天都要写一篇博客，然后发布到CSDN和掘金上。以下是我的计划。一、每天学点新东西以后每天早上，我都得抽出至少一个小时专门用来学新技术。我打算先列个学习清单，把一直想学但没时间学的技术都写上去，然后按照自己的兴趣和工作需要，一项一项地去攻克。比如说，我最近对人工智能和大数据分析特别感兴趣，所以打算每天看点相关的专业书，或
Python GIL（全局解释器锁）机制对多线程性能影响的深度分析人工智能机器学习python
在Python开发领域，GIL（GlobalInterpreterLock）一直是一个广受关注的技术话题。在3.13已经默认将GIL去除，在详细介绍3.13的更亲前，我们先要留了解GIL的技术本质、其对Python程序性能的影响。本文将主要基于CPython（用C语言实现的Python解释器，也是目前应用最广泛的Python解释器）展开讨论。GIL的技术定义GIL（GlobalInterprete
Python学习笔记 - 探索5种数据类型 Mr数据杨 Python 编程基础 python 数据类型
在当今的数字时代，编程已经成为一种基本技能，不仅适用于软件开发人员，更广泛地应用于数据分析、人工智能、自动化和科学研究等领域。Python作为一种强大且易于学习的编程语言，因其简洁的语法和广泛的应用场景，成为了初学者学习编程的首选语言。在学习Python编程的过程中，理解和掌握数据类型是至关重要的。数据类型决定了程序中可以进行的操作类型，以及如何存储和处理信息。理解不同数据类型的特性和使用场景，不
ubuntu 安装python Y.zh
在官网找到自己需要的python版本，我选择的是Gzippedsourcetarball下载压缩包#e.g.wgethttps://www.python.org/ftp/python/3.9.0/Python-3.9.0.tgz解压tar-xzvfPython-3.9.0.tgz安装#安装依赖sudoapt-getinstall-yzlibczlib1gzlib1g-devlibffi-devli
python中的九种数据类型的简单介绍 yaohappy10801 python 开发语言
目录一、基本数据类型：1.Int2.Float3.Bool二、复合型数据类型：2.1.Str2.2.List2.3.Tuple2.4.Dict2.5.Set三、None今天我来讲解一下python中的九种数据类型：在python中可以分为两类：基本数据类型和复合数据类型。在基本数据类型中包括：数字（int，float，bool）和字符串两种在复合数据类型种包括：字典（dict），元组（tuple）
python爬虫项目（八十二）：爬取旅游攻略网站的用户评论，构建旅游景点推荐系统人工智能_SYBH 爬虫试读 2025年爬虫百篇实战宝典:从入门到精通 python 爬虫旅游开发语言金融信息可视化
构建一个旅游景点推荐系统，可以帮助用户根据他们的偏好和其他用户的评论来选择旅行目的地。在这个项目中，我们将通过爬取旅游攻略网站的用户评论数据，分析这些数据，并使用协同过滤等推荐算法来构建一个基本的推荐系统。本文将详细描述整个过程，包括爬虫部分和推荐系统的构建。目录文章大纲一、项目背景与目标项目的目标：二、目标网站分析与数据需求数据需求：目标网站：三、爬虫技术选型安装所需库四、使用Scrapy爬取用
用一个例子详细说明python单例模式 hunter206206 python python
单例模式是一种设计模式，它确保一个类只有一个实例，并提供一个全局访问点来访问该实例。这在需要控制资源（如数据库连接、文件系统等）的访问时非常有用。下面是一个使用Python实现单例模式的例子：classSingleton:_instance=Nonedef__new__(cls,*args,**kwargs):ifnotcls._instance:cls._instance=super(Singl
如何把一个python文件打包成一步一步安装的可执行程序 hunter206206 python python
将一个Python文件打包成可执行程序（如.exe文件），并实现一步一步的安装过程，通常需要以下步骤：1.将Python文件打包成可执行文件使用工具将Python脚本打包成可执行文件（如.exe）。常用的工具有PyInstaller和cx_Freeze。使用PyInstaller安装PyInstaller：pipinstallpyinstaller打包Python文件：pyinstaller--o
【设计模式】深入理解Python中的组合模式（Composite Pattern）写bug如流水 Python 架构设计设计模式 python 组合模式
深入理解Python中的组合模式（CompositePattern）在软件开发中，如何处理树形结构的数据和对象常常是一个挑战。**组合模式（CompositePattern）**为我们提供了一种灵活的方法来解决这一问题。它允许我们将对象组合成树形结构以表示“部分-整体”的层次关系，使得客户端可以以一致的方式对待单个对象和组合对象。在本文中，我们将详细探讨组合模式的定义、应用场景、实现方式，并通过示
P叔带你学Python-1.6-测试Python环境 Python_P叔 P叔带你学Python python 开发语言
在编程中，测试是一项重要的工作，可以帮助我们验证代码的正确性和稳定性。在Python编程环境中，同样需要进行测试来确保Python的安装和配置是正确的。在本篇文章中，我们将介绍如何测试Python环境，以确保我们的Python开发环境正常工作。一、检查Python版本在测试Python环境之前，首先需要检查Python的版本。Python有多个版本，例如Python2.x和Python3.x，这两
检查Python环境是否正确并确保PyCharm环境配置正确测试小白2951 python
要检查Python环境是否正确并确保PyCharm环境配置正确，可以按照以下步骤进行：检查Python安装：打开命令行或终端，输入python--version或python3--version，然后按回车键。如果看到Python的版本号，说明Python已正确安装。检查pip安装：在命令行中输入pip--version或pip3--version，然后按回车键。如果看到pip的版本号，说明pip
基于Python的携程旅游景点数据分析与可视化 ChengKe---Dawn 爬虫后端开发 python 数据分析开发语言
基于Python的携程旅游景点数据分析与可视化爬取景点、价格、开放状态、评论、热度、优惠政策等信息。功能列表指定城市爬取支持登录支持筛选支持评论爬取支持数据存在数据库支持生成Excel支持可视化部分效果演示爬取的旅游景点信息生成Excel指定城市爬取可视化部门图颜色都是随机,图形是动态图，例如水位图、环图等都是动态图启动文档导入数据库，启动Python脚本质量拉满，涵盖高质量开源项目，欢迎来访，博
Python学习——面向对象之ORM luke-skyworker Python
文章目录前述表格设计用户表结构电影表结构公告表结构表格对应的类设计字段类字符串类字段数值字段类用户表类电影表类公告类元类设计Models基类Models的元类ModelMetaclass以用户User类为例，查看元类改造前后类的名称空间的变化继续完成Models基类，增加数据库操作前述本篇文章就是要实现一个简单版本的ORM框架，前面的面向对象写了好几篇，光说不练是不行的，因此用ORM实现，好好巩固
多元随机分布的协方差矩阵的计算（python示例）读思辨 Python 数学矩阵 python 线性代数
协方差矩阵是统计学中描述两个或多个随机变量之间线性相关程度的一个重要工具。对于一个kkk维随机向量X=(X1,X2,...,Xk)X=(X_1,X_2,...,X_k)X=(X1,X2,...,Xk)，其协方差矩阵是一个k×kk\timeskk×k的矩阵，其中每个元素σij\sigma_{ij}σij是随机变量XiX_iXi和XjX_jXj的协方差。协方差的计算公式为：σij=Cov(Xi,Xj)
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring