张文彬彬

Python可视化数据学习

使用matplotlib制作图表

制作简单的折线图

import matplotlib.pyplot as plt

input_values = [1,2,3,4,5]
squares = [1,4,9,16,25]
plt.plot(input_values,squares,linewidth=5)
#设置图表标题，并给坐标轴加上标签
plt.title("Square Number",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)

#设置刻度标记的字体大小
plt.tick_params(axis='both',labelsize=14)

plt.show()

使用scatter()绘制散点图

import matplotlib.pyplot as plt


x_values = list(range(1,101))
y_values = [x**2 for x in x_values]
plt.scatter(x_values,y_values,c='red',edgecolor='none',s=4) #edgecolor删除数据点黑色轮廓


#设置图表标题并给坐标轴加上标签
plt.title("Square Number",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)
#设置刻度标记的大小
plt.tick_params(axis='both',which='major',labelsize=14)
plt.axis([0,110,0,12100])
plt.show()

可以使用RGB颜色模式自定义颜色。要指定自定义颜色，可传递参数c ，并将其设置为一个元组，其中包含三个0~1之间的小数值，它们分别表示红色、绿色和蓝色分量。值越接近0，指定的颜色越深，值越接近1，指定的颜色越浅。

plt.scatter(x_values, y_values, c=(0, 0, 0.8), edgecolor='none', s=40)

颜色映射（colormap）是一系列颜色，它们从起始颜色渐变到结束颜色。在可视化中，颜色映射用于突出数据的规律

plt.scatter(x_values, y_values, c=y_values, cmap=plt.cm.Blues,edgecolor='none', s=40)

参数c 设置成了一个 y 值列表，并使用参数cmap 告诉pyplot 使用哪个颜色映射。这些代码将 y 值较小的点显示为浅蓝色，并将y 值较大的点显示为深蓝色，

要让程序自动将图表保存到文件中，可将对plt.show() 的调用替换为对plt.savefig() 的调用：

plt.savefig('squares_plot.png', bbox_inches='tight')

随机漫步

每次行走都完全是随机的，没有明确的方向，结果是由一系列随机决策决定的

random_walk.py

from random import choice

class RandomWalk():
	"""一个生成随机漫步数据的类"""
	def __init__(self,num_points = 5000):
		"""初始化随机漫步的属性"""
		self.num_points = num_points
		
		#所有随机漫步都始于(0,0)
		self.x_values = [0]
		self.y_values = [0]

	def fill_walk(self):
		"""计算随机漫步包含的所有点"""
		#不断漫步，直到列表达到指定的长度
		while len(self.x_values) < self.num_points:
			#决定前进方向以及沿这个方向前进的距离
			x_step = self.get_step()
			y_step = self.get_step()
			#拒绝原地踏步
			if x_step == 0 and y_step == 0:
				continue
			
			#计算下一个点的x和y的值
			next_x = self.x_values[-1]+x_step
			next_y = self.y_values[-1]+y_step
			
			self.x_values.append(next_x)
			self.y_values.append(next_y)

	def get_step(self):
		self.direction = choice([1,-1])
		self.distance = choice([0,1,2,3,4])
		self.step = self.direction * self.distance
		return self.step

rw_visual.py

import matplotlib.pyplot as plt
from random_walk import RandomWalk
#只要程序处于活动状态，就不断地模拟随机漫步
while True:
	#创建一个RandomWalk实例，并将其包含的点都绘制出来
	rw = RandomWalk()
	rw.fill_walk()
	plt.scatter(rw.x_values,rw.y_values,s=5)
	plt.show()
	keep_running =input("Make another walk?(y/n):")
	if keep_running == 'n':
		break

给点着色、绘制起点终点

我们将使用颜色映射来指出漫步中各点的先后顺序，并删除每个点的黑色轮廓，让它们的颜色更明显。为根据漫步中各点的先后顺序进行着色，我们传递参数c ，并将其设置为一个列表，其中包含各点的先后顺序。由于这些点是按顺序绘制的，因此给参数c指定的列表只需包含数字1~5000

import matplotlib.pyplot as plt
from random_walk import RandomWalk

while True:
	#创建一个RandomWalk实例，并将其包含的点都绘制出来
	rw = RandomWalk()
	rw.fill_walk()
	point_numbers =list(range(rw.num_points))
	plt.scatter(rw.x_values,rw.y_values,c=point_numbers,cmap=plt.cm.Blues,edgecolor='none',s=5)#给点着色
	#突出起点和重点
	plt.scatter(0,0,c='green',edgecolors='none',s=100)
	plt.scatter(rw.x_values[-1],rw.y_values[-1],c='red',edgecolors='none',s=100)
	plt.show()
	
	keep_running =input("Make another walk?(y/n):")
	if keep_running == 'n':
		break

隐藏坐标轴

	--snip--
        plt.scatter(rw.x_values[-1],rw.y_values[-1],c='red',edgecolors='none',s=100)
	#隐藏坐标轴
	plt.axes().get_xaxis().set_visible(False)
	plt.axes().get_yaxis().set_visible(False)
	
	plt.show()
        --snip--

增加点数

rw = RandomWalk(50000)

图表适合屏幕大小时，更能有效地将数据中的规律呈现出来。为让绘图窗口更适合屏幕大小：

# 设置绘图窗口的尺寸
    plt.figure(figsize=(10, 6))

函数figure() 用于指定图表的宽度、高度、分辨率和背景色。你需要给形参figsize 指定一个元组，向matplotlib指出绘图窗口的尺寸，单位为英寸。

Python假定屏幕分辨率为80像素/英寸，如果上述代码指定的图表尺寸不合适，可根据需要调整其中的数字。如果你知道自己的系统的分辨率，可使用形参dpi 向figure() 传递该分辨率，以有效地利用可用的屏幕空间，如下所示：

plt.figure(dpi=128, figsize=(10, 6))

使用Pygal模拟掷骰子

要了解使用Pygal可创建什么样的图表，请查看图表类型画廊：访问http://www.pygal.org/ ，单击Documentation，再单击Chart types。每个示例都包含源代码，让你知道这些图表是如何生成的。

掷一个骰子

die.py

from random import randint

class Die():
	"""表示一个骰子的类"""
	
	def __init__(self,num_sides=6):
		"""骰子默认为6面"""
		self.num_sides = num_sides
	def roll(self):
		"""返回一个位于1和骰子面数之间的随机值"""
		return randint(1,self.num_sides)

die_visual.py

from die import Die
import pygal
#创建一个D6
die = Die()
#掷几次骰子，并将结果存储在一个列表中
results=[]
for roll_num in range(1000):
	result = die.roll()
	results.append(result)
	
#分析结果统计次数
frequencies =[]
for value in range(1,die.num_sides+1):
	frequency = results.count(value)
	frequencies.append(frequency)

#对结果进行可视化 直方图
hist = pygal.Bar()
hist.title = "Result of rolling one D6 1000 times."#标题
hist.x_labels=[x for x in range(1,die.num_sides+1)]#横坐标
hist.x_title = "Result"#横轴标题
hist.y_title = "Frequency of Result"#纵轴标题

hist.add('D6',frequencies)#将值添加到图表中
hist.render_to_file('die_visual.svg')#将图表渲染为svg文件

掷两个骰子

from die import Die
import pygal
#创建两个D6骰子
die_1 = Die()
die_2 = Die()
#掷多次骰子，并将结果存储在一个列表中
results=[]
for roll_num in range(1000):
	result = die_1.roll()+die_2.roll()
	results.append(result)
	
#分析结果统计次数
frequencies =[]
max_result = die_1.num_sides + die_2.num_sides
for value in range(2,max_result+1):
	frequency = results.count(value)
	frequencies.append(frequency)

#对结果进行可视化 直方图
hist = pygal.Bar()
hist.title = "Result of rolling two D6 1000 times."
hist.x_labels=[x for x in range(2,max_result+1)]
hist.x_title = "Result"
hist.y_title = "Frequency of Result"

hist.add('D6+D6',frequencies)
hist.render_to_file('dice_visual.svg')

处理csv文件

要在文本文件中存储数据，最简单的方式是将数据作为一系列以逗号分隔的值（CSV）写入文件。这样的文件称为CSV文件。csv 模块包含在Python标准库中，可用于分析CSV文件中的数据行。

import csv

filename = 'sitka_weather_07-2014.csv'
with open(filename) as f:
    reader = csv.reader(f)
    header_row = next(reader)

    print(header_row)

调用csv.reader() ，并将前面存储的文件对象作为实参传递给它，从而创建一个与该文件相关联的阅读器（reader ）对象。模块csv 包含函数next() ，调用它并将阅读器对象传递给它时，它将返回文件中的下一行。

为让文件头数据更容易理解，将列表中的每个文件头及其位置打印出来：

for index, column_header in enumerate(header_row):
          print(index, column_header)

对列表调用了enumerate() 来获取每个元素的索引及其值。（请注意，我们删除了代码行print(header_row)）。得知日期和最高气温分别存储在第0列和第1列。

提取并读取数据

	highs = [int(row[1]) for row in reader] #将字符串转换为数字，方便matplotlib读取
	print(highs)

提取最高气温并添加到列表中

绘制气温图表

  import csv

  from matplotlib import pyplot as plt

  # 从文件中获取最高气温
  --snip--
# 根据数据绘制图形
  fig = plt.figure(dpi=128, figsize=(10, 6))
❶ plt.plot(highs, c='red')

  # 设置图形的格式
❷ plt.title("Daily high temperatures, July 2014", fontsize=24)
❸ plt.xlabel('', fontsize=16)
  plt.ylabel("Temperature (F)", fontsize=16)
  plt.tick_params(axis='both', which='major', labelsize=16)

  plt.show()

模块datetime

读取日期数据时，获得的是一个字符串，因此我们需要想办法将字符串'2014-7-1' 转换为一个表示相应日期的对象。为创建一个表示2014年7月1日的对象，可使用模块datetime 中的方法strptime()。在终端会话中看看strptime() 的工作原理：

>>> from datetime import datetime
>>> first_date = datetime.strptime('2014-7-1', '%Y-%m-%d')

下表是模块datetime中设置日期和时间格式的实参

绘制一年时间的天气图

import csv
from matplotlib import pyplot as plt
from datetime import datetime
import matplotlib.dates as mdates
#从文件中获取最高气温
filename = 'sitka_weather_2014.csv'
with open(filename) as f:
	reader = csv.reader(f)
	header_row = next(reader)
	dates, highs = [], []
	for row in reader:
		current_date = datetime.strptime(row[0], "%Y-%m-%d")
		dates.append(current_date)
		high = int(row[1])
		highs.append(high)

#根据数据绘制图形
fig=plt.figure(dpi=128,figsize=(10,6))
plt.plot(dates,highs,c='red')

#设置图形格式
plt.title("Daily high temperatures - 2014",fontsize=24)
plt.xlabel("",fontsize=16)
#配置和横坐标
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%m/%Y'))
plt.gca().xaxis.set_major_locator(mdates.MonthLocator())
fig.autofmt_xdate()#让日期标签倾斜
plt.ylabel("Temperature(F)",fontsize=16)
plt.tick_params(axis='both',which = 'major',labelsize=10)

plt.show()

问题1：横坐标刻度太少，自定义配置横坐标

plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%m/%Y'))
plt.gca().xaxis.set_major_locator(mdates.MonthLocator())

问题2：列表解析法分别读取文件两行内容，有一行是空的

highs = [int(row[1]) for row in reader]
dates = [datetime.strptime(row[0],"%Y-%M-%D") for row in reader]
print(len(highs))
print(len(dates))

第二行读取的内容是空的........为什么......

添加最低气温并给图表区域着色

在其中再添加最低气温数据，使其更有用。从数据文件中提取最低气温，并将它们添加到图表。通过着色来呈现每天的气温范围。为此，我们将使用方法fill_between() ，它接受一个 x 值系列和两个 y 值系列，并填充两个 y值系列之间的空间：

--snip--
#从文件中获取最高气温
filename = 'sitka_weather_2014.csv'
with open(filename) as f:
	reader = csv.reader(f)
	header_row = next(reader)
	dates, highs, lows = [], [], []
	for row in reader:
                --snip--
		low = int(row[3])
		lows.append(low)
#根据数据绘制图形
fig=plt.figure(dpi=128,figsize=(10,6))
plt.plot(dates,highs,c='red',alpha=0.5)
plt.plot(dates,lows,c='blue',alpha=0.5)
plt.fill_between(dates,highs,lows,facecolor='blue',alpha=0.1)

#设置图形格式
plt.title("Daily high and low temperatures - 2014",fontsize=24)
--snip--

实参alpha 指定颜色的透明度。Alpha 值为0表示完全透明，1（默认设置）表示完全不透明。通过将alpha 设置为0.5，可让红色和蓝色折线的颜色看起来更浅。

向fill_between() 传递了一个 x 值系列：列表dates ，还传递了两个 y 值系列：highs 和lows 。实参facecolor 指定了填充区域的颜色，我们还将alpha 设置成了较小的值0.1，让填充区域将两个数据系列连接起来的同时不分散观察者的注意力。

问题3：横轴坐标如何从y轴开始

plt.xlim(dates[0],dates[-1])

错误检查

我们应该能够使用有关任何地方的天气数据来运行highs_lows.py中的代码，但有些气象站会偶尔出现故障，未能收集部分或全部其应该收集的数据。缺失数据可能会引发异常，如果不妥善地处理，还可能导致程序崩溃。

加利福尼亚死亡谷的气温图

文件death_valley_2014.csv没有记录2014年2月16日的数据，表示最高温度的字符串为空。为解决这种问题，我们在从CSV文件中读取值时执行错误检查代码，对分析数据集时可能出现的异常进行处理，如下所示：

--snip--
	for row in reader:
		try:
			current_date = datetime.strptime(row[0], "%Y-%m-%d")
			high = int(row[1])
			low = int(row[3])
		except:
			print(current_date,'missing data')
		else:
			dates.append(current_date)
			highs.append(high)
			lows.append(low)
--snip--

从中提取日期、最高气温和最低气温。只要缺失其中一项数据，Python就会引发ValueError 异常，打印一条错误消息，指出缺失数据的日期。打印错误消息后，循环将接着处理下一行。如果获取特定日期的所有数据时没有发生错误，将运行else 代码块，并将数据附加到相应列表的末尾

练习1：比较锡特卡和死亡谷的气温：在有关锡特卡和死亡谷的图表中，气温刻度反映了数据范围的不同。为准确地比较锡特卡和死亡谷的气温范围，需要在y 轴上使用相同的刻度。为此，请修改y 轴设置，对锡特卡和死亡谷的气温范围进行直接比较（你也可以对任何两个地方的气温范围进行比较）。你还可以尝试在一个图表中呈现这两个数据集。

import csv
from datetime import datetime
from matplotlib import pyplot as plt

def get_weather_data(filename,dates,highs,lows):
	with open(filename) as f:
		reader = csv.reader(f)
		header_row = next(reader)
		
		for row in reader:
			try:
				current_date = datetime.strptime(row[0],"%Y-%m-%d")
				high = int(row[1])
				low = int(row[3])
			except ValueError:
				print(current_date,"missing data")
			else:
				dates.append(current_date)
				highs.append(high)
				lows.append(low)

dates,highs,lows = [],[],[]
get_weather_data('sitka_weather_2014.csv',dates,highs,lows) 

fig = plt.figure(dpi=128,figsize=(10,6))
plt.plot(dates,highs,c='red',alpha=0.6)
plt.plot(dates,lows,c='blue',alpha=0.6)
plt.fill_between(dates,highs,lows,facecolor='blue',alpha=0.15)

dates,highs,lows = [],[],[]
get_weather_data('death_valley_2014.csv',dates,highs,lows) 


plt.plot(dates,highs,c='red',alpha=0.3)
plt.plot(dates,lows,c='blue',alpha=0.3)
plt.fill_between(dates,highs,lows,facecolor='blue',alpha=0.05)

title = "Daily high and low temperatures - 2014"
title += "\nSitka , AK and Death Valley, CA"

plt.title(title,fontsize=20)
plt.xlabel('',fontsize=16)
fig.autofmt_xdate()
plt.ylabel("Temperature(F)",fontsize=16)
plt.tick_params(axis='both',which = 'major',labelsize=16)
plt.ylim(10,120)
plt.xlim(dates[0],dates[-1])
plt.show()

制作世界人口地图：JSON格式

获取数据值

population_data.json文件是一个Python列表每个元素都是一个包含四个键的字典：国家名、国别码、年份以及表示人口数量的值。文件中的每个键和值都是字符串。为处理这些人口数据，我们需要将表示人口数量的字符串转换为数字值，为此我们使用函数int() ，但是由于原始数据的格式常常不统一，因此经常会出现错误。Python不能直接将包含小数点的字符串 '1127437398.85751' 转换为整数（这个小数值可能是人口数据缺失时通过插值得到的）。为消除这种错误，先将字符串转换为浮点数，再将浮点数转换为整数：

import json
#将数据加载到一个列表中
filename = 'population_data.json'
with open(filename) as f:
	pop_data = json.load(f)

#打印每个国家2010年的人口数量
for pop_dict in pop_data:
	if pop_dict['Year'] == '2010':
		country_name = pop_dict['Country Name']
		#Python不能直接将包含小数点的字符串'1127437398.85751'转换为整数
		population = int(float(pop_dict['Value']))
		print(country_name + ": " + str(population))

获取两个字母的国别码

Pygal中的地图制作工具要求数据为特定的格式：用国别码表示国家，用数字表示人口数量。处理地理政治数据时，经常需要用到几个标准化国别码集。population_data.json中包含的是三个字母的国别码，但Pygal使用两个字母的国别码。我们需要想办法根据国家名获取两个字母的国别码。Pygal使用的国别码存储在模块i18n （internationalization的缩写）中。字典COUNTRIES 包含的键和值分别为两个字母的国别码和国家名。要查看这些国别码，可从模块i18n中导入这个字典，并打印其键和值：

from pygal.i18n import COUNTRIES

for country_code in sorted(COUNTRIES.keys()):
    print(country_code, COUNTRIES[country_code])

问题1：执行程序时，报错

ModuleNotFoundError: No module named ‘pygal.i18n‘

经查找是由于 pygal.i18n 已经不存在了，现在已经更改成了 pygal_maps_world，需要单独通过pip下载

pip install pygal_maps_world

然而pip下载报错，只能从下载tar压缩包解压后进入解压目录使用python setup.py install命令安装，安装成功之后，修改为

from pygal_maps_world.i18n import COUNTRIES

就可以正常调用国别码了

制作世界地图

from pygal_maps_world.maps import World

wm = World()
wm.title = 'North,Central,and South Amercia'
wm.add('North America', ['ca','mx','us'])
wm.add('Central America',['bz','cr','gt','hn','ni','pa','sv'])
wm.add('South Ameirca',['ar','bo','br','cl','co','ec','gf','gy','pe','py','sr','uy','ve'])
wm.render_to_file('americas.svg')

问题2：执行程序时报错

import pygal
wm = pygal.Worldmap()

AttributeError: module 'pygal' has no attribute 'Worldmap'

对于绘制世界地图的指令，也就是我遇到的第二个报错，语句相应地更改模块名称：

from pygal_maps_world.maps import World
wm = World()

绘制完整的世界人口地图

import json
from country_codes import get_country_code
from pygal_maps_world.maps import World
#将数据加载到一个列表中
--snip--

#打印每个国家2010年的人口数量
#创建一个包含人口数量字典
cc_populations = {}
for pop_dict in pop_data:
	if pop_dict['Year'] == '2010':
		country_name = pop_dict['Country Name']
		#Python不能直接将包含小数点的字符串'1127437398.85751'转换为整数
		population = int(float(pop_dict['Value']))
		code = get_country_code(country_name)
		if code:
			cc_populations[code] = population
wm = World()
wm.title = 'World Population in 2010,by Country'
wm.add('2010',cc_populations)
wm.render_to_file('world_populations.svg')

创建了一个空字典，用于以Pygal要求的格式存储国别码和人口数量。如果返回了国别码，就将国别码和人口数量分别作为键和值填充字典cc_populations。创建了一个Worldmap 实例，并设置其title 属性。我们调用了add() ，并向它传递由国别码和人口数量组成的字典。

根据人口数量将国家分组

根据人口数量分成三组——少于1000万的85、介于1000万和10亿之间的69以及超过10亿的2：

--snip--
#根据人口数量将所有的国家分成三组
cc_pops_1,cc_pops_2,cc_pops_3 ={},{},{}
for cc,pop in cc_populations.items():
	if pop < 10000000:
		cc_pops_1[cc] =pop
	elif pop < 1000000000:
		cc_pops_2[cc] = pop
	else:
		cc_pops_3[cc] = pop

#看看每组分别包含多少个国家
print(len(cc_pops_1),len(cc_pops_2),len(cc_pops_3))

wm = World()
wm.title = 'World Population in 2010,by Country'
wm.add('0-10m',cc_pops_1)
wm.add('10m-1bn',cc_pops_2)
wm.add('>1bn',cc_pops_3)
wm.render_to_file('world_populations.svg')

使用Pygal设置世界地图的样式

Pygal使用一种基色，但将指定该基色，并让三个分组的颜色差别更大：

import json
from country_codes import get_country_code
from pygal_maps_world.maps import World
from pygal.style import RotateStyle
--snip--
#根据人口数量将所有的国家分成三组
cc_pops_1,cc_pops_2,cc_pops_3 ={},{},{}
for cc,pop in cc_populations.items():
	if pop < 10000000:
		--snip--            

wm_style = RotateStyle('#336699')
wm = World(style = wm_style)
wm.title = 'World Population in 2010,by Country'
--snip--

十六进制格式的RGB颜色是一个以井号（#）打头的字符串，后面跟着6个字符，其中前两个字符表示红色分量，接下来的两个表示绿色分量，最后两个表示蓝色分量。每个分量的取值范围为00 （没有相应的颜色）~FF （包含最多的相应颜色).#336699混合了少量的红色33、多一些的绿色66和更多一些的蓝色99，它为RotateStyle 提供了一种淡蓝色基色。

你可能感兴趣的:(廖雪峰Python学习笔记)

廖雪峰Python学习笔记之面向对象高级编程 redLion
先记录一下代码，后续补全学习体会。1.使用slotsclassStudent(object):passs=Student()s.name='Michael'#动态给实例绑定一个属性prints.namedefset_age(self,age):#定义一个函数作为实例方法self.age=agefromtypesimportMethodTypes.set_age=MethodType(set_age
看廖雪峰python学习笔记和自己查的关于python的笔记人菜就要多透虚
这次学习python是在学过用过python很久之后二刷学习教程，看的是廖雪峰2.7，确实重复的学习还是不断的有收获，接下来记录一些新学到的知识点list中有insert函数，可以直接在指定位置插入>>>classmates['Michael','Bob','Tracy','Adam']>>>classmates.insert(1,'Jack')>>>classmates['Michael','J
廖雪峰python学习笔记15.正则表达式入门 thinkerleo7798 Python
#-*-coding:utf-8-*-#正则表达式是一种用来匹配字符串的强有力的武器#用\d可以匹配一个数字，\w可以匹配一个字母或数字"""'00\d'可以匹配'007'，但无法匹配'00A'；'\d\d\d'可以匹配'010'；'\w\w\d'可以匹配'py3'；\s可以匹配一个空格（也包括Tab等空白符），所以\s+表示至少有一个空格.可以匹配任意字符要匹配'010-12345'由于'-'是
廖雪峰python学习笔记之错误、测试和调试 alicelmx python基础知识
错误处理try…except…finally错误处理机制相比返回错误代码，这是一种更为常见的错误处理方法try：可能会出错的代码except：可以有多个except来捕获不同的错误finally：一定会被执行的语句，大多数情况可以不写执行顺序：执行try中的语句片段，当出错是就跳转至except，最后一定会执行finally调用栈调用栈听起来很高端的样子，实际而言呢，咱们经常会遇到，就是在程序运行
【廖雪峰Python学习笔记】list & tuple & dict &set AmeyStudy Python
列表元组字典集合创建l=[1,‘a’,[1,3],True]t=(1,)d={‘key’:‘value’}s=set([1,2,4,2,1])索引l[1]t[0]d.get(‘key’)/插入l.insert(1,‘3’)/l.append(‘4’)/d[‘k1’]=‘v1’s.add(‘9’)修改l[0]=4/d[‘k1’]=v/移除l.pop(0)/d.pop(‘k1’)s.remove(‘1
廖雪峰Python学习笔记之面向对象编程 redLion
面向过程的编程思维是：按照处理流程，每一步需要做什么？用哪些函数可以解决？严格按照流程来把事情完成就ok了。这个在实际的应用中貌似还是多一点，因为简单，要求低一点。相对来说，面向过程的编程就更抽象一点。考虑问题的出发点不再是问题解决的流程，而是everythingisaobject，对象有变量和方法，而解决问题的方式是：哪些对象需要具有哪些属性和方法？如何通过各个对象之间的信息传递来解决问题？#代
廖雪峰python学习笔记之访问数据库 alicelmx python基础知识
咚咚咚，敲黑板，这一节真的很重要的，因为不论你做什么数据库都是必须要使用的一部分，不论你使用关系型数据库还是nosql，python都可以很好的访问并且操纵它。SQLite（python集成的数据库，无需安装）一个小小的铺垫：一个数据库的连接称为connection，连接到数据库之后，需要打开游标（Cursor），通过其执行SQL语句，然后获得执行结果。一定要注意的是，一旦连接打开游标之后记得关闭
廖雪峰Python学习笔记时间慢慢 python学习
输入输出输出：print（）print(‘hello,world’)print(‘Thequickbrownfox’,‘jumpsover’,‘thelazydog’)依次打印每个字符串，遇到逗号“,”会输出一个空格可以打印整数，或者计算结果：输入：Name=input()回车后，等待输入，输入的值被存进Name中，Input（‘pleaseinputyourname’）提示信息Python基础语
廖雪峰python学习笔记——函数式编程 AC是男孩 python
廖雪峰python学习笔记——函数式编程变量可以指向函数a=absa(-2)#输出2高级函数就是一个可以把一个函数当成参数的函数defadd(x,y,f):returnf(x)+f(y)add(-3,-5,abs)#输出8map函数map()是Python内置的高阶函数，它接收一个f和一个list，并通过把函数f依次作用在list的每个元素上，得到一个新的list并返回。reduce函数reduc
廖雪峰python学习笔记之IO编程 alicelmx python基础知识
文件读写使用with语句是个好习惯读文件的几种方式：read：一次性读取文件的全部内容read(size)：每次最多读取size个字节的内容readline：每次读取一行内容readlines：一次读取所有内容并按行返回list（可用于for循环）file-likeObject不要求从特定的类继承，只要写个read方法即可stringIO：在内存中创建file-like对象，常做临时缓冲区读取二进
廖雪峰Python学习笔记之多重继承 redLion
先mark一下代码，学习体会稍后补齐。classAnimal(object):passclassMammal(Animal):#大类passclassBird(Animal):passclassDog(Mammal):#各种动物passclassBat(Mammal):passclassParrot(Bird):passclassOstrich(Bird):passclassRunnable(ob
Python学习笔记(一) 三胖快跑深度学习 Python
廖雪峰Python学习笔记：link输入输出1.print(’’)函数输出字符串，多个字符串之间用‘，’分开，执行时，‘，’会转换为空格输出。2.input()函数能够使得再对变量进行赋值前输出一串自定义的内容，如name=input('pleaseenteryourname:')#运行结果pleaseenteryourname:lisaPython基础1.python大小写敏感2.语句以：结尾时
廖雪峰Python学习笔记4——高阶函数（filter，socrted） LKM_wonderful Python
filter函数：filter(fun,list)接收一个函数和一个序列，将函数作用的序列中的每个元素上（类似map（）），并通过返回值为true和false，留下true值练习：取list中的偶数练习：去掉空字符串思路：使用x2!=’'判断list中元素是否为空（方法2使用.strip()方法删除空的字符串）strip()方法：list.strip('char')作用：去除list中每个元素的首
廖雪峰Python学习笔记4——高阶函数（map,reduce） LKM_wonderful Python
高阶函数变量可以指向函数：f=abs函数名也是变量：注意：由于abs函数实际上是定义在importbuiltins模块中的，所以如果需要修改abs变量的指向在其他模块也生效，需要使用：importbuiltins;builtins.abs=10传入函数一个函数可以接受另一个函数作为参数——高阶函数defadd(x,y,f):returnf(x)+f(y)print(add(5,-6,abs))变量
廖雪峰Python学习笔记3——切片，迭代，列表生成式，迭代器，生成器 LKM_wonderful Python
切片：（取指定索引范围的操作）list=[‘a’,‘b’,‘c’,1,2,3,4]list[0:]----从0开始索引取出后面的所有元素–>a,b,c,1,2,3,4list[2：5]—从2开始索引取出三个元素–>c,1,2list[-1]------取出倒数第一个元素—>4list[-3:]-----从-3开始索引一直取到最后—>2,3,4list[1:-1]----从1开始索引取到倒数第二个元
廖雪峰python学习笔记【16】进程和线程：多进程、多线程 HappyMrSpring 廖雪峰python 廖雪峰python学习笔记
一、多进程1.fork返回两次的原因：调用fork时，操作系统把当前进程复制了一份，然后fork在父子进程分别返回了一次。2.python的os模块内的fork只能在linux类系统上调用：2.1importos2.2pid=os.fork()#pid在子进程中为0；在父进程中为子进程的进程id。3.multiprocessing模块3.1multiprocessing是跨平台版本的多进程模块。3
廖雪峰python学习笔记之使用Tkinter进行GUI编程 alicelmx python基础知识
在网上看了一遭，发现用tkinter写GUI也是一种图方便的做法，基本的都能实现，但是美观，速度你就不要强求了，还是用Qt的人多一些，我一直也不太理解GUI的代码为什么这么写，但是照猫画虎也能实现，所以暂时就不深究了。明确什么是Widget在GUI中，每个Button、Label、输入框等，都是一个Widget。Frame则是可以容纳其他Widget的Widget，所有的Widget组合起来就是一
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s