weixin_39942108

pythoncsv数据类型_干货：手把手教你用Python读写CSV、JSON、Excel及解析HTML

原标题：干货：手把手教你用Python读写CSV、JSON、Excel及解析HTML

导读：本文要介绍的这些技法，会用Python读入各种格式的数据，并存入关系数据库或NoSQL数据库。

作者：托马兹·卓巴斯（Tomasz Drabas）

本文摘编自《数据分析实战》，如需转载请联系我们

本文的源代码与数据集都可在Github上获取。如果要复制代码库，打开你的终端（Windows环境下的命令行、Cygwin或Git Bash，Linux/Mac环境下的Terminal），键入下面这条命令：

git clone

https://github.com/drabastomek/practicalDataAnalysisCookbook.git

注意，你的机器得装好Git了。安装指南参见：

https://git-scm.com/book/en/v2/Getting-Started-Installing-Git

我们将使用一个数据集，包含985项真实的房产交易。这些交易是连续5天内在Sacramento发生的。数据下载自：

https://support.spatialkey.com/spatialkey-sample-csv-data/

精确地说，来自：

http://samplecsvs.s3.amazonaws.com/Sacramentorealestatetransactions.csv

数据已转成多种格式，放在GitHub代码库的Data/Chapter01文件夹中。

另外，你会学到如何从HTML文件中检索信息。出于这个目的，我们将使用Wikipedia上字母A打头的机场列表：

https://en.wikipedia.org/wiki/List_of_airports_by_IATA_code:_A

我们将使用OpenRefine清理我们的数据集；它很擅长数据的读取、清理以及转换数据。

01 用Python读写CSV/TSV文件

CSV和TSV是两种特定的文本格式：前者使用逗号分隔数据，后者使用t符。这赋予它们可移植性，易于在不同平台上共享数据。

1. 准备

要实践这个技法，你要先装好pandas模块。这些模块在Anaconda发行版Python中都有。如果你装的是这个版本，就省事了。如果不是，那你得安装pandas并确保正确加载。

可以从

http://docs.continuum.io/anaconda/install

下载Anaconda。

如果你装了Python，没有pandas，你可以从

https://github.com/pydata/pandas/releases/tag/v0.17.1

下载，并按照文档安装到你的操作系统中。

http://pandas.pydata.org/pandas-docs/stable/install.html

此外没有要求了。

2. 怎么做

pandas模块提供了高性能的高级数据结构（比如DataFrame）以及一些基本的分析工具。

DataFrame是一种数据结构，有点像Excel表格，列代表数据集的维度（例如，人的身高和体重），行存储着数据（例如，1000个人的具体身高和体重数据）。参考：

http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dataframe

这个模块提供了一些方法，便于读取各种格式的数据。下面这小块代码读取了CSV和TSV格式的数据，存入pandas DataFrame数据结构，然后写回到磁盘上（read_csv.py文件）：

importpandas as pd

# 读出数据的文件名

r_filenameCSV='../../Data/Chapter01/realEstate_trans.csv'

r_filenameTSV='../../Data/Chapter01/realEstate_trans.tsv'

# 写进数据的文件名

w_filenameCSV='../../Data/Chapter01/realEstate_trans.csv'

w_filenameTSV='../../Data/Chapter01/realEstate_trans.tsv'

# 读取数据

csv_read=pd.read_csv(r_filenameCSV)

tsv_read=pd.read_csv(r_filenameTSV, sep='t')

# 输出头10行记录

print(csv_read.head(10))

print(tsv_read.head(10))

# 写入文件

withopen(w_filenameCSV,'w') as write_csv:

write_csv.write(tsv_read.to_csv(sep=',', index=False))

withopen(w_filenameTSV,'w') as write_tsv:

write_tsv.write(csv_read.to_csv(sep='t', index=False))

打开命令行控制台（Windows环境下可使用命令或Cygwin，Linux/Mac环境下可使用Terminal），执行这条命令：

python read_csv.py

你会看到类似这样的输出：

|0|1|2| SACRAMENTO |38.631913|-121.434879|59222|

|1|1|3| SACRAMENTO |38.478902|-121.431028|68212|

|2|1|2| SACRAMENTO |38.618305|-121.443839|68880|

…

3. 原理

首先加载pandas，以使用DataFrame及相关方法来读写数据。注意，关键词as赋给pandas一个别名pd。这样在后面的代码中，使用DataFrame或read_csv(...)方法时，我们就不用写出包的全名了。我们将（用于读和写的）文件名分别存于变量r_filenameCSV(TSV)和w_filenameCSV(TSV)。

使用pandas的read_csv(...)方法读取数据。这个方法用途很广，接受一系列输入参数。但有一个参数是必需的，一个文件名或缓冲区，也就是一个打开的文件对象。要解析realEstate_trans.tsv文件，你要指定sep=‘t’参数；默认情况下，read_csv(...)方法会推断文件使用的分隔符，不过我可不喜欢碰运气式编程，向来是指定分隔符的。

两个文件中的数据一模一样，所以你可以输出一些记录，看看文件是否正确读入。这可通过对DataFrame对象应用.head()方法达成，其中指的是要输出的行数。

将数据存于pandas DataFrame对象意味着，数据的原始格式并不重要；一旦读入，它就能保存成pandas支持的任何格式。在前面这个例子中，我们就将CSV文件中读取的内容写入了TSV文件。

无论读写，打开文件都要使用with open(…) as …:这个固定搭配。这种方式的优点在于，一旦完成了读写任务，即使由于某些原因抛出了异常，文件依然会正确关闭。

异常是指程序员写代码时期望之外的情况。

例如，假设你有一个文件，每行只包含一个数字：你打开这个文件，开始读取。每一行作为文本读入，你需要将文本转为一个整数——计算机可以将其作为数字理解（并处理）的数据结构，而非文本。

当数据中只有数字时一切安好。然而，你将会认识到，我们收集的数据在某些方面是有瑕疵的，那么，某些行包含一个字母而非数字时，文本到整数的转换会失败，而Python会抛出一个异常。

open(, ‘w’)会以写模式（w参数）打开指定的文件。也可以传入’r’指定以读模式打开文件。以’r+’模式打开文件允许数据的双向流动（读取和写入），这样你就可以在需要时往文件的末尾附加内容。你也可以指定rb或wb来处理二进制数据（而非文本）。

to_csv(…)方法将DataFrame的内容转换为可存储于文本文件的格式。你要指定分隔符，比如sep=‘,’，以及是否保存DataFrame的索引，默认是保存的。我们不希望存，所以要指定index=False。

用索引可以很方便地辨认、校准、访问DataFrame中的数据。索引可以是一列连续的数字（就像Excel中的行号）或日期；你还可以设定多列索引。索引列并不是数据（即便打印DataFrame对象时你会在屏幕上看到索引）。

要了解更多关于索引的内容，可访问：

http://pandas.pydata.org/pandas-docs/stable/indexing.html

4. 更多

这里介绍读写CSV、TSV文件最方便最快捷的方法。如果你不想把数据存于pandas的DataFrame数据结构，你可以使用csv模块。像下面这样读取文件（read_csv_alternative.py文件）：

importcsv

# 读入数据的文件名

r_filenameCSV='../../Data/Chapter01/realEstate_trans.csv'

r_filenameTSV='../../Data/Chapter01/realEstate_trans.tsv'

# 保存数据的数据结构

csv_labels=[]

tsv_labels=[]

csv_data=[]

tsv_data=[]

# 读取数据

withopen(r_filenameCSV,'r') as csv_in:

csv_reader=csv.reader(csv_in)

# 读取第一行，这是列标签

csv_labels=csv_reader.__next__()

# 遍历记录

forrecordincsv_reader:

csv_data.append(record)

withopen(r_filenameTSV,'r') as tsv_in:

tsv_reader=cvs.reader(tsv_in, delimiter='t')

tsv_labels=tsv_reader.__next__()

forrecordintsv_reader:

tsv_data.append(record)

# 打印标签

print(csv_labels,'n')

print(tsv_labels,'n')

# 打印头10行记录

print(csv_data[0:10],'n')

print(tsv_data[0:10],'n')

我们将标签和数据分别存储于csv(tsv)_labels和csv(tsv)_data两个列表。.reader(…)方法从文件中逐行读取数据。要创建.reader(…)对象，你要传入一个打开的CSV或TSV文件对象。另外，要读入TSV文件，你也得像DataFrame中一样指定分隔符。

csv模块也提供了csv.writer对象，可将数据以CSV/TSV格式存储。参见csv模块的文档：

https://docs.python.org/3/library/csv.html

5. 参考

查阅pandas文档中讲解reader_csv(…)和write_csv(…)的部分，了解更多可传入的参数。文档位于：

http://pandas.pydata.org/pandas-docs/stable/io.html#io-read-csv-table

02 用Python读写JSON文件

JSON的全称是Java Object Notation。这是个嵌套的、类似字典的结构，以逗号为分隔符，存储键值对；键与值之间以冒号分隔。JSON格式独立于具体平台（就像XML，我们将在用Python读写XML文件介绍），便于平台之间共享数据。

要深入了解JSON，可参考：

http://www.w3schools.com/json/

1. 准备

要实践这个技法，你要先装好pandas模块。此外没有要求了。

2. 怎么做

下面是读取JSON文件的代码。注意，我们假设已经引入了pandas模块，并以别名pd指代（read_json.py文件）：

# 读出数据的JSON文件

r_filenameJSON='../../Data/Chapter01/realEstate_trans.json'

# 读取数据

json_read=pd.read_json(r_filenameJSON)

# 打印头10行记录

print(json_read.head(10))

3. 原理

这段代码与前一节的类似。首先，指定JSON文件的名字——我们将其存于r_filenameJSON字符串中。然后，使用pandas的read_json(…)方法，传入r_filenameJSON。

读出的数据存储于json_read这一DataFrame对象。进而使用.tail(…)方法打印出最后10条数据。要写入一个JSON文件，你可以对DataFrame使用.to_json()方法，将返回的数据写进一个文件，类似用Python读写CSV/TSV文件中介绍的流程。

4. 更多

也可以使用json模块来读写JSON文件。可以使用下面的代码从JSON文件中读取数据（read_json_alternative.py文件）：

# 读取数据

withopen('../../Data/Chapter01/realEstate_trans.json','r') as json_file:

jsonread=json.loads(json_file.read())

这段代码将realEstate_trans.json文件中读出的数据存入json_read列表。这里对文件使用了.read()方法，将文件内容全部读入内存。下面的代码将数据存储于一个JSON文件：

# 写回到文件中

withopen('../../Data/Chapter01/realEstate_trans.json','w') as json_file:

json_file.write(json.dumps(json_read))

5. 参考

参阅pandas文档中read_json的部分。文档位于：

http://pandas.pydata.org/pandas-docs/stable/io.html#io-json-reader

03 用Python读写Excel文件

以表格形式操作数据的文件格式中，Microsoft的Excel文件可以说是最流行的了。拿最新的XLSX格式来说，Excel可以在单个工作表中存储一百多万行及一万六千多列。

1. 准备

要实践这个技法，你要先装好pandas模块。此外没有要求了。

2. 怎么做

下面是读取JSON文件的代码。注意，我们假设已经引入pandas模块，并以pd指代（read_xlsx.py文件）：

# 读写数据的文件名

r_filenameXLSX='../../Data/Chapter01/realEstate_trans.xlsx'

w_filenameXLSX='../../Data/Chapter01/realEstate_trans.xlsx'

# 打开Excel文件

xlsx_file=pd.ExcelFile(r_filenameXLSX)

# 读取内容

xlsx_read={

sheetName: xlsx_file.parse(sheetName)forsheetNameinxlsx_file.sheet_names

}

# 打印Sacramento头10份价格

print(xlsx_read['Sacramento'].head(10)['price'])

# 写入Excel文件

xlsx_read['Sacramento'].to_excel (w_filenameXLSX,'Sacramento', index=False)

3. 原理

类似之前的例子。用pandas的ExcelFile(...)方法打开XLSX文件，并赋给xlsx_file对象。用.parse(...)方法读取指定工作表的内容，并存储于xlsx_read字典。注意，通过ExcelFile对象的.sheet_names属性，你可以访问Excel文件中的所有工作表。

创建xlsx_read字典时，我们使用了字典表达式，这个做法很Python：不是显式地遍历工作表，将元素添加到字典，而是使用字典表达式，让代码更可读、更紧凑。

表达式效仿数学上的表示方法，这让代码更容易理解。比方说，2的幂次的列表：（A = (2^0, 2^1, 2^2, …, 2^8) = (2^x: 0 <= x < 9), x取整数）。使用表达式很容易转成Python代码：A = [2**x for x in range(0, 9)]。就创建了这样的列表：A = [1, 2, 4, 8, 16, 32, 64, 128, 256]。

另外，Python里，表达式也比显式的循环要快那么一点点。

http://stackoverflow.com/questions/22108488/are-list-comprehensions-and-functional-functions-faster-than-for-loops

range(, )函数生成了从到-1的一列整数。例如，range(0, 3)生成的序列是0，1，2.

存储数据到Excel文件中也很简单。仅需调用.to_excel(...)方法，第一个参数传你要保存数据的文件名，第二个参数传工作表的名字。在我们的例子中，我们还指定了index=False，这样不会保存索引；默认情况下，.to_excel(...)方法保存A列的索引。

4. 更多

读取Excel文件，除了用pandas的read_excel(...)方法，你也可以选择其它Python模块。pandas使用xlrd读取数据并转成DataFrame。

https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html?p=4966

对于XLSX文件，你也可以使用openpyxl模块（read_xlsx_alternative.py文件）：

importopenpyxl as oxl

# 读出数据的文件名

r_filenameXLSX='../../Data?Chapter01/realEstate_trans.xlsx'

# 打开Excel文件

xlsx_wb=oxl.load_workbook(filename=r_filenameXLSX)

# 工作簿中所有工作表的名字

sheets=xlsx_wb.get_sheet_names()

# 提取'Sacramento'工作表

xlsx_ws=xlsx_wb[sheets[0]]

首先，读取Excel文件，存入xlsx_wb（工作簿）。从工作簿中提取所有工作表的名字，并存入sheets变量。这里我们的工作簿中只有一个工作表，所以sheets变量就等于'Sacramento'。我们用它创建一个xlsx_ws对象，以遍历所有的行：

labels=[cell.valueforcellinxlsx_ws.rows[0]]

data=[]# 保存数据的列表

forrowinxlsx_ws.rows[1:]:

data.append([cell.valueforcell row])

第一行是所有列的标签，最好还是单独存储——我们放到labels变量中。进而使用.rows迭代器，遍历工作表中每一行，将所有单元格中的数据加入data列表：

print(

[item[labels.index('price')]foritemindata[0:10]]

)

代码最后打印出头10行的房屋价格。我们使用表达式生成价格的列表。如代码所示，对于列表对象，你可以调用.index(...)方法查找某一元素首次出现的位置。

5. 参考

查阅pandas文档中read_excel的部分。文档在

http://pandas.pydata.org/pandas-docs/stable/io.html#io-excel

另外，你可以访问

http://www.python-excel.org

找到一系列模块，可帮你处理.xls和.xlsx等Excel文件格式。

04 用Python读写XML文件

XML的全称是eXtensible Markup Language（扩展标记语言）。尽管不像前面介绍的格式那样流行，不少网络API还是支持XML编码的。

XML文档结构类似一棵树。读取内容时，我们首先访问根节点（通常来说，这个节点后面会跟着XML的声明；每个XML文档都要以这样的声明开头）。在我们的例子中，根节点是。一个...中包含了一系列...。

当心：xml模块不安全。处理未知来源的XML消息时必须得小心。攻击者可能访问本地文件，发动DoS攻击等等。

xml模块的文档参见：

https://docs.python.org/3/library/xml.html

1. 准备

要实践这个技法，你要先装好pandas和xml模块。此外没有要求了。

2. 怎么做

从XML文件直接向一个pandas DataFrame对象读入数据需要些额外的代码：这是由于XML文件有特殊的结构，需要针对性地解析。接下来的章节，我们会详细解释这些方法。源代码可在read_xml.py文件中找到：

importpandas as pd

importxml.etree.ElementTree as ET

defread_xml(xml_tree):

'''

读入XML数据，返回pd.DataFrame

'''

defiter_records(records):

'''

遍历所有记录的生成器

'''

defwrite_xml(xmlFileName, data):

'''

以XML格式保存数据

'''

defxml_encode(row):

'''

以特定的嵌套格式将每一行编码成XML

'''

# 读出和写入数据的文件名

r_filenameXML='../../Data/Chapter01/realEstate_trans.xml'

w_filenameXML='../../Data/Chapter01/realEstate_trans.xml'

# 读取数据

xml_read=read_xml (r_filenameXML)

# 打印头10行记录

print(xml_read.head(10))

# 以XML格式写回到文件

write_xml(w_filenameXML, xml_read)

3. 原理

我们一步步分析前面的代码。首先引用需要的模块。xml.etree.ElementTree是一个轻量级XML解析器，我们用它来解析文件的XML结构。和之前一样，分别将读取和写入的文件名定义为变量（r_filenameXML，w_filenameXML）。

使用read_xml(...)方法从XML文件读取数据：

defread_xml(xmlFileName):

withopen(xmlFileName,'r') as xml_file:

# 读取数据，以树的结构存储

tree=ET.parse(xml_file)

# 访问树的根节点

root=tree.getroot()

# 返回DataFrame

returnpd.DataFrame(list(iter_records(root)))

这个方法只消传入文件名这一个参数。首先，打开文件。使用.parse(...)方法，我们由XML文件创建了一个树状结构并存入tree对象。接着，在tree对象上用.getroot()方法提取根节点：这是进一步处理数据的前提。最后一行调用iter_records方法，传入根节点的引用，进而将返回的信息转换成DataFrame：

defiter_records(records):

forrecordinrecords:

# 保存值的临时字典

temp_dict={}

# 遍历所有字段

forvarinrecord:

temp_dict[

var.attrib['var_name']

]=var.text

# 生成值

yieldtemp_dict

iter_records方法是一个生成器：顾名思义，这个方法生成一些值。普通方法结束时（return语句）一次性返回所有的值；生成器不同，每次只向调用方返回一个值（即yield关键字），直到结束。

更深入地讨论生成器，建议阅读

https://www.jeffknupp.com/blog/2013/04/07/improve-your-python-yield-and-generators-explained/

我们的iter_records方法，每读入一行，就返回一个temp_dict字典对象给read_xml方法。字典中每个元素的键名对应XML中元素的var_name属性。（有这样的格式：。）

标签可能有其它名字的属性——这些属性会存在.attrib字典（XML树节点一个属性）并通过各自的名字访问——参考代码中高亮的部分。

的值（...内的部分）可通过XML节点的.text属性访问，而.tag属性存储其名字（这个例子中就是var）。

read_xml方法的return语句从传入的所有字典中创建一个列表，转换成DataFrame。

我们使用write_xml(...)方法，以XML格式写入数据：

defwrite_xml (xmlFileName, data):

withopen(xmlFileName,'w') as xmlFile:

# 写头部

xmlFile.write(

'n'

)

xmlFile.write('n')

# 写数据

xmlFile.write(

'n'.join(data.apply(xml_encode, axis=1))

)

# 写尾部

xmlFile.write('n')

这个方法打开xmlFileName参数指定的文件。每个XML文件需要以XML声明开头（参考本技法的导论）。接着，我们写了XML schema的根节点，。

接下来就是写数据。使用DataFrame对象的.apply(...)方法遍历内部每一行。第一个参数指定了要应用到每行记录上的方法。axis参数的默认值为0。意味着指定的方法会应用到DataFrame的每一列上。指定为1，我们让.applay(...)方法将指定的xml_encode(...)方法应用到DataFrame的每一行上。使用xml_encode(...)方法处理data DataFrame的每一行：

defxml_encode(row):

# 第一步——输出record节点

xmlItem=['']

# 第二步——给行中每个字段加上XML格式…

forfieldinrow.index:

xmlItem

.append(

' {1}'

.format(file, row[field])

)

# 最后一步——标记record节点的结束标签

xmlItem.append('')

# 返回一个字符串

return'n'.join(xmlItem)

代码生成了一个字符串列表，xmlItem。列表的首元素是，尾元素是。对行中每个字段，我们以>的格式封装，并加进字符串列表。加粗部分指的是列名（）和对应的值（）。

解析完所有字段后，使用'n'.join(...)方法，将xmlItem列表中所有项连接成一个长字符串。...标签之间以n分隔。这个字符串被返回给调用方（write_xml）。记录在write_xml(...)方法中进一步连接，并输出到文件。最后加上闭合标签，大功告成。

05 用pandas解析HTML页面

尽管以前面介绍的格式保存数据是最常见的，我们有时还是要在网页表格中查找数据。数据的结构通常包含在

标签内。本技法会介绍如何从网页获取数据。

1. 准备

要实践这个技巧，你要先装好pandas和re模块。re是Python的正则表达式模块，我们用它来清理列名。另外，使用pandas 的read_html(...)方法要预装html5lib模块。如果你使用的是Anaconda发行版Python，使用下面的命令就可以：

conda install html5lib

如果不是，你可以从

https://github.com/html5lib/html5lib-python

下载源代码。解压，手动安装模块：

cd html5lib-python-parser

python setup.py install

此外没有要求了。

2. 怎么做

pandas可以很方便地访问、提取、解析HTML文件。两行代码就能搞定。retrieve_html.py可不止两行，这些我们下一环节再讨论：

# 要调用的url

url = 'https://en.wikipedia.org/wiki/' +

'List_of_airports_by_IATA_code:_A'

# 从HTML提取数据

url_read = pd.read_html (url, header = 0 )[ 0 ]

3. 原理

pandas 的read_html(...)方法解析HTML文件的DOM结构，从所有table节点中提取数据。第一个参数可以是URL、文件或HTML标签原始字符串。第二个参数指定header = 0，忽略了表头。

read_html(...)方法返回了一个DataFrame对象的列表，每项对应于HTML文件中一个table。Wikipedia的机场页面只包含了一个table，所以我们只要取DataFrame列表的首元素。是的，就是这样！机场列表已经在url_read对象中了。

拿到的数据还有两点瑕疵：列名包含空白字符，数据包含分隔行。对于名字中可能包含多种空白字符（空格符、制表符等）的问题，我们使用re模块：

importre

# 匹配字符串中任意空白字符的正则表达式

space=re.compiler(r's+')

deffix_string_spaces (columnsToFix):

'''

将列名中的空白字符换成下划线

'''

tempColumnNames=[]# 保存处理后的列名

# 循环处理所有列

foritemincolumnsToFix:

# 匹配到

ifspace.search (item):

# 处理并加入列表

tempColumnNames

.append('_'.join (space.split (item)))

else:

# 否则直接加入列表

tempColumnNames.append (item)

returntempColumnNames

首先，编译那个匹配出至少一个空白字符的正则表达式。

对正则表达式的详细讨论超出了本书的知识范围。关于这个主题，有个知识手册写得挺好的：

https://www.packtpub.com/application-development/mastering-python-regular-expressions

或者参考re模块的文档：

https://docs.python.org/3/library/re.html

然后循环处理列，找到空白字符（space.search(...)）时，将列名拆开（space.split(...)）存入列表。以’_’为间隔，连接列表元素。如果不含空白字符，就将原始列名加入列表。使用下面这行代码处理DataFrame中的列名：

url_read.columns=fix_string_spaces (url_read.columns)

查看Wikipedia上的机场表，你会发现它根据前两个字母分组，组与组之间有分隔行。分隔行中缺失了其它列。为了处理这个问题，我们使用DataFrame的.dropna (...)方法。

pandas有多种方法用于处理NaN（Not a Number）情况。估算缺失值会介绍.fillna (...)方法。

.dropna (...)方法删掉缺少任意字段数据的行（或者列）。调用.dropna (...)时很容易不传任何参数，这样即便是合理的行，只要缺了夏时制（Daylight Saving Time, DST）或国际民航组织机场代码，也会被删掉。我们可以设道门槛。

粗粗浏览下数据可以发现，有些合理的行最多会缺两个字段。参数inplace=True直接在原来的DataFrame对象上移除数据，而非复制出一个DataFrame、清理后再返回；默认值是inplace=False：

url_read.dropna (thresh=2, inplace=True)

移除一些行后，DataFrame的索引会产生空洞。可以使用这行代码：

url_read.index=range(0,len(url_read))

下面这行代码输出头10行IATA代码及对应的机场名：

print(url_read.head (10)[['IATA','Airport_name']])

如果想取出不止一列，可以以列表的形式传入；在我们的例子中，就是['IATA', 'Airport_name']。下面的代码是等效的：

print(url_read[0:10] [['IATA','Airport_name']])

关于作者：托马兹·卓巴斯（Tomasz Drabas）微软数据科学家，致力于解决高维特征空间的问题。他有超过13年的数据分析和数据科学经验：在欧洲、澳大利亚和北美洲三大洲期间，工作领域遍及高新技术、航空、电信、金融和咨询。

本文摘编自《数据分析实战》，经出版方授权发布。

你可能感兴趣的:(pythoncsv数据类型)

Java自动拆箱机制
在黑马点评项目中，提到了一个细节，就是Java的自动拆箱机制，本文来简单了解一下。Java的自动拆箱机制（Unboxing）是一种编译器层面的语法糖，用于简化包装类对象（如Integer、Boolean、Long等）与基本数据类型（如int、boolean、long等）之间的转换。它的核心作用是让开发者无需手动调用intValue()、booleanValue()等方法，即可直接在包装类对象和基本
python中的字典类型_Python中字典数据类型石墨稀 python中的字典类型
一.创建字典方法①:>>>dict1={}>>>dict2={'name':'earth','port':80}>>>dict1,dict2({},{'port':80,'name':'earth'})方法②:从Python2.2版本起>>>fdict=dict((['x',1],['y',2]))>>>fdict{'y':2,'x':1}方法③:从Python2.3版本起,可以用一个很方便的内建
Python 中的列表（List）和元组（Tuple） shangjg3 Python python 开发语言
1.定义与语法差异1.列表的定义列表使用方括号`[]`定义，元素之间用逗号分隔。列表的元素可以是不同数据类型，甚至嵌套其他列表或元组。my_list=[1,"hello",True,[2,3]]2.元组的定义元组使用圆括号`()`定义，同样支持混合数据类型。需要注意的是，定义单元素元组时必须在元素后加逗号，以区别于数学表达式中的括号。my_tuple=(1,"world",False,(4,5))
数据类型（列表）
列表[]列表是一个数据的集合，集合内可以放任何数据类型，可对集合进行方便的正删改查操作。（值可以重复，有序）定义：[]内以逗号分隔，按照索引，存放各种数据类型，每个位置代表一个元素特性：1.可存放多个值2.按照从左到右的顺序定义列表元素，下标从0开始顺序访问，有序3.可修改指定索引位置对应的值，可变创建L1=[]#定义空列表L2=['a','b','c','d']#存4个值，索引为0~3L3=['
列表简单数据类型天池小晨 python
整型浮点型布尔型容器数据类型列表元组字典集合字符串1.列表的定义列表是有序集合，没有固定大小，能够保存任意数量任意类型的Python对象，语法为[元素1,元素2,...,元素n]。关键点是「中括号[]」和「逗号,」中括号把所有元素绑在一起逗号将每个元素一一分开2.列表的创建创建一个普通列表【例子】1x=['Monday','Tuesday','Wednesday','Thursday','Frid
JavaSE -- 数组详细讲解（数组介绍，Arrays常用方法，二维数组创建）
数组简介数组是引用数据类型，是一种容器。是一组相同类型数据的组合，将这一组数据做统一管理。栈内存中只存有数组的引用（地址）数组中的变量类型如果是基本数据类型（int，double），则基本类型元素值直接存在堆内存的数组对象内部如果是引用数据类型（String），则这些引用类型的地址（引用）存储在堆内存的数组对象内部。而这些引用数据单独存储在堆内存的其他位置，数组中的地址指向他们。数组声明数组创建出
Redis入门教程（一）：基本数据类型
一、Redis是什么？为什么你需要它？Redis（RemoteDictionaryServer）是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息中间件。与传统的关系型数据库不同，Redis将数据存储在内存中，使其读写速度达到惊人的11万次读/秒和8.1万次写/秒。同时支持数据持久化，重启后数据不丢失，完美平衡了速度与可靠性。Redis的五大核心优势：丰富的数据结构：支持字符串（Str
Milvus向量数据库集合操作初尝试麦克阿建 milvus
目录1.集合（Collection)2.字段（Field）3.索引（Index）4.分区（Partition）5.实体（Entity）6.代码示例6.1集合创建6.2向量插入6.3向量查询6.4向量删除1.集合（Collection)集合是Milvus中存储数据的最基本单元。它类似于数据库中的一个表（table）。集合定义了数据的整体结构，包括数据类型、字段、索引等。作用：集合是你数据的容器，用来
JAVA 和Python对比 xiayu98020214 在深蓝的日子 python
JAVA和Python对比1.数据类型pythonInt，float，complexnumbers都没有定义到底占用多少个字节空间。都是没有取值范围，也没有无符号的情况。JAVAJAVA有基础数据类型，都有确定占多少个字节2.全局变量python类似c语言，可以定义全局变量，全局的函数。JAVAjava都要定义类才行。3.变量声明python无需声明类型，直接使用。会造成一个困扰，这个变量到底是新
JavaScript基本语法（二）——数据类型 OmewSPG
常用数据类型#ECMAScript有6种简单的数据类型（原始类型）：Undefined，Null，Boolean，Number，String和Symbol（ES6新增Symbol类型的值，在此不会过多涉及）此外还有一种复杂的数据类型：Object在ECMAScript中无法定义自己的数据类型，所有值都必须采用以上七种数据类型之一来进行表示，好在ECMAScript数据类型比较灵活，一种数据类型可以
基于 Vue3 + ECharts 实现渐变分段折线图：支持动态区间、响应式渲染与颜色控制 saadiya~ echarts 信息可视化前端
在数据可视化项目中，折线图是最常见的图表类型之一，而通过颜色分段渐变可以让用户更加直观地感知数据的变化趋势和区间风险。本文将带你实战一个基于Vue3+ECharts的渐变分段折线图组件，支持传入valueList控制每段颜色，适配多种数据类型，实现图表的动态更新与响应式自适应。一、效果预览与场景说明该组件可应用于以下场景：空气质量指标（AQI）路况拥堵指数（如：0-0.5畅通，0.5-1一般，1-
java学习笔记
期末课堂作业,以下内容为2024年上学期java课堂学习笔记202402150705目录[第1章:Java语言概述](#第1章:Java语言概述)[第2章:数据类型与运算符](#第2章:数据类型与运算符)[第3章:控制流程语句](#第3章:控制流程语句)[第4章:数组](#第4章:数组)[第5章:类与对象](#第5章:类与对象)[第6章:封装、继承与多态](#第6章:封装、继承与多态)[第7章:异
大学专业科普 | 计算智能、信息学与大数据鸭鸭鸭进京赶烤大数据
一、专业背景随着信息技术的飞速发展，数据的产生速度呈爆炸式增长，传统数据处理技术已经无法满足如此庞大的数据量和复杂的数据类型，大数据专业应运而生，旨在培养能够应对大数据挑战的专业人才。二、主要课程内容数学基础课程高等数学、概率论与数理统计、线性代数是大数据分析的核心数学基础，为数据处理、算法优化和模型构建提供必要的理论支持。计算机基础课程数据结构与算法、计算机网络、操作系统是大数据技术的重要支撑，
Reids 子柒s redis 数据库
标题目录Redis概述Redis数据库特点Redis应用场景Redis安装RockyLinux操作系统Windows操作系统Mac操作系统Redis服务启动失败解决方案配置文件详解常见数据类型全局命令String类型字符串数值应用场景列表List基本命令应用场景Hash散列特性基本命令应用场景Set类型基本命令应用场景SortedSet类型有序集合示例基本命令应用场景数据持久化RDB数据持久化SA
C++之constexpr和常量表达式掘根 c++开发语言
常量表达式常量表达式(constexpression)是指值不会改变并且在编译过程就能得到计算结果的表达式。显然，字面值属于常量表达式，用常量表达式初始化的const对象也是常量表达式。后面将会提到，C++语言中有几种情况下是要用到常量表达式的。一个对象(或表达式)是不是常量表达式由它的数据类型和初始值共同决定，例如：constintmax_files=20;//max_files是常量表达式co
XLua个人学习——C#访问Lua 一枚骰子学习 lua 开发语言 xLua
目录0.引言1.访问基本数据类型全局变量2.访问全局的table2.1.映射到class或struct2.2.映射到一个interface2.3.映射到List、Dictionary2.4.映射到LuaTable类3.访问全局函数3.1映射到delegate3.2映射到LuaFunction4.官方使用建议0.引言本文是个人学习xLua中C#访问Lua的一些知识点总结。参考教程的是官方教程:xLu
【漫谈C语言和嵌入式002】嵌入式中的大小端 Seraphina_Lily 漫谈C语言和嵌入式 c语言开发语言
在计算机科学中，"端序"（Endianness）是指多字节数据类型（如整数或浮点数）在内存中的存储方式。主要分为两种：大端模式（Big-Endian）和小端模式（Little-Endian）。大端模式(Big-Endian)在大端模式中，多字节数据类型的最高有效字节（MSB）被存储在最低的内存地址上，而最低有效字节（LSB）则被存储在最高的内存地址上。这种存储方式与人类通常读数的方式一致，因此有时
【031】2020.12.13 周日 Java类文件结构算法成瘾者
Java类文件结构1.无关性基石虚拟机和字节码存储格式2.Class类文件的结构2.1）定义Class文件是一组以8字节为基础单位的二进制流2.2）Class文件格式：类似于C语言结构体的伪结构存储两种数据类型无符号数u1,u2,u4,u8表_info结尾某一类型的“集合”2.3)魔数与Class文件的版本魔数定义：每个Class文件的头4个字节被称为“魔数”(magicnumber)作用：确定是
MySQL（1）哪里不会点哪里. MySQL mysql 数据库
目录数据库的简介MySQL数据库的安装和卸载MySQL数据库概念SQL语言（操作数据库）SQL的分类数据库的操作（CURD）创建数据库（重点）查看数据库（重点）删除数据库（重点）修改数据库表结构操作（CURD）创建表数据库的数据类型（重点）单表的约束（了解）删除和查看表修改表数据的操作（CRUD）（重点）插入数据（insert）MySQL插入中文数据乱码修改数据（update）删除数据（delet
(九)set结构我拥抱着我的未来
set结构map,set结构都可以用foreach循环出来。set不允许插入重复的值，map键值对没有限制/*数据结构:set*集合:可以存储任何数据类型，并且唯一(不重复的值)*/constset2=newSet([1,true,'string']);console.log(set2);constset1=newSet();//往set1中添加数据set1.add(100);set1.add("
C语言学习——数组许白掰 C语言学习 c语言学习算法
目录一、初探程序中的数组1.数组的概念2.数组的定义3.数组元素的访问二、数组特性深入剖析1.数组的初始化2.数组的内存分布三、多维数组1.多维数组的定义2.数组类型3.二维数组4.多维数组初始化注意事项一、初探程序中的数组1.数组的概念数组是相同数据类型变量的有序集合—数组作为整体需要一个合法的命名（数组名）—数组中的变量没有独立命名，只有在数组中的编号—数组中的变量数量是固定不变的（数组大小固
Python高级数据类型：字典（Dictionary） PythonicCC python 开发语言
字典是Python中非常重要且实用的数据结构，本文将全面详细地介绍字典的所有知识点，从基础概念到高级用法，帮助初学者彻底掌握字典的使用。1.字典简介1.1为什么需要字典？假设我们需要存储公司员工的姓名、年龄、职务和工资信息。使用列表可以这样实现：staff_list=[["tom",20,"teacher",6000],["rose",18,"hr",5000],["jack",20,"行政",4
【小白记录python】——类（class）的简单解释 faderbic python 开发语言
目录什么是类类和函数的区别构建一个类什么是类在编程中，类（Class）是一种用户自定义的数据类型，它将数据（通常称为属性或成员变量）和对这些数据进行操作的函数（通常称为方法或成员函数）封装在一起，相比于一般的函数更方便调用，通俗来讲，类就是很多函数的集合，这些函数共用一个数据源。类可以被看作是创建对象的模板或蓝图。通过类，可以创建多个具有相同结构和行为的对象实例。以下是对类的几个关键特点的解释：数
(新手友好)MySQL学习笔记(11):索引（前缀索引，聚簇索引，覆盖索引，最左前缀原则，索引设计原则，索引使用原则，索引失效的常见场景）李白洗一夜学习笔记
目录前缀索引聚簇索引覆盖索引（索引覆盖）最左前缀原则索引设计原则索引使用原则索引失效的常见场景前缀索引索引开头的部分字符，可以大大节约索引空间，提高索引效率。如TEXT数据类型必须使用前缀索引，因为MySQL不允许索引这些列的完整长度。InnoDB索引最大长度为767字节。最简单的理解就是在索引表中存储的不是索引字段的完整字段值，而是索引字段的前一部分字段值，比如：createindexIn_sn
2.数据类型-上玄月初二丶 C语言0基础算法 c语言开发语言
1.整型概念：表达整数类型的数据语法：inta=123;//定义了一个专门用来存储整数的变量a需要注意的地方：int的本意是integer，即整数的意思inta代表在内存中开辟一块小区域，称为a，用来存放整数，a一般被称为变量。变量a所占内存大小，在不同的系统中是不一样的，64位系统典型的大小是4个字节。变量a有固定的大小，因此也有取值范围，典型的范围是：-2147483648到214748364
C++入门教程笔记·基本语法数据类型
编写不易，请勿搬运嵌入式开发学C++有必要嘛首先嵌入式开发的常用工具，keil5，Vscode，Esp-idf三个编译工具中都是支持C++语言的，也就是说常见芯片种类ST、ESP、等芯片类型都能够使用C++进行开发，同时在公司工程中，对于使用C++开发的工程对于项目的后续维护，改版都是需要懂C++的，所以能看懂C++，学好C++非常有必要。同时在ST开发的hal库中的函数驱动底层抽象库中，都是使用
C语言自学日记（三）变量与常量
初学者肯定很懵逼，变量是什么？常量是什么？在数学中，令x=1或者令x=1.10在纸上一写便是，但我们要是在C语言中应该怎么办？在这里我们写一段简单的两端代码#includeintmain(){intx;x=1;return0;}int是什么，如果对前文了解的，应该能明白这是一种数据类型，名为整数类型，它的语法是：数据类型变量名；看到这里，我们就可以对变量做一个简单的介绍，确定目标并提供存放的空间。
信息学奥赛初赛天天练-27-CSP-J2022阅读程序位运算、数据类型范围、进制转换攻略 ya888g 信息学奥赛初赛信息学奥赛位运算数据类型范围进制转换
PDF文档公众号回复关键字:202406122022CSP-J阅读程序1阅读程序(判断题1.5分选择题3分共计40分)01#include0203usingnamespacestd;0405intmain()06{07unsignedshortx,y;08cin>>x>>y;09x=(x|x<<2)&0x33;10x=(x|x<<1)&0x55;11y=(y|y<<2)&0x33;12y=(y|y
Java程序设计笔记是程序蜂啊 java 笔记开发语言
Java程序设计目录Java程序设计第一章java语言开发环境1.1工具篇1.2Eclipse调整字体第三章Java基础3.1java基本数据类型3.2关键字与标识符3.3常数3.4变量3.5.数据类型转换3.6由键盘输入数据4.1顺序结构4.2分支语句5.1什么是数组5.2数组赋值：5.3一维数组5.4二维数组6.1类的基本概念6.2定义类6.3对象的创建与使用6.4参数的传递第七章java语言
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源