大数据

大数据挖掘应用与分析

第一讲环境部署
1.大数据无法在可承受时间范围内常规软件工具进行捕捉、管理和处理的数据结合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
数据挖掘(Data Mining)是有组织有目的的收集数据,通过分析数据使其成为信息。从而在大量数据中寻找潜在规律以形成规则或知识的技术。
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中数据分析可帮助人们做出判断,以便采取适当行动。
2.python语言特征与历史
Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
大数据_第1张图片
特征
(1)编译性语言:C、C++需编译,运行速度快
(2)解释性语言:python平台兼容性
(3)动态语言:python运行时,检测数据类型不用声明
(4)静态语言:c、c++、java编译时,检测数据类型需要使用前声明
(5)强数据类型 数据类型,仅能强制转换类型安全的语言
(6)弱数据类型 一个变量可赋予不同数据类型的值
总结:python是一门动态解释性的强数据类型的值。
3.python环境部署
大数据_第2张图片

第二讲基本知识

1.基本知识:变量、语句、缩进、注释
海量命名规则
(1)标识符只能由字母、数字或下划线组成。
(2)标识符的第一个字符不能是数字。
(3)标识符区分大小写
(4)关键字不能声明为标识符,例如
‘and’,‘as’,‘break’,‘class’,‘continute’,等。

命名规范:小写字母,单词之间用_分割,见名知意。
python程序由python语句组成,通常一行编写一个语句。
加粗样式例如:
print(‘Hello’)
print(‘I am python’)
python语句可以没有结束符,不像c或c#那样在语句后面必须有分号(;)表示结束。当然,python程序中也可以根据习惯在语句后面使用分号(;)
也可以把多个语句写在一行,此时就要在语句后面加上分号(;)表示结束。
例如:
print(‘Hello,’);print(‘I am python’);
语句特征:执行修改操作,表达式是用来计算的,语句是用来执行的。
缩进
在代码行前面添加空格,这样做可以使程序更有层次、更有结构感,从而使程序更易读。在python程序中,缩进不是任意的。平级的语句行(代码块)的缩进必须相同。
注释
单行注释:井号
多行注释:三引号(3个三引号或者三个双引号)
输入与输出
(1)输入

     python2.7
     name=raw_input("What is your name?")
     python3.X
     name=input("What is your name?")
   

(2) 输出

python2.7
print name
python 3.X
print(name)

第三讲条件语句与循环语句

1.数据类型
六种标准数据类型
numbei(数字):int、float、bool
str(字符串) list(列表)tuple(元组)set(集合)dict(字典)
不可变数据类型
number(数字)、str(字符串)、tuple(元组)
可变数据类型
list(列表)dict(字典)、set(集合)

number(数字)
支持int、float、bool、complex(复数)
str(字符串)
python中的字符串用单引号(‘)或双引号(“)括起来,同时使用反斜杠(\)转义集合特殊字符。
set(集合)是一个无序不重复元素的序列。基本功能是进行成员关系测试和删除重复元素。可以使用大括号**{ }或者set()**函数创建集合。
注意:创建一个空集合必须用set()而不是 { },因为{ }是用来创建一个空字典lie。
list(列表)
列表,可重复,可修改
列表是写在方括号([])之间、用逗号分隔开的元素列表。索引值以0为开始值,-1为从末尾的开始位置。加号(+)是列表连接运算符,星号(*)是重复操作。
tule(元组)
元组(tuple)与列表类似,不同之处在于
元组的元素不能修改
。元组写在小括号()里,元素之间用逗号隔开。
2.运算符
python语言支持以下类型的运算符:
算术运算符,比较运算符,赋值运算符,逻辑运算符,成员运算符,身份运算符
运算符优先级
3条件语句
if语句

if condition_1:
statement_block_1
elif condition_2:
statement_block_2
else:
statment_block_3

4循环语句
for循环的一般格式如下

for<variable> in <sequence>:
<statements>
else:
<statements>

**

第四讲数字猜谜

**

大数据_第3张图片

你可能感兴趣的:(大数据)