E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据技术原理与应用
大数据技术原理与应用
-林子雨版-课后习题答案
第一章1.试述信息技术发展史上的3次信息化浪潮及具体内容。信息化浪潮发生时间标志解决问题代表公司第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等第三次浪潮2010年前后物理网、云计算和大数据信息爆炸将涌现出一批新的市场标杆企业2.试述数据产生方式经历的几个阶段答:运营式系统阶
wjw1014
·
2020-06-29 06:51
大数据
大数据技术原理与应用
——分布式文件系统HDFS
分布式文件系统概述相对于传统的本地文件系统而言,分布式文件系统(DistributeFileSystem)是一种通过网络实现文件在多台主机上进行分布式存储的文件系统。分布式文件系统的设计一般采用“客户/服务机”模式,客户端以特定的通信协议通过网络与服务器建立连接,提出文件访问请求,客户端和服务器可以通过设置访问权限来限制请求方对底层数据存储块的访问。目前,已经得到广泛应用的分布式文件系统主要包括G
weixin_38166557
·
2020-06-28 20:24
【学习笔记】
大数据技术原理与应用
(MOOC视频、厦门大学林子雨)
1大数据概述大数据特性:4vvolumevelocityvarietyvalue即大量化、快速化、多样化、价值密度低数据量大:大数据摩尔定律快速化:从数据的生成到消耗,时间窗口小,可用于生成决策的时间非常少;1秒定律,这和传统的数据挖掘技术有着本质区别(谷歌的dremel可以在1秒内调动上千台服务器处理PB级数据)价值密度低,商业价值高大数据影响:对科学研究影响:出现科学研究第四方式数据(前三个分
weixin_30437847
·
2020-06-27 19:20
大数据技术原理与应用
——大数据概述
这篇博文里的好多内容之前在读《大数据时代》时读到过,所以就算是补上的读书笔记?信息科技为大数据时代提供技术支撑1.存储设备容量不断增加2.CPU处理能力大幅提升3.网络带宽不断增加数据产生方式的变革促成大数据时代的来临1.运营式系统阶段2.用户原创内容阶段3.感知式系统阶段大数据的概念关于“什么是大数据”这个问题,大家比较认可关于大数据的“4V”说法。大数据的4个“V”,或者说是大数据的四个特点,
weixin_30374009
·
2020-06-27 18:27
大数据技术原理与应用
第8讲:Hadoop再探讨
Hadoop再探讨单元测验1单选(2分)下列说法正确的是A.第二名称节点无法解决单点故障问题B.第二名称节点是热备份C.HDFSHA提供高可用性,可以实现可扩展性、系统性能和隔离性D.HDFSHA可用性不好2单选(2分)HDFSFederation设计不能解决“单名称节点”存在的哪个问题A.良好的隔离性B.性能更高效C.单点故障问题D.HDFS集群扩展性3多选(3分)下列哪些是Hadoop1.0存
周杰伦今天喝奶茶了吗
·
2020-06-26 12:21
Everyday
大数据技术原理与应用
第7讲:MapReduce
MapReduce分布式并行编程MapReduce单元测验1单选下列说法错误的是A.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写B.Map函数将输入的元素转换成形式的键值对C.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个SlaveD.不同的Map任务之间不能互相通信2单选在使用MapReduce程序WordCount
周杰伦今天喝奶茶了吗
·
2020-06-26 12:20
Everyday
大数据技术原理与应用
-林子雨课后(部分习题答案)
第一章2.试述数据产生经历的几个阶段答:3个阶段1.运营式系统阶段人类社会最早大规模管理和使用数据,是从数据库的诞生开始的。大型零售超市销售系统、银行交韩系统、股市交易系统、医院医疗系统、企业客户管理系统等大量运营式系统,都是建立在数据库基础之上的,数据库中保存了大量结构化的企业关键信息,用来满足企业各种业务需求,在这个阶段,数据的产生方式是被动的,只有当实际的企业业务发生时,才会产生新的记录并存
河大灬辉のcsdn
·
2020-06-25 22:50
hadoop
大数据
林子雨_
大数据技术原理与应用
课后习题
写在前面最近正在学习大数据技术,看到林子雨老师版的
大数据技术原理与应用
,经过学习后,根据课本及部分参考资料,完成了以下的课后习题练习。涵盖该书的1-13章。
NPU_阿夏
·
2020-06-25 18:15
大数据Hadoop
HadoopCAP理论
大数据技术原理与应用
——概念、存储、处理、分析与应用C(强一致性):系统在执行过某项操作后仍然处于一致的状态。
Col_
·
2020-06-24 09:59
大数据hadoop简答题
参考:《
大数据技术原理与应用
》——林子雨人民邮电出版社分布式文件系统HDFS名称节点是什么?
junior19
·
2020-06-23 23:52
Hadoop
HBASE SHELL命令和JAVA API编程
《
大数据技术原理与应用
》教材配套上机练习HBaseShell命令和JavaAPI编程实践目录1作业题目...12作业目的...13作业性质...14作业考核方法...15作业提交日期与方式...16实验平台
Sing___546
·
2020-06-22 05:51
Hadoop常用的HBase操作
《
大数据技术原理与应用
》上机练习熟悉常用的HBase操作目录1作业题目...12作业目的...13作业性质...14作业考核方法...15作业提交日期与方式...16实验平台...17实验内容和要求..
Sing___546
·
2020-06-22 05:51
大数据技术原理与应用
笔记(1)——大数据概述
大数据概述《大数据技术与原理》课程笔记目录1.1大数据概念1.2数据产生方式1.3技术支撑1.4大数据的影响1.5大数据的关键技术1.6大数据的计算模式1.1大数据概念(1)数据量大/“大量化”(2)数据类型繁多/“多样化”10%结构化数据,90%非结构化数据(3)处理速度快/“快速化”1秒定律——秒级决策(4)价值密度低,商业价值高/“价值化”1.2数据产生方式运营式系统阶段——>用户原创内容阶
Lzzwwen
·
2020-06-22 00:35
大数据技术与原理
大数据技术原理与应用
—课后题答案(第一章)
大数据技术原理与应用
_林子雨版_课后题答案(第一章)1.试述信息技术发展史上的3次信息化浪潮及具体内容。
Finderme
·
2020-06-21 19:40
大数据技术原理与应用课后题答案
大公司都在做的大数据平台,为你精选这一份书单
大数据技术栈系列书单
大数据技术原理与应用
(1)概念篇:介绍当前紧密关联的*新IT
程序员书单
·
2020-06-20 22:58
程序员书单
大公司都在做的大数据平台,为你精选这一份书单
大数据技术栈系列书单
大数据技术原理与应用
(1)概念篇:介绍当前紧密关联的*新IT
程序员书单
·
2020-06-12 07:00
大公司都在做的大数据平台,为你精选这一份书单
大数据技术栈系列书单
大数据技术原理与应用
(1)概念篇:介绍当前紧密关联的*新IT
黄小斜
·
2020-06-09 22:00
大数据技术原理与应用
之第四章习题
大数据技术原理与应用
之第四章习题1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系答:HBase利用HadoopMapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper
小猪仔-
·
2020-03-28 17:16
大数据
大数据技术原理与应用
实验五
实验:五实验题目:熟悉常用的HDFS操作-利用JavaAPI编程实现1.实验目的·熟悉HDFS操作常用的JavaAPI。2.实验平台·Hadoop2.7.1·Eclipse·jdk3.实验内容·在eclipse软件(或者其他JavaIDE),使用java语言编写能实现下面功能的程序:在hdfs上,创建新文件夹如input。从本地系统上传一个文件txt文件到hdfs上读取刚上传的文件的内容对刚读取的
@阿证1024
·
2020-03-27 14:57
JAVA
大数据
[
大数据技术原理与应用
笔记]第11讲. 流计算
11.1流计算概念流计算:实时获取来自不同数据源的海量数据经过实时处理获得有价值的信息11.4Storm基本术语Streams:流数据,无界的tuple序列。Storm将流数据strams描述成一个无界的tuple序列,这些Tuple序列会以分布式的方式并行的创建和处理。每个tuple是一堆值,每个值有一个名字且每个值可以是任意类型,但发送方和接收方对tuple的字段都已经约定好了,因此不需要填入
自然语言不理解
·
2020-02-20 23:03
大数据
[
大数据技术原理与应用
笔记] 第10讲. Spark
10.1Spark与Hadoop的对比Spark相比于HadoopMapReduce的优缺点Spark的计算模式也属于MapReduce,但不限于Map和Reduce操作,提供了多种数据集操作类型,编程模式比HadoopMapReduce更灵活Spark基于DGA(有向无环图)的任务调度执行机制,要优于HadoopMapReduce的迭代执行机制提供了内存计算,可将中间结果放到内存,对于迭代效率更
自然语言不理解
·
2020-02-19 18:21
大数据
spark
[
大数据技术原理与应用
笔记]第八讲.数据仓库Hive
8.2Hive简介Hive利用了HDFS的分布式文件系统存储数据,利用MapReduce分布式并行计算模型处理数据.提供HiveQL运行具体的MapReduce任务两个特性:(1).采用批处理的方式处理海量数据。数据仓库存储的是静态数据,适合采用批处理的方式,不需要快速响应;HiveQL转换为MapReduce任务;Pig和Hive:Pig轻量级分析工具,实时的交互性的分析,而不是大规模数据的批处
自然语言不理解
·
2020-02-14 05:56
大数据
[
大数据技术原理与应用
笔记] 第七讲 MapReduce
7.1MapReduce模型简介传统数据处理理念:数据向计算靠拢MapReduce理念:计算向数据靠拢,即将应用程序分发到数据所在的机器具体来说就是当要处理数据块A的时候,将距离数据块A最近的map分配给数据块A,而往往它们是在同一块机器上的MapReduce架构:Master/Slave7.2MapReduce体系结构几个概念JobTrackerTaskTracker:接收JobTracker发
自然语言不理解
·
2020-02-12 19:50
mapreduce
大数据入门 | 三、分布式文件系统HDFS
本文大部分内容转自初步掌握HDFS的架构及原理,并参考了网易云课堂《
大数据技术原理与应用
》课程Chapter3的内容。01什么是分布式文件系统?
Littletree_Zou
·
2020-01-01 10:04
第1讲大数据概述|
大数据技术原理与应用
-学习笔记
文章原创,最近更新:2018-09-31.大数据时代2.大数据概念和影响3.大数据的应用4.大数据的关键技术5.大数据与云计算、物联网学习参考链接:1.
大数据技术原理与应用
1.大数据时代在2010年之后就出现了大数据时代
durian221783310
·
2020-01-01 04:29
《
大数据技术原理与应用
》第二版-第三章分布式文件系统HDFS
3.1分布式文件HDFS默认一个块的大小是64MB,与普通文件不同的是如果一个文件小于数据块的大小,它并不占用整个数据块的存储空间。主节点又叫名称节点;另一个叫从节点又叫数据节点。名称节点负责文件和目录的创建、删除和重命名,同时管理数据节点和文件块的映射关系。数据节点负责数据存储和读取。3.2HDFS的相关概念MapReduce中的map一次只处理一个块中的数据。HDFS抽象块的概念可以带来一下好
睿晞
·
2019-12-22 00:00
《
大数据技术原理与应用
》第二版-第二章大数据处理架构Hadoop
2.1概述Hadoop是Apache旗下的开源分布式计算平台,是基于Java开发的,具有很好的跨平台特性,其中核心文件是MapReduce和HDFS,而HDFS是根据谷歌文件系统GFS开源实现,是面向普通硬件环境的分布式文件系统,具有很好的容错性和很高的读写速度。MapReduce是根据谷歌的MapReduce开源实现的,允许用户在不了解分布式系统底层实现原理的情况下进行并行程序开发。分布式存储、
睿晞
·
2019-12-22 00:00
《
大数据技术原理与应用
》第二版-第一章大数据概述
1.2大数据概念数据量大数据类型繁多处理速度快价值密度低1.3大数据影响研究变化经历了从实验到理论到计算再到数据思维的变化全样而非抽样效率而非精准相关而非因果1.6大数据计算模式批处理计算,主要针对于大规模的数据批量处理。MapReduce用于大规模的数据集(1TB)的并行运算。Spark是一个针对超大数据集合低延时的集群分布式计算系统,比MapReduce快许多。流计算,流数据或数据流是指在时间
睿晞
·
2019-12-22 00:00
大数据技术原理与应用
(林子雨)-云数据库单元测验
1单选(2分)下列Amazon的云数据库属于关系数据库的是A.AmazonRDSB.AmazonSimpleDBC.AmazonRedshiftD.AmazonDynamoDB2单选(2分)下列关于UMP系统的说法不正确的是A.Controller服务器向UMP集群提供各种管理服务,实现集群成员管理、元数据存储等功能B.UMP系统是低成本和高性能的MySQL云数据库方案C.Agent服务器部署在运
圆滚滚的老高头儿
·
2019-11-29 17:04
MOOC
大数据技术原理与应用
(林子雨)-NoSQL数据库单元测验
1单选(2分)下列关于NoSQL数据库和关系型数据库的比较,不正确的是得分/总分A.NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言B.NoSQL数据库具有弱一致性,关系型数据库具有强一致性C.NoSQL数据库的可扩展性比传统的关系型数据库更好D.NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性2.00/2.002单选(2分)以下对各类数据库的理解错误的是得分
圆滚滚的老高头儿
·
2019-11-29 16:49
MOOC
大数据技术原理与应用
第8讲:数据仓库Hive
1单选(2分)下列有关Hive和Impala的对比错误的是A.Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询B.Hive与Impala中对SQL的解释处理比较相似,都是通过词法分析生成执行计划C.Hive与Impala使用相同的元数据D.Hive在内存不足以存储所有数据时,会使用外存,而Impala也是如此2单选(2分)下列关于Hive基本操作命令的解释错误的是A.
周杰伦今天喝奶茶了吗
·
2019-05-21 17:49
Everyday
大数据入门 | 二、初识hadoop
网易云课堂《
大数据技术原理与应用
》课程Chapter2学习笔记01Hadoop是什么?Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。
松鼠的读书笔记
·
2019-01-29 22:43
大数据技术原理与应用
5Spark、流计算、图计算
第10讲Spark10.1Spark概述10.1.1Spark简介•Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序•2013年Spark加入Apache孵化器项目后发展迅猛,如今已成为Apache软件基金会最重要的三大分布式计算系统开源项目之一(Hadoop、Spark、Sto
A记录学习路线
·
2018-12-15 00:00
大数据
大数据技术原理与应用
3NoSQL数据库、云数据库
第5讲NoSQL数据库5.1NoSQL概述通常,NoSQL数据库具有以下几个特点:(1)灵活的可扩展性(2)灵活的数据模型(3)与云计算紧密融合可以支持在多个节点上扩展、关系设计库中行和列都得遵循一定的规范和模式,而、noSQL不需要遵守、根据整个负载实时变化来对整个底层的IT基础设施进行动态伸缩,如果负载增加,可以把更多的机器纳到整个集群当中,负载减少可以把相关的机器节点退出去。传统的数据库即使
A记录学习路线
·
2018-11-03 23:47
大数据
大数据技术原理与应用
1Hadoop、HDFS
第1讲大数据概述1.1大数据时代1.2大数据概念和影响1.3大数据的应用1.4大数据的关键技术1.5大数据与云计算、物联网第2讲大数据处理架构Hadoop2.1概述2.2Hadoop项目结构2.3Hadoop的安装与使用2.4Hadoop集群的部署和使用第3讲分布式文件系统HDFS3.1分布式文件系统HDFS简介3.2HDFS相关概念3.3HDFS体系结构3.4HDFS存储原理3.5HDFS数据读
A记录学习路线
·
2018-11-01 17:08
大数据
Hadoop 伪分布式搭建
Hadoop伪分布式搭建参考博客园YSOcean博文笔者按照《
大数据技术原理与应用
》进行搭建,捣鼓了很久未能成功搭建起来,下面的教程比较靠谱Hadoop版本:2.7.6ubuntu版本:16.04LTS1
oio328Loio
·
2018-09-11 12:44
hadoop
大数据技术原理与应用
第一章 大数据概述
最近在学习厦门大学林子雨老师开讲的一门课程——
大数据技术原理与应用
,决定开始做一下学习笔记。
chenhui229
·
2018-07-03 17:47
大数据技术原理与应用
大数据技术原理与应用
:大数据处理架构Hadoop生态圈
Hadoop生态圈概述Hadoop简介什么是Apachehadoop?ApacheHadoop项目是以可靠、可扩展和分布式计算为目的而发展而来的开源软件ApacheHadoop软件库是一个允许在集群计算机上使用简单的编程模型来进行大数据集的分布式任务的框架。它是设计来从单服务器扩展到成千台机器上,每个机器都能高效地提供本地的计算和存储。Hadoop发展历史Hadoop特性Hadoop在企业应用架构
行书以鉴
·
2018-01-10 02:37
大数据技术原理与应用
:大数据处理架构Hadoop生态圈
Hadoop生态圈概述Hadoop简介什么是Apachehadoop?ApacheHadoop项目是以可靠、可扩展和分布式计算为目的而发展而来的开源软件ApacheHadoop软件库是一个允许在集群计算机上使用简单的编程模型来进行大数据集的分布式任务的框架。它是设计来从单服务器扩展到成千台机器上,每个机器都能高效地提供本地的计算和存储。Hadoop发展历史Hadoop特性Hadoop在企业应用架构
行书以鉴
·
2018-01-10 02:37
大数据技术原理与应用
:大数据概述
大数据概述为什么说大数据是第三次信息化浪潮?数据技术支撑存储设备便宜处理能力提升网络带宽提升数据产生方式变革数据产生方式大数据发展三个阶段由于技术支撑以及数据产生方式变革,促成了大数据~大数据定义数据量大大数据摩尔定律数据类型繁多:由结构化和非结构化数据组成类型多处理速度快:秒级决策价值密度低厦大校园故大数据4v特性大数据关键技术两大核心技术:分布式存储与处理大数据计算模式大数据计算模式区分流计算
行书以鉴
·
2018-01-09 12:04
基于Hadoop的数据仓库Hive 学习指南
【版权声明:本指南为厦门大学林子雨开设的《
大数据技术原理与应用
》课程新增配套学习资料,版权所有,转载请注明出处,请勿用于商业用途】本指南介绍了Hive,并详细指引读者安装Hive。
achuo
·
2016-05-12 19:36
hive
上一页
1
2
3
4
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他