大数据入门学习:UCSanDiego大数据专项课程笔记目录(Coursera)

大数据入门:UCSanDiego大数据专项课程笔记目录(Coursera)

最近在学coursera上的Bigdata 课程(需要,最好开启全局模式,可以旁听)
UCSanDiego:大数据专项课程

课程介绍

简介:通过对大数据如何组织、分析和解释的概述来推动更好的业务决策。把你的洞察力应用到现实世界的问题和问题上。


(我是机翻) 你需要了解大数据以及它将如何影响你的业务吗?这个专业是为你准备的。通过使用大数据科学家和工程师使用的工具和系统,您将了解大数据可以提供什么样的见解。不需要有编程经验!您将通过MapReduce, Spark, Pig和Hive使用Hadoop的基础指导。通过跟随提供的代码,您将体验如何执行预测建模和利用图分析来建模问题。这种专门化将使您准备好提出关于数据的正确问题,与数据科学家进行有效的沟通,并对大型复杂数据集进行基本的探索。在与数据软件公司Splunk合作开发的最后一个Capstone项目中,您将应用所学到的技能对大数据进行基本分析。


我自己是地信专业大三在学,先修课程有数据库、空间数据库、空间分析,所以在一些课程上会有挑选,我会着重我接触比较少的部分进行记录。由于水平有限,欢迎大家多多指正,也欢迎大家跟我一起讨论这个课程。笔记会不断更新,充实内容。

比较坑的是这个课程它虽然说包含中文但是实际上只有一个无关紧要的课有中文翻译,其他时候都是英文,所以学起来理解和翻译还是有些偏差,特别是对于我这样的小白。欢迎批评指正。这个课程还配合了有Hadoop的实验,我有写一部分实验报告和记录,后续有时间记录下来。

课程结构

1. 大数据导论 Introduction to Big Data

(这里我没有按照他的课程来写笔记,选择性的听了以下)

大数据入门1:Hadoop基本介绍
大数据入门2:基本概念-Distributed File System(分布式文件系统)
大数据入门3:基本概念-Scalable Computing over the Internet (基于互联网的可伸缩计算)
大数据入门4:大数据的程序设计模型(Programming models)
大数据入门5:Hadoop分布式文件系统-HDFS
大数据入门6:Hadoop资源管理-YARN
大数据入门7:Hadoop简单编程好助手:MapReduce(举例wordcount)
大数据入门8:云服务模型-探索与选择

2. 大数据模型和管理系统(Big Data Modeling and Management Systems)

大数据入门9:半结构化数据模型(Semi-structured Data Model)
大数据入门10:向量空间模型(Vector Space Model)
大数据入门11:图数据模型(Graph Data Model)
大数据入门12:数据流(Data Stream)&Lambda架构
大数据入门13:数据湖(Data Lake)
大数据入门14:基于DBMS和不基于DBMS的大数据处理
大数据入门15:Radis:储存key-value的保证
大数据入门16:Areospike:开启kv存储新纪元

3. 大数据集成和处理(Big Data Integration and Processing)


4. 基于大数据的机器学习(Machine Learning With Big Data)


*5. 实验操作

实验一:Cloudera平台搭建和基本操作
实验二:数据处理
实验三:探索关于CSV的关系数据模型
实验四:JSON数据操作
实验五:探索图像的数组数据模型
实验六:传感器数据处理

你可能感兴趣的:(大数据入门,大数据,Coursera,大数据转向课程,UCSanDiego)