实训笔记

2018.12.17 上午

大数据概述

前置要求

  • java SE的基本变成
  • 了解LINUX常用基本命令

使用工具

  1. linux版本 CentOS 6.4
  2. Hadoop CDH 5.7

TB PB EB

大数据在技术架构上带来的挑战

  • 对现有数据库管理技术的挑战
  • 实时性的技术挑战
  • 经典数据库技术并没有考虑数据的多类别
  • 网络架构、数据中心、运维的挑战

其他挑战

  • 数据隐私
  • 数据源的复杂多样

挑战分析之如何对大数据进行存储和分析呢?

系统瓶颈 Google大数据技术
存储容量 MapReduce
读写速度 BigTable
计算效率 GES

大数据工程(T级别以上):开发大数据系统

大数据分析:使用大数据系统分析数据

数据科学家:以上都会

作业:两个问题

2018.12.17 下午

Linux基础

推荐书籍:《鸟哥的私房菜》

Linux简介

点击一下 linux官网

Linux管理员要养成的习惯:

  • 要习惯使用命令行
  • 操作要谨慎
  • 安全不可忽视

安装centOS
http://www.VMware.

你可能感兴趣的:(实训笔记)