(一)hadoop 权威指南---气象数据获取

  1. 下载FileZilla
    FileZilla是一个ftp远程文件下载器,非常好用。
    链接:https://filezilla-project.org/

  2. 连接ftp
    气象数据来自美国气象局,数据根 ftp://ftp.cdc.noaa.gov/ ,如果要用户名,那就是anonymous。不过里面数据太多,我需要的是 ftp://ftp.ncdc.noaa.gov/pub/data/noaa/ 路径下的数据。填写如下:
    (一)hadoop 权威指南---气象数据获取_第1张图片
    在本地站点选一个本地下载目录,点击快速连接就可以下载数据了。数据使用1901年开始的,数据还挺多,已经下载了一部分数据,自己整理了一下把一年的数据全放一个文件里了,便于hadoop处理,地址:http://download.csdn.net/detail/u010469490/9876925。最近在学haoop,正好可以拿来这个来研究研究。^_^

  3. 数据说明文件
    noaa/目录下有一个文件叫ish-format-document.pdf, 里面详细写了一行数据代表的含义。例如:
    (一)hadoop 权威指南---气象数据获取_第2张图片
    表示一行中第88-92列的数据值表示空气温度观测值。

你可能感兴趣的:(hadoop学习资料)