大数据&ETL&kettle学习积累

以下为本博客及其他资料的分享:

大数据:

Kudu的学习

Sqoop同步数据命令

HBASE知识积累

大数据Hive的学习积累

HDFS的学习积累

impala-shell Not Connected的问题

Azkaban介绍与使用

Hive、Impala和Hbase的区别

 

CDH大数据平台搭建:

大数据平台CDH的介绍和5.16/6.3版本的搭建

大数据CDH问题解决总结

ssh免秘钥登录

大数据时间同步之ntp

 

Linux知识:

Linux定时任务Crontab命令详解

Linux中systemctl 命令

Linux 常用命令

Linux修改root用户密码

远程可视化工具——VNC的安装使用和分辨率设置

Linux中max_user_processes和open_file的修改

yum 与rpm 问题与介绍 

yum下载RPM包及依赖包后自制yum源离线安装

Linux中nohup与&区别和命令执行输出重定向

scp命令不输入密码传输文件的两种方法_expect

Linux中sh执行脚本命令没有权限也能正常执行

 

SQL的学习: 

MySQL的学习,由入门到精通

SQL学习分享1之时间命令unix_timestamp、FROM_UNIXTIME

SQL学习分享2之分组排序函数ROW_NUMBER() OVER()

select * from a,b是内连接也可以是笛卡尔乘积

SQL语句 where子句 like用法

mysql5.7忘记密码后如何重置

通过Oracle系统表获取表主键

PostgreSQL数据目录结构、查询Schema下所有表的大小

SQL UNION 和 UNION ALL 操作符

LEFT JOIN关联出现笛卡尔积

SQL中字符串函数:字符串截取

SQL的判断语句:case when语句以及与update set的使用

 

Kettle(Pentaho)学习和积累

Kettle中的循环作业,类似for循环功能

变量:Kettle中转换和作业常用的内置变量

客户端打开报错:Pentaho客户端打开后没有出现资源库的连接按钮解决办法

ETL效率优化

kettle的“调取DB存储过程”插件

 

其他

OLTP与OLAP的区别和联系

 

你可能感兴趣的:(大数据,ETL)