[大叔基础系列]
【原创】大数据基础之词频统计WORD COUNT
【原创】大数据基础之SPARK(9)SPARK中COLLECT和TAKE实现原理
【原创】大数据基础之SPARK(8)SPARK中JOIN实现原理
【原创】大数据基础之SPARK(7)SPARK读取文件SPLIT过程(即RDD分区数量)
【原创】大数据基础之SPARK(6)SPARK RDD SORT实现原理
【原创】大数据基础之SPARK(5)SHUFFLE实现原理及代码解析
【原创】大数据基础之SPARK(4)RDD原理及代码解析
【原创】大数据基础之SPARK(3)SPARK THRIFT实现原理及代码实现
【原创】大数据基础之SPARK(2)SPARK ON YARN:CONTAINER MEMORY ALLOCATION容器内存分配
【原创】大数据基础之SPARK(1)SPARK SUBMIT即SPARK任务提交过程
【原创】大数据基础之Alluxio(1)简介、安装、使用
【原创】大数据基础之Flink(1)简介、安装、使用
【原创】大数据基础之HIVE(2)HIVE SQL执行过程之SQL解析过程
【原创】大数据基础之HIVE(1)HIVE SQL执行过程之代码流程
【原创】大数据基础之Hadoop(1)HA实现原理
【原创】大数据基础之HDFS(2)HDFS副本数量检查及复制逻辑
【原创】大数据基础之HDFS(1)HDFS新创建文件如何分配DATANODE
【原创】大数据基础之调度框架
【原创】大数据基础之Airflow(1)简介、安装、使用
【原创】大数据基础之AZKABAN(1)简介、源代码解析
【原创】大数据基础之OOZIE(3)OOZIE从4.3升级到5.0
【原创】大数据基础之OOZIE(1)简介、源代码解析
【原创】大数据基础之OOZIE VS AZKABAN
【原创】大数据基础之QUARTZ(1)简介、源代码解析
【原创】大数据基础之DRILL(2)DRILL1.14+HIVE2.1.1运行
【原创】大数据基础之DRILL(1)简介、安装及使用
【原创】大数据基础之PARQUET(1)简介
【原创】大数据基础之ORC(1)简介
【原创】大数据基础之KAFKA(1)简介、安装及使用
【原创】大数据基础之ZOOKEEPER(4)应用场景
【原创】大数据基础之ZOOKEEPER(3)选举算法
【原创】大数据基础之ZOOKEEPER(2)源代码解析
【原创】大数据基础之ZOOKEEPER(1)介绍、安装及使用
【原创】大数据基础之ElasticSearch(1)简介、安装、使用
【原创】大数据基础之ElasticSearch(2)常用API整理
【原创】大数据基础之ElasticSearch(3)升级
【原创】大数据基础之Impala(1)简介、安装、使用
【原创】大数据基础之Impala(2)实现原理
【原创】大数据基础之Kudu(1)简介、安装、使用
【原创】大数据基础之Ambari(1)简介、编译安装、使用
【原创】大数据基础之Ambari(2)通过Ambari部署ElasticSearch
【原创】大数据基础之Ambari(3)通过Ambari部署Airflow
【原创】大数据基础之Ambari(4)通过Ambari部署Impala
【原创】大数据基础之Ambari(5)通过Ambari部署Hue
【原创】大数据基础之Mesos(1)简介、安装、使用
【原创】大数据基础之Marathon(1)简介、安装、使用
【原创】大数据基础之CM5(Cloudera Manager)+CDH5离线安装
【原创】大数据基础之Mesos+Marathon+Docker部署nginx
【原创】JAVA基础之SESSION机制
【原创】JAVA基础之CLASSLOADER类加载器简介
【原创】JAVA基础之FREEMARKER(1)模板加载及清空机制
【原创】Java基础之Nginx缓存
【原创】Java基础之常用JVM工具
【原创】LINUX基础之LINUX常用命令之文本替换
【原创】LINUX基础之LINUX服务器服务器间拷贝文件
【原创】Linux基础之查看linux发行版以及内核版本
【原创】Linux基础之上传下载
【原创】Linux基础之后台运行
【原创】Linux基础之SSH秘钥登录
【原创】Linux基础之sudo
【原创】Linux基础之curl
【原创】Linux基础之用户和组
【原创】Linux基础之iptables
【原创】Linux基础之SSH隧道/端口转发
【原创】Linux基础之redhat6升级glibc-2.12到2.14
【原创】Linux基础之常用命令
【原创】Linux基础之挂载硬盘
【原创】算法基础之Anaconda(1)简介、安装、使用
【原创】数据库基础之Mysql(1)常用命令
【原创】数据库基础之Mysql(2)主从库配置
【原创】运维基础之Ansible(1)简介、安装和使用
【原创】运维基础之Nginx(1)简介、安装、使用
【原创】运维基础之keepalived
【原创】运维基础之Docker(1)简介、安装、使用
【原创】运维基础之Docker(2)通过docker部署zookeeper nginx tomcat kibana/elasticsearch/logstash mysql kafka mesos/marathon
【原创】运维基础之Docker(3)搭建私有仓库
【原创】运维基础之Docker(4)实用工具ctop
【原创】运维基础之Zabbix(1)简介、安装、使用
【原创】运维基础之yum离线环境安装软件
【原创】运维基础之Redis(1)简介、安装、使用
[大叔经验系列]
【原创】大叔经验分享(28)ELK分析nginx日志
【原创】大叔经验分享(27)linux服务器升级glibc故障恢复
【原创】大叔经验分享(26)hive通过外部表读写elasticsearch数据
【原创】大叔经验分享(25)hive通过外部表读写hbase数据
【原创】大叔经验分享(24)hive metastore的几种部署方式
【原创】大叔经验分享(23)SPARK SQL插入表时的文件个数研究
【原创】大叔经验分享(22)securecrt连接自动断开
【原创】大叔经验分享(21)YARN中查看每个应用实时占用的内存和CPU资源
【原创】大叔经验分享(20)SPARK JOB之间会停顿几分钟
【原创】大叔经验分享(19)SPARK ON YARN提交任务之后执行进度总是10%
【原创】大叔经验分享(18)HIVE2.0以后通过BEELINE执行SQL没有进度信息
【原创】大叔经验分享(17)编程实践对比JAVA VS SCALA
【原创】大叔经验分享(16)CONTEXT NAMESPACE ELEMENT 'COMPONENT-SCAN' AND ITS PARSER CLASS [ORG.SPRINGFRAMEWORK.CONTEXT.ANNOTATION.COMPONENTSCANBEANDEFINITIONPARSER] ARE ONLY AVAILABLE ON JDK 1.5 AND HIGHER
【原创】大叔经验分享(15)SPARK SQL LIMIT实现原理
【原创】大叔经验分享(14)SPARK ON YARN提交任务到集群后SPARK-SUBMIT进程一直等待
【原创】大叔经验分享(13)SPARK运行报错WARN UTILS: SERVICE 'SPARKDRIVER' COULD NOT BIND ON PORT 0. ATTEMPTING PORT 1.
【原创】大叔经验分享(12)如何程序化KILL提交到SPARK THRIFT上的SQL
【原创】大叔经验分享(11)PYTHON引入模块报错IMPORTERROR: NO MODULE NAMED PANDAS NUMPY
【原创】大叔经验分享(10)COULD NOT TRANSFER ARTIFACT ORG.APACHE.MAVEN:MAVEN. FROM/TO CENTRAL. RECEIVED FATAL ALERT: PROTOCOL_VERSION
【原创】大叔经验分享(9)YARN重要配置YARN.NODEMANAGER.LOCAL-DIRS
【原创】大叔经验分享(8)创建HIVE表时用内部表还是外部表
【原创】大叔经验分享(7)创建HIVE表时格式如何选择
【原创】大叔经验分享(6)OOZIE如何查看提交到YARN上的任务日志
【原创】大叔经验分享(5)OOZIE提交SPARK任务如何添加依赖
【原创】大叔经验分享(4)YARN RESOURCEMANAGER页面如何实现主被自动切换
【原创】大叔经验分享(3)HBASE CLIENT 如何选择
【原创】大叔经验分享(2)为什么HIVE在大表上加条件后执行LIMIT很慢
【原创】大叔经验分享(1)在YARN上查看HIVE完整执行SQL
[大叔案例系列]
【原创】大叔案例分享(5)基于CRF的地址分词以及层级标注
【原创】大叔案例分享(4)定位分析--见证SCALA的强大
【原创】大叔案例分享(3)用户行为分析--见证SCALA的强大
【原创】大叔案例分享(2)处理大批量数据时如何实现“高效”同时实现“断点续传”功能
【原创】大叔案例分享(1)基于地址位置的用户人群定位方案
[大叔问题定位系列]
【原创】大叔问题定位分享(30)mesos agent启动失败:Failed to perform recovery: Incompatible agent info detected
【原创】大叔问题定位分享(29)datanode启动报错:50020端口被占用
【原创】大叔问题定位分享(28)openssh升级到7.4之后ssh跳转异常
【原创】大叔问题定位分享(27)spark中rdd.cache
【原创】大叔问题定位分享(25)ambari metrics collector内置standalone hbase启动失败
【原创】大叔问题定位分享(24)hbase standalone方式启动报错
【原创】大叔问题定位分享(23)Ambari安装向导点击下一步卡住
【原创】大叔问题定位分享(22)HIVE同时执行多个INSERT OVERWRITE TABLE只有1个可以执行
【原创】大叔问题定位分享(21)SPARK执行INSERT OVERWRITE非常慢,比HIVE还要慢
【原创】大叔问题定位分享(20)HDFS文件CREATE写入正常,APPEND写入报错
【原创】大叔问题定位分享(19)SPARK TASK在EXECUTORS上分布不均
【原创】大叔问题定位分享(18)BEELINE连接SPARK THRIFT有时会卡住
【原创】大叔问题定位分享(17)SPARK查ORC格式数据偶尔报错NULLPOINTEREXCEPTION
【原创】大叔问题定位分享(16)SPARK写数据到HIVE外部表报错CLASSCASTEXCEPTION: ORG.APACHE.HADOOP.HIVE.HBASE.HIVEHBASETABLEOUTPUTFORMAT CANNOT BE CAST TO ORG.APACHE.HADOOP.HIVE.QL.IO.HIVEOUTPUTFORMAT
【原创】大叔问题定位分享(15)SPARK写PARQUET数据报错PARQUETENCODINGEXCEPTION: EMPTY FIELDS ARE ILLEGAL, THE FIELD SHOULD BE OMMITED COMPLETELY INSTEAD
【原创】大叔问题定位分享(14)KYLIN频繁OOM问题
【原创】大叔问题定位分享(13)HBASE REGION频繁下线
【原创】大叔问题定位分享(12)SPARK保存文本类型文件(TEXT、CSV、JSON等)到HDFS时为什么是压缩格式的
【原创】大叔问题定位分享(11)SPARK中对大表子查询加LIMIT为什么会报BROADCAST超时错误
【原创】大叔问题定位分享(10)提交SPARK任务偶尔报错 ORG.APACHE.SPARK.SPARKEXCEPTION: A MASTER URL MUST BE SET IN YOUR CONFIGURATION
【原创】大叔问题定位分享(9)OOZIE提交SPARK任务报 JAVA.LANG.NOCLASSDEFFOUNDERROR: ORG/APACHE/KAFKA/CLIENTS/PRODUCER/KAFKAPRODUCER
【原创】大叔问题定位分享(8)提交SPARK任务报错 CAUSED BY: JAVA.LANG.CLASSNOTFOUNDEXCEPTION: ORG.I0ITEC.ZKCLIENT.EXCEPTION.ZKNONODEEXCEPTION
【原创】大叔问题定位分享(7)SPARK任务中JOB进度卡住不动
【原创】大叔问题定位分享(6)DUBBO MONITOR服务IOWAIT高,负载高
【原创】大叔问题定位分享(5)KAFKA客户端报错SOCKETEXCEPTION: TOO MANY OPEN FILES 打开的文件过多
【原创】大叔问题定位分享(4)KAFKA集群BROKER节点从ZOOKEEPER上消失
【原创】大叔问题定位分享(3)KAFKA集群BROKER进程逐个报错退出
【原创】大叔问题定位分享(2)SPARK任务一定几率报错JAVA.LANG.NOSUCHFIELDERROR: HIVE_MOVE_FILES_THREAD_COUNT
【原创】大叔问题定位分享(1)HBASE REGIONSERVER频繁挂掉
[大叔算法系列]
【原创】大叔算法分享(9)分类算法SVM
【原创】大叔算法分享(8)聚类算法KMeans
【原创】大叔算法分享(7)最小二乘法
【原创】大叔算法分享(6)机器学习概览
【原创】大叔算法分享(5)聚类算法DBSCAN
【原创】大叔算法分享(4)CARDINALITY ESTIMATE 基数计数概率算法
【原创】大叔算法分享(3)HMM隐马尔可夫模型
【原创】大叔算法分享(2)CRF条件随机场
【原创】大叔算法分享(1)流程规范化