Hive经典面试题——级联求和（访客访问统计报表）

数据分析之词云图绘制那个叫马尔的大夫数据可视化数据分析数据挖掘
试验任务概述：如下为所给CSDN博客信息表，分别汇总了'ai','algo','big-data','blockchain','hardware','math','miniprog'等7个标签的博客。对CSDN不同领域标签类别的博客内容进行词频统计，绘制词频统计图，并根据词频统计的结果绘制词云图。数据表链接：https://download.csdn.net/download/m0_5205157
nginx部署 vue配置代理服务器解决跨域问题请把小熊还给我& vue.js nginx 前端
为了演示方便使用的是windows部署1.首先将vue打包2.打包好的vue放入到nginx-1.24.0\html\下,这里我创建一个big-data文件夹所以放入到big-data方便多项目管理3.打开nginx.conf的配置文件修改server{listen8081;server_namelocalhost;location/{aliashtml/big-data/;indexindex.
第一周晨考自测（1.0） mez_Blog mez_Blog的专栏前端 JavaScript javascript 开发语言 ecmascript 学习前端
第一天：1.变量名的命名规则和规范变量名命名规则：由字母（大小写），数字，下划线（_），美元符号（$）组成不能以数字开头不能使用关键字和保留字变量名命名规范：当有多个字母组成时，使用驼峰写法（分为两种：大驼峰（bigData），小驼峰(big-data)），尽量不使用中文，变量名尽量有意义2.js中的数据类型js的数据类型可以分为两种：一种是基本数据类型（数字，字符串，undefined，null
通过Flask方式调用keras方法报错的怪异问题解决方法陈亮2019
最近使用keras+tensorflow的densent模型处理OCR，直接传入文件运行正常，但用Flask通过web上传文件后调用相同的功能时会报如下错误：File"e:\big-data\ocr\BDP_SMARTOCR-REPO\trunk\Src\epocr-lic\ocr.py",line69,incharRectext=keras_densenet(image)File"e:\big-
【实时计算架构系列1】WePay如何基于谷歌云平台(GCP)和kafka实现实时流式欺诈检测江南小白龙实时计算架构
原文：https://cloud.google.com/blog/big-data/2017/08/how-wepay-uses-stream-analytics-for-real-time-fraud-detection-using-gcp-and-apache-kafkaByWeiLi,LeadEngineeratWePay首先，wepay反欺诈场景：交易欺诈需要提取的特征例如：过去3个月交易
高性能服务端漫谈 Angela㐅cc
一、背景进入多核时代已经很久了，大数据概念也吵得沸沸扬扬，不管你喜欢不喜欢，不管你遇到没遇到，big-data或bigger-data都必须正视.处理大数据，基本都离不开分布式计算和分布式存储，这其中以hadoop最为使用广泛和经典。分布式系统，就离不开计算系统、网络系统、文件系统和数据库系统。这么多系统，之间又是如何协作的呢？通讯过程又是如何保障高性能的呢？1.单处理器在以前的单核心cpu下，我
用Spark分析Amazon的8000万商品评价（内含数据集、代码、论文） weixin_34232744
更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。亚马逊的商品评论和评分是一个非常重要的业务。亚马逊上的客户经常基于这些评论做出购买决定，并且单个不良评论可以导致潜在购买者重新考虑。几年前，我写了一篇非常
【Spark Summit EU 2016】使用Java Agent扩展Spark weixin_33772645
更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。本讲义出自JaroslavBachorik与AdrianPopescu在SparkSummitEU上的演讲，主要介绍了Spark缓存中出现的关于when,
Hadoop 中的数据倾斜 RichardLeeH hadoop学习之
转自：http://www.gemini5201314.net/big-data/hadoop-中的数据倾斜.html最近几次被问到关于数据倾斜的问题，这里找了些资料也结合一些自己的理解.在并行计算中我们总希望分配的每一个task都能以差不多的粒度来切分并且完成时间相差不大，但是集群中可能硬件不同，应用的类型不同和切分的数据大小不一致总会导致有部分任务极大的拖慢了整个任务的完成时间，硬件不同就不说
Project SAAAD: Scalable Adaptive Auto-encoded Anomaly Detection 易晴天 Anomaly detection
ProjectSAAAD:ScalableAdaptiveAuto-encodedAnomalyDetection可扩展的自适应自动编码异常检测ProjectSAAADaimstoexploretheuseofautoencodersforanomalydetectioninvarious‘big-data’problems.Specifically,theseproblemshavethefol
pg数据库（PostgreSQL）与gp数据库（GreenPlumSQL）的区别与联系芽孢八叠球菌 JAVA开发过程经验数据库-Oracle
以前项目采用的都是oracle或者是mysql的数据库，新的项目采用了gp数据库（greenplum），在这之前只听说过pg数据库（postgreSQL）。gp数据库官网：http://pivotal.io/big-data/pivotal-greenplumpg数据库官网：https://www.postgresql.org/经过学习和查询，得知greenplum是利用了postgre数据库的框
A Simple TBtools Manual (English) 生信札记
[Forversion0.665]CJ([email protected])SouthChinaAgriculturalUniversityOverviewRapiddevelopmentofhigh-throughputsequencing(HTS)techniqueshasledbiologyintothe“big-data”era.Dataanalysisusingvariousbioinf
数据分析学习（网站链接) stacy_liu
服务产品(商品)评论中的产品特征挖掘方法:http://blog.csdn.net/chixujohnny/article/details/52794685商品评论中的实体情感分析:http://blog.csdn.net/chixujohnny/article/details/53999327云栖社区大数据频道:https://yq.aliyun.com/big-data?spm=5176.10
我的2015年皮蛋嘚孤独
孤独の皮蛋皮蛋屌丝程序员一枚，开始于java培训班，过渡于java企业级应用开发，落地于大数据周边。喜欢音乐。喜欢睡觉。最快乐就是陪儿子一起玩的时候(孤独の皮蛋)2015年计划从以下几个方面编程生活活动家庭其他主要围绕工作和家庭...编程.语言.Javajava8/面向对象.Python多线程/map/reduce/for/dict/set/list/numpy/urllib2/.Big-data
big-data:hive 搭建及遇到的问题 qq_26496877 big-data:hive Big Data学习进程记录
配置hive-site.xml(这是一个简化版的配置，配置时，只需将下面的配置项配置，其余带有$的配置项目注释掉)其中最重要的就是元数据存储的mysql的jdbc链接参数javax.jdo.option.ConnectionURLjdbc:mysql://192.168.48.50:3306/hivejavax.jdo.option.ConnectionDriverNamecom.mysql.jd
2.3 基于IDEA开发第一个MapReduce大数据程序WordCount 王小雷-多面手 Linux Hadoop Machine Learning 大数据
2.3基于IDEA开发第一个MapReduce大数据程序WordCount开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录开源“卜算子·大数据”系列文章、源码，面向大数据（分布式计算）的编程、应用、架构——每周更新！Linux、Java、Hadoop、Spark、Sqoop、hive、pig、hbase、zookeeper、Oozie、f
2.2 Hadoop3.1.0完全分布式集群配置与部署王小雷-多面手 Hadoop 大数据
2.2Hadoop3.1.0完全分布式集群配置与部署开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录开源“卜算子·大数据”系列文章、源码，面向大数据（分布式计算）的编程、应用、架构——每周更新！Linux、Java、Hadoop、Spark、Sqoop、hive、pig、hbase、zookeeper、Oozie、flink…etc本节主
1.3 virtualbox高级应用构建本地大数据集群服务器王小雷-多面手 Linux Hadoop 大数据
1.3virtualbox高级应用构建本地大数据集群服务器开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录开源“卜算子·大数据”系列文章、源码，面向大数据（分布式计算）的编程、应用、架构——每周更新！Linux、Java、Hadoop、Spark、Sqoop、hive、pig、hbase、zookeeper、Oozie、flink…etc
2.1 Hadoop伪分布式安装部署王小雷-多面手 Hadoop 大数据
2.1Hadoop伪分布式安装部署开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录开源“卜算子·大数据”系列文章、源码，面向大数据（分布式计算）的编程、应用、架构——每周更新！Linux、Java、Hadoop、Spark、Sqoop、hive、pig、hbase、zookeeper、Oozie、flink…etc本节介绍如何在Linux
1.2 linux使用技巧快速入门王小雷-多面手 Linux Hadoop 大数据
1.2linux使用技巧快速入门开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录为大数据知识做基础准备，首先要对Linux有初步的了解，接下来就讲解一些Linux常用的技巧命令。1.2.1debian/ubuntu常用命令#更新软件sudoaptupdatesudoaptupgrade#安装vimsudoaptinstallvim1.2.
1.1 Virtualbox虚拟机快速入门王小雷-多面手 Linux Hadoop 大数据
1.1Virtualbox虚拟机快速入门virtualbox安装、配置、安装Ubuntu18.04过程详细记录开源地址https://github.com/wangxiaoleiAI/big-data卜算子·大数据目录1.1.1关闭BIOS安全启动项、开启BIOS中允许CPU虚拟选项、下载virtualbox、下载LinuxUbuntu18.04镜像1.1.1.1如何关闭Securityboot(
“卜算子·大数据”学习系列原创文章、源码——从入门到精通王小雷-多面手 Database Linux Python Spark Hadoop MapReduce Hive Sqoop HBase Hadoop YARN 大数据
大数据big-data:white_check_mark:转载请注明出处与作者信息（如下）原创作者：王小雷作品出自：https://github.com/wangxiaoleiAI/big-data联系邮件：[email protected]评论issues最新文章：[x]“卜算子·大数据”目录——系列文章与源码介绍,目录[x]1.1Virtualbox虚拟机快速入门[x]
分享：2018年人工智能的三大预测数据分析v
关于2018年人工智能的三大预测原文:3PredictionsforAIin2018来源:https://www.business2community.com/big-data/3-predictions-ai-2018-01962681导读：调查列出了企业尚未投资AI的几个原因：缺乏IT基础设施（40%）；缺乏人才（34%）；缺乏执行预算（30%）；政策、法规及权益的复杂性（28%）；对客户预期
GemFire 8.2 在CentOS的安装步骤 dhtx_wzgl 数据库系统
原文：http://www.cnblogs.com/doubletree/p/5185395.htmlGemFire目前已经开源，开源项目的主页：http://geode.incubator.apache.org/，商业版本的主页：https://pivotal.io/big-data/pivotal-gemfire，关于开源版本如何编译，以及与商业版本的区别(功能上有区别)，我们以后再花时间来介
Hadoop 7、MapReduce执行环境配置拉斐尔[Raphael]
MR执行环境有两种：本地测试环境，服务器环境本地测试环境(windows，用于测试)1、下载Winddows版的Hadoop程序，解压后在Hadoop目录的bin目录放置一个winutils.exe可执行文件（下载地址：http://pan.baidu.com/s/1mhrsQyG）2、在windows下配置hadoop的环境变量 HADOOP_HOME E:\big-data\hadoop-2
GemFire 入门篇2：GemFire 8.2 在CentOS & Mac OS X的安装步骤 doubletree
GemFire目前已经开源，开源项目的主页：http://geode.incubator.apache.org/，商业版本的主页：https://pivotal.io/big-data/pivotal-gemfire，关于开源版本如何编译，以及与商业版本的区别(功能上有区别)，我们以后再花时间来介绍。我们先使用商业版本作为学习的入口，在初始学习阶段，迅速了解一个产品的最好方法就是亲手安装它。Gem
GemFire 入门篇2：GemFire 8.2 在CentOS & Mac OS X的安装步骤 doubletree
GemFire目前已经开源，开源项目的主页：http://geode.incubator.apache.org/，商业版本的主页：https://pivotal.io/big-data/pivotal-gemfire，关于开源版本如何编译，以及与商业版本的区别(功能上有区别)，我们以后再花时间来介绍。我们先使用商业版本作为学习的入口，在初始学习阶段，迅速了解一个产品的最好方法就是亲手安装它。Gem
R-note1 Note
R 新手如果你在R上遇到困难，那么你从这两个地方可以得到解答： http://www.r-project.org/mail.html http://stackoverflow.com/questions/tagged/r 大数据（R）网站：http://www.revolutionanalytics.com/big-data 如果
通过 IDE 向 Storm 集群远程提交 topology storm
转载： http://weyo.me/pages/techs/storm-topology-remote-submission/ http://www.javaworld.com/article/2078672/big-data/open-source-tools-open-source-java-projects-storm.html?page=2 作为一个懒癌晚期患
高性能服务端漫谈 cfyme 高性能
一、背景进入多核时代已经很久了，大数据概念也吵得沸沸扬扬，不管你喜欢不喜欢，不管你遇到没遇到，big-data或bigger-data都必须正视.处理大数据，基本都离不开分布式计算和分布式存储，这其中以hadoop最为使用广泛和经典。分布式系统，就离不开计算系统、网络系统、文件系统和数据库系统。这么多系统，之间又是如何协作的呢？通讯过程又是如何保障高性能的呢？1.单处理器在以前的单核心cpu下，我
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

Hive经典面试题——级联求和（访客访问统计报表）

1、基本需求

2、实现步骤

2.1 原始数据

2.2 创建表

2.3 将数据加载到表中

2.4 计算单个用户的月访问次数

2.4 上面的表自己跟自己进行inner join方便求总访问

2.5 根据当前月份的大小来判断累计求和并排序

你可能感兴趣的:(big-data)