赵广陆

Hive数据仓库数据分析

目录

1 创建数据仓库
2 创建Hive分区表
3 数据分析
- 3.1 统计总记录数
- 3.2 统计非空记录数
- 3.3 关键词分析
- 3.4 uid分析
4 用户行为分析
- 4.1 单击次数与rank之间的关系
- 4.2 个性化行为分析
5 实时数据

1 创建数据仓库

我们的目标是在Hive中创建数据仓库，以便利用Hive的查询功能实现交互式数据处理，所以接下来在Hive客户端进行操作。确保Hadoop和MySQL服务已经启动后再进入Hive客户端，命令如图10-11所示。
hive

create database sogou;

下面，我们来创建一个外部表，命令如下：

create external table sogou.sogou_20211103(
`time` string,
`uid` string,
`keywords` string,
`rank` int,
`ordering` int,
`url` string)
comment 'This is the sogou search data of one day'
row format delimited
fields terminated by '\t'
stored as textfile
location '/sogou/20211103';

show create table sogou.sogou_20211103;

describe sogou.sogou_20211103;

drop table sogou.sogou_20211103;

2 创建Hive分区表

我们正式创建一个外部表，该表包含了扩展字段（即year、month、day、hour），命令如下：

create external table sogou.sogou_ext_20211103(
`time` string,
`uid` string,
`keywords` string,
`rank` int,
`ordering` int,
`url` string,
`year` int,
`month` int,
`day` int,
`hour` int)
comment 'This is the sogou search data extend'
row format delimited
fields terminated by '\t'
stored as textfile
location '/sogou_ext/20211103';

在上述命令中，特别要注意，“location”后面的“/sogou_ext/20211103”就是我们在前面创建的HDFS目录，并且已经上传了sogou.500w.utf8.flt文件。

接着创建带分区的表，命令如下：

create external table sogou.sogou_partition(
`time` string,
`uid` string,
`keywords` string,
`rank` int,
`ordering` int,
`url` string)
partitioned by (
`year` int,
`month` int,
`day` int,
`hour` int)
row format delimited
fields terminated by '\t'
stored as textfile;

最后向数据库中导入数据，命令是：

set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table sogou.sogou_partition partition(year, month,day,hour)        select * from sogou.sogou_ext_20211103;

查询导入数据的命令是：

select * from sogou_ext_20211103 limit 10;

其他查询命令还有：

select url from sogou_ext_20211103 limit 10;

select * from sogou_ext_20211103 where uid='96994a0480e7e1edcaef67b20d8816b7';

3 数据分析

3.1 统计总记录数

select count(*) from sogou_ext_20211103 ;

3.2 统计非空记录数

select count(*) from sogou_ext_20211103 where keywords is not null and keywords!='';

统计独立uid总数的命令是：

select count(distinct(uid)) from sogou.sogou_ext_20211103 ;

3.3 关键词分析

统计关键词长度的命令是：

select avg(a.cnt) from (select size(split(keywords,'\\s+')) as cnt from sogou.sogou_ext_20211103 ) a;

select keywords, count(*) as cnt from sogou.sogou_ext_20211103 group by keywords order by cnt desc limit 20;

频度排名（即频度最高的前20个词）的命令是：

你看看搜狗搜索,搜索最多的是百度.

3.4 uid分析

统计查询次数分布的命令是：

select sum(if(uids.cnt=1,1,0)), sum(if(uids.cnt=2,1,0)), sum (if(uids.cnt=3,1,0)), sum(if(uids.cnt>3,1,0)) from (select uid, count(*) as cnt from sogou.sogou_ext_20211103 group by uid) uids;

统计平均查询次数的命令是：

select sum(a.cnt)/count(a.uid) from (select uid,count(*) as cnt from sogou_ext_20211103 group by uid) a;

统计查询次数大于2次的用户总数的命令是：

select count(a.cnt) from (select uid, count(*) as cnt from sogou.sogou_ext_20211103 group by uid having cnt > 2 ) a;

4 用户行为分析

4.1 单击次数与rank之间的关系

下面我们来计算rank在10以内的单击次数占比。首先执行：

select count(*) from sogou.sogou_ext_20211103 where rank<11;

然后执行：

>select count(*) from sogou.sogou_ext_20161202;

我们知道，用户上网查询往往只会浏览搜索引擎返回结果的前10个项目，也就是位于第一页的内容。这个用户行为说明，尽管搜索引擎返回的结果数目十分庞大，但是真正可能被用户关注的内容往往很少，只有排在最前面的很小部分会被用户浏览到，所以传统的基于全部返回值计算的查全率、查准率的评价方式已经不适应网络信息检索的评价。正确的评价方式应该强调评价指标中有关最靠前的结果与用户查询需求之间的相关性。

我们再来研究直接通过输入URL进行查询的占比：

>select count(*) from sogou.sogou_ext_20211103 where keywords like ‘%www%’;
>select count(*) from sogou.sogou_ext_20211103 ;

实际结果是73979/5000000，等于0.0147958。这个比例是很低的，说明绝大部分用户不会采用URL进行查询。想想也很自然，如果用户知道了URL，完全可以直接在浏览器地址栏输入URL进行查询，没有必要再通过搜索引擎重复一遍。

另外，在通过URL进行的查询中，我们还可以计算用户单击了其输入的URL网址的次数，并计算占比。

select count(*) from sogou.sogou_ext_20211103 where keywords like ‘%www%’;
select count(*) from sogou.sogou_ext_20211103 ;

27561/73979=0.37255167即我们关心的结果。从这个比例可以看出，有37%的用户（因该说是很大一部分）提交了URL进行查询，并且继续单击了查询的结果。这可能是由于用户没有记全URL等原因，而想借助搜索引擎来找到自己想要的网址。因此，这个分析结果就提示我们，搜索引擎在处理这一部分查询请求时，一个可能比较理想的改进方式就是，首先把相关的完整URL返回给用户，这样就有较大可能改善用户的查询体验，满足用户的需求。

4.2 个性化行为分析

例如，如果想知道搜索过“csdn”且次数大于2的uid，可使用下面的命令：

select uid,count(*) as cnt from sogou.sogou_ext_20211103 where keywords='csdn' group by uid having cnt >1;

5 实时数据

在实际应用中，为了实时地显示当天搜索引擎的搜索数据，首先需要创建一些临时表，然后在一天结束后对数据进行处理，并将数据插入临时表中。

创建临时表
创建临时表的命令是：

>create table sogou.uid_cnt(uid string, cnt int)
>comment ‘This is the sogou search data of one day’
>row format delimited
>fields terminated by ‘\t’
>stored as textfile;

插入数据

>insert overwrite table sogou.uid_cnt select uid, count(*) as cnt
>from sogou.sogou_ext_20211103 group by uid;

这样前端开发人员就可以访问该临时表，并将数据显示出来，显示方式可以根据实际需要来进行设计，如表格、统计图等。

你可能感兴趣的:(hive,数据仓库,数据分析,hive)

Hive 面试题昨夜为你摘星
什么是Hive?Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。Hive的意义（最初研发的原因）?降低程序员使用Hadoop的难度，降低学习成本Hive的内部组成模块，作用
hivePB级迁移方案我要用代码向我喜欢的女孩表白数据库 bigdata-大数据专栏 hive
1、评估磁盘空间大小、调整副本数、设置heapsize大小2、distcp-i-skipcrccheck源端到目标端，迁移3、元数据迁移，建表，替换location地址，或者导出db4、表分区修复5、配置增量T-1迁移或者T-26、校验历史分区脚本，表结构，大小，文件数7、根据ditcp不对的，进行补数脚本，删分区，重拉8、任务校验，客户跑完任务后，校验指定分区的count数和内容的md59、任务
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
电竞数据怎么助力创业者在电竞行业发展 sanx18 人工智能
电竞数据对于创业者在电竞行业的发展有着非常大的助力作用，特别是在以下几个方面：1.精准市场定位与需求分析创业者可以通过电竞数据分析了解行业趋势、用户需求和市场痛点。例如，通过分析观众的观看行为、玩家的活跃度、不同游戏的受欢迎程度等数据，创业者可以更好地确定进入电竞行业的切入点，找到未被满足的市场需求。这样能够大大降低市场调研的成本，提高决策的准确性。2.个性化产品与服务开发电竞数据可以帮助创业者开
《Python入门+Python爬虫》——6Day 数据库可视化——Flask框架应用不摆烂的小劉 python python flask 爬虫
Python学习版本:Python3.X观看：Python入门+Python爬虫+Python数据分析1.Flask入门1.1关于Flask1.1.1了解框架Flask作为Web框架，它的作用主要是为了开发Web应用程序。那么我们首先来了解下Web应用程序。Web应用程序(WorldWideWeb)诞生最初的目的，是为了利用互联网交流工作文档。一切从客户端发起请求开始。所有Flask程序都必须创建
python爬虫项目（一百九十八）：电商平台用户行为数据分析与推荐系统、爬取电商平台用户行为数据人工智能_SYBH 爬虫试读 2025年爬虫百篇实战宝典:从入门到精通 python 爬虫数据分析开发语言信息可视化 okhttp
在现代电商平台中，用户的行为数据对于优化用户体验、提升销量以及个性化推荐至关重要。通过抓取和分析用户的浏览、点击、购买等行为数据，电商平台能够更好地了解用户的偏好，从而推荐相关产品，增加用户的黏性和购买意愿。本篇博客将详细介绍如何通过爬虫技术抓取电商平台的用户行为数据，并结合数据分析和推荐算法，构建一个简单的推荐系统。目录一、电商平台用户行为数据二、爬虫技术实现2.1网站分析2.2使用Seleni
Hive基本操作小肥柴呀 Apache Hive hive 数据库
Hive基本操作1.Hive常用命令1.1Hive启动1.2Hive退出1.3Hive查看历史命令1.4Hive常用交互命令2.数据库基本操作2.1创建数据库2.2创建数据库并指定hdfs存储位置2.3删除空数据库2.4强制删除非空数据库2.5查看所有数据库2.6查看数据相关信息2.7数据库切换2.8修改数据库3.数据表基本操作3.1创建表3.1.1创建表的方式3.1.2创建内部表3.1.3创建外
hive迁移补数脚本细粒度表名-分区唯一键我要用代码向我喜欢的女孩表白 hive hadoop 数据仓库
假设我通过对数脚本发现，这些表对不上。假设检测出来是这样的（这些表存在于源端，但不存在目标端）我们需要从源端迁移过去。diff.txtads_xx1dt=20250219ads_xx2dt=20250217ads_xx2dt=20250218ads_xx2dt=20250219ads_xx3dt=20250217ads_xx4dt=20250217bak_xx1dt=20250109bak_xx1
四、数据湖应用平台架构 moton2017 大数据治理大数据数据湖数据管理数据架构数据安全大数据管理数据仓库
数据湖应用平台是一个用于存储、处理和分析大容量、用途数据的平台。它旨在以隐蔽、高效率的方式，为企业提供全面的数据管理和应用能力。核心概念数据湖：一个集中各种原始格式数据的存储库，包括格式化数据、半格式化数据和非格式化数据。数据应用：基于数据湖构建的各种数据分析、挖掘和应用服务，例如：数据图表线路商业智能预测分析1.要素组成一个典型的数据湖应用平台架构通常包括以下几个核心组件：数据采集层：从各种数据
如何使用Python爬虫实时获取股票行情数据并进行分析：完整教程 Python爬虫项目 2025年爬虫实战项目爬虫 python 开发语言信息可视化 c++
前言在金融领域，股票行情的实时获取和分析是投资决策中至关重要的一环。借助Python的强大生态系统，结合爬虫技术和数据分析库，投资者可以实时获取股票行情数据，并通过各种算法和模型进行深入分析。本教程将从零开始，带你深入学习如何使用Python爬取股票行情数据并进行分析。一、爬虫技术概述爬虫是从网络上自动提取信息的程序，它可以帮助我们获取互联网数据。在股票分析中，爬虫技术的应用非常广泛，尤其是通过A
【数据仓库】数仓分层设计数据仓库数据分析
一、为何分层？随着信息技术的快速发展，传统数据库已经无法存储和处理海量的数据，数据仓库应运而生。官方说明：数据仓库是用于支持企业决策制定和分析，它通过将不同来源的数据整合在一起，为用户提供一致、全面且易于访问的数据视图。可以简单理解为数据仓库就是专门用来存储和分析海量的历史数据，让数据真正地产生价值，为企业赋能。之前看到过一句话说的很不错，数据仓库的第一性原理是什么？就是以通过整合、优化和管理数据
【数据仓库】指标管理数据仓库
一、指标介绍什么是指标？指标就是用来量化事物的一个工具，帮助我们去将一些抽象的事件得出一个轮廓上的描述。例如我们可以从指标上判断一个产品的好坏，用户粘性等等，例如我们通过日活能去判断出我们整个产品的用户量，从而能反应出我们这个产品的一个健康程度。那么数据仓库中，建立指标体系有以下几点核心意义：统一数据口径，消除歧义（各部门对指标定义不统一）支撑业务决策，提升效率（监控业务健康度）优化资源分配，成本
基于Pandas库封装Excel工具类忆想不到的晖 python pandas github excel 工具类
引言Excel是一种广泛使用的电子表格软件，它提供了大量的数据处理和计算功能，被广泛应用于数据分析和报告中。在Python中，我们可以使用pandas库来读写和处理Excel文件。但是，为了更方便和快速地操作Excel文件，我们可以封装一个Excel工具类，提供常用的读写操作方法，以提高开发效率。本文将介绍如何使用Python封装Excel操作工具类，并提供相应的例子说明。1、列表转Excel文件
阿里云服务器的作用腾云服务器阿里云服务器云计算
使用阿里云服务器能做什么？大家都知道可以用来搭建网站、数据库、机器学习、Python爬虫、大数据分析等应用，阿里云服务器网来详细说下使用阿里云服务器常见的玩法以及企业或个人用户常见的使用场景：玩转阿里云服务器使用阿里云服务器最常见的应用就是用来搭建网站，例如个人博客、企业网站等；除了搭建网站还可以利用阿里云GPU服务器搭建机器学习和深度学习等AI应用；使用阿里云大数据类型云服务器做数据分析；利用云
数据湖构建 HaoHao_010 服务器云服务器云计算阿里云
阿里云的数据湖构建（DataLake）是一种用于存储和处理大量不同类型数据的解决方案，通常用于大数据分析和机器学习等应用场景。数据湖与传统的数据仓库不同，它能够存储结构化、半结构化和非结构化数据，支持大规模数据的整合、存储、查询和分析。阿里云提供了一整套工具和服务来帮助企业构建数据湖，以下是数据湖构建的主要步骤和关键服务：1.数据湖概述数据湖是一种统一的数据存储库，能承载来自多个来源的数据，包括：
国产唯一开源湖仓框架LakeSoul 2.0 重磅升级：支持快照回滚、Flink和Hive对接元灵数智大数据数据库 spark
首先，附上Github链接LakeSoul：https://github.com/meta-soul/LakeSoul，可搜索公众号元灵数智，在底部菜单了解我们-用户交流获取官方技术交流群二维码，进群与业内大佬进行技术交流。DMetaSoul团队于7月初发布了LakeSoul2.0版本，对1.0版本进行了多方面升级优化，提高了自身架构设计的灵活性，也更好地适应客户未来业务高速发展的需要。2.0版本
考证好像真的能改变一个人‼️ 小猫椰椰探潜数据分析数据分析职场和发展大数据
考完这些证书，我真的感觉自己变样了。BDA初级数据分析师、BDA中级数据分析师、CPBA商业分析师3个方向，文科生的我，原本没有听过这些证书，但进入职场才知道，多一项技能，多一份优势刚毕业的时候，我考了BDA初级数据分析师，那个时候就尝到了甜头，不仅让简历更漂亮了，自己也掌握了数据分析技能后来的几年，我又陆陆续续考了BDA中级数据分析师和CPBA商业分析师3个方向的证书，看着这些证真的有满满的成就
冷门吃香的四个职业小猫椰椰探潜数据分析数据分析职场和发展大数据
数据分析师、商业分析师、互联网营销师、全媒体运营师…这些职业大多数人都很陌生，但是在这个内卷的时代，已经成为很多人的新选择、新出路，冷门又高薪。今天总结了这四个职业的基本信息，看看有没有你感兴趣的我是在【探潜数据分析】报名并学习的BDA数据分析师和CPBA商业分析师，两个证我都拿到手了，探潜的老师们很有耐心，一对一辅导我到拿证。我的工作因为这两个证改善很多#探潜数据分析#探潜学堂#BDA数据分析#
数据挖掘与数据分析「已注销」数据分析数据挖掘数据分析人工智能
目录数据挖掘与数据分析一．数据的本质二．什么是数据挖掘和数据分析三．数据挖掘和数据分析有什么区别案例及应用1.基于分类模型的案例2.基于预测模型的案例3.基于关联分析的案例4.基于聚类分析的案例5.基于异常值分析的案例6.基于协同过滤的案例7.基于社会网络分析的案例8.基于文本分析的案例结语数据挖掘与数据分析在当今数字化的时代，数据成为了我们生活和工作中不可或缺的一部分。数据的价值在于其所蕴含的信
shell字典数组吃不到的烤鱼 shell脚本
转自:http://www.firefoxbug.com/index.php/archives/2369/#shell字典数组#!/bin/bashecho"shell定义字典"#必须先声明declare-Adicdic=([key1]="value1"[key2]="value2"[key3]="value3")#打印指定key的valueecho${dic["key1"]}#打印所有key值e
在数据分析工作中运用因果推断模型的实践指南 theskylife #因果分析数据分析大数据人工智能 AI 因果分析
目录1.写在开头2.因果推断模型的基础2.1因果关系vs.相关关系2.2基本概念和术语3.常见的因果推断方法3.1随机对照试验（RCTs）3.2工具变量法（IV）3.3回归不连续设计（RDD）4.因果推断的实际应用4.1案例研究1：使用RCTs分析营销活动的效果4.1.1背景和问题描述4.1.2实验设计和数据收集4.1.3数据分析和结果解释4.2案例研究2：应用工具变量法解决价格对销量的影响问题4
大语言模型：数据分析报告自动化的未来趋势 theskylife 个人随笔数据分析语言模型数据分析自动化人工智能大语言模型
目录写在开头1.数据分析报告的传统挑战时间消耗技术壁垒错误风险可扩展性问题更新频率限制用户交互和定制化不足整合新技术的挑战2.大语言模型在报告生成中的作用自动化文本生成增强准确性和丰富性实时数据处理能力提高可访问性和用户交互3.一种实现的思路3.1.明确目标与设定任务3.2.数据准备3.3.使用大语言模型生成初步内容3.4.内容整合与优化3.5.数据可视化3.6.报告完善与发布3.7实际应用中的关
python天气数据分析与处理,用python数据分析天气 2401_84504019 人工智能
本篇文章给大家谈谈python天气预报可视化分析报告，以及基于python的天气预测系统研究，希望对各位有所帮助，不要忘了收藏本站喔。基于大数据重庆市气象数据分析摘要信息化社会内需要与之针对性的信息获取途径，但是途径的扩展基本上为人们所努力的方向，由于站在的角度存在偏差，人们经常能够获得不同类型信息，这也是技术最为难以攻克的课题。针对气象数据等问题，对气象信息进行研究分析，然后开发设计出气象数据分
HTTP 协议星竹服务器 http 网络协议服务器
项目：csdn:https://blog.csdn.net/2303_76953932/article/details/142704176?spm=1001.2014.3001.5501halo:https://xingzhu.top/archives/webfu-wu-qi-xiao-xiang-mu-linux-c-epoll说明：参考学习:https://www.bilibili.com/v
[python脚本]论文1.（一）CPU/内存数据分析和分组 weixin_45396500 python 数据分析开发语言
CPU收集到的CPU数据，格式如下：由于这里6个数据为一组来收集latency的数据以及各个分位值的数据，而本质上每一行都是一次完整的测试，因此这里将这个csv文件分为两个文件，第一个是和latency相关的，将6条数据融合为一条，而剩下的数据比如eps等，单独整理为一个文件。这里分为两步，第一步单独处理每个实例收集到的数据，第二步是汇总所有实例数据。对于50个实例收到的数据，先通过将6条合并为一
【数据分析】4 商业数据分析技能模型总结 loyd3 数据分析数据分析数据挖掘
优秀的商业分析师需要具备的能力数据分析能力逻辑思维能力赢得结果能力一、数据分析能力扩展：工具链生态与进阶场景1.数据获取技术升级企业级数据源管理：数据湖架构（AWSS3/阿里云OSS）与数据仓库（Snowflake/Redshift）权限管理API自动化采集（Postman+PythonRequests模块）反爬虫策略突破（IP代理池/Selenium模拟登录）新兴数据源拓展：社交舆情数据（Twi
图神经网络：拓扑数据分析的新时代 Jason_Orton 神经网络数据分析人工智能
随着图数据的广泛应用，图神经网络（GraphNeuralNetwork,GNN）作为一种强大的深度学习工具，逐渐成为机器学习领域中的一颗新星。图数据在许多现实世界问题中无处不在，诸如社交网络、交通网络、分子结构、推荐系统等都可以被建模为图结构。图神经网络通过直接处理图结构数据，能够更好地捕捉节点之间的关系信息，从而在众多任务中展现出了优异的性能。本文将深入探讨图神经网络的基本原理、常见的算法、应用
A100 解析：为何它成为 AI 大模型时代的首选？ PPIO派欧云算力 gpu算力算法 ai
前言NVIDIAA100TensorCoreGPU可针对AI、数据分析和HPC应用场景，在不同规模下实现出色的加速，有效助力更高性能的弹性数据中心。A100采用NVIDIAAmpere架构，是NVIDIA数据中心平台的引擎。A100的性能比上一代产品提升高达20倍，并可划分为七个GPU实例，以根据变化的需求进行动态调整。A100提供40GB和80GB显存两种版本，A10080GB将GPU显存增加了
Python 网络爬虫入门全知道安年CJ Python python 爬虫开发语言运维 php 服务器
一、引言在当今数字化时代，网络上的数据量呈爆炸式增长。无论是进行数据分析、市场调研，还是开发智能应用，获取网络数据都变得极为重要。而Python网络爬虫就是一把打开网络数据宝库的利器。它能够自动地从网页中抓取我们需要的信息，为后续的数据处理和分析提供丰富的素材。本博客将带领大家逐步走进Python网络爬虫的精彩世界。二、网络爬虫基础概念（一）什么是网络爬虫网络爬虫，也称为网页蜘蛛，是一种按照一定的
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他