weixin_33738555

hive 的日志处理统计网站的 PV 、UV案例与给合 python的数据清洗数据案例

一：hive 清理日志处理统计PV、UV 访问量

二： hive 数据python 的数据清洗

一：日志处理

统计每个时段网站的访问量:

1.1 在hive 上面创建表结构：

在创建表时不能直接导入问题
create table db_bflog.bf_log_src (
remote_addr string,
remote_user string,
time_local string,
request string,
status string,
body_bytes_sent string,
request_body string,
http_referer string,
http_user_agent string,
http_x_forwarded_for string,
host string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
  "input.regex" = "(\"[^ ]*\") (\"-|[^ ]*\") (\"[^\]]*\") (\"[^\"]*\") (\"[0-9]*\") (\"[0-9]*\") (-|[^ ]*) (\"[^ ]*\") (\"[^\"]*\") (-|[^ ]*) (\"[^ ]*\")"
)
STORED AS TEXTFILE;

1.2 加载数据到 hive 表当中：

load data local inpath '/home/hadoop/moodle.ibeifeng.access.log' into table db_bflog.bf_log_src ;

1.3 自定义UDF函数

1.3.1：udf函数去除相关引号

package org.apache.hadoop.udf;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

/**
 * * New UDF classes need to inherit from this UDF class.
 * 
 * @author zhangyy
 *
 */
public class RemoveQuotesUDF extends UDF {

    /*
    1. Implement one or more methods named "evaluate" which will be called by Hive.
    2."evaluate" should never be a void method. However it can return "null" if needed.
    */
    public Text evaluate(Text str){
        if(null == str){
            return null;
        }

        // validate 
        if(StringUtils.isBlank(str.toString())){
            return null ;
        }

        // lower
        return new Text(str.toString().replaceAll("\"", ""));
    }

    public static void main(String[] args) {
        System.out.println(new RemoveQuotesUDF().evaluate(new Text("\"GET /course/view.php?id=27 HTTP/1.1\"")));
    }
}

1.3.2：udf函数时间格式进行转换

package org.apache.hadoop.udf;

import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Locale;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

/**
 * * New UDF classes need to inherit from this UDF class.
 * 
 * @author zhangyy
 *
 */
public class DateTransformUDF extends UDF {

    private final SimpleDateFormat inputFormat = new SimpleDateFormat("dd/MMM/yy:HH:mm:ss", Locale.ENGLISH) ;
    private final SimpleDateFormat outputFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss") ;

    /*
    1. Implement one or more methods named "evaluate" which will be called by Hive.
    2."evaluate" should never be a void method. However it can return "null" if needed.
    */
    /**
     * input:
     *      31/Aug/2015:00:04:37 +0800
     * output:
     *      2015-08-31 00:04:37
     */
    public Text evaluate(Text str){
        Text output = new Text() ;

        if(null == str){
            return null;
        }

        // validate 
        if(StringUtils.isBlank(str.toString())){
            return null ;
        }

        try{
            // 1) parse 
            Date parseDate = inputFormat.parse(str.toString().trim());
            // 2) transform
            String outputDate = outputFormat.format(parseDate) ;
            // 3) set
            output.set(outputDate);
        }catch(Exception e){
            e.printStackTrace();
        }

        // lower
        return output;
    }

    public static void main(String[] args) {
        System.out.println(new DateTransformUDF().evaluate(new Text("31/Aug/2015:00:04:37 +0800")));
    }
}

将RemoveQuotesUDF 与 DateTransformUDF 到出成jar 包 放到/home/hadoop/jars 目录下面：

1.4 去hive 上面生成 udf 函数

  RemoveQuotesUDF 加载成udf函数 ：

  add jar /home/hadoop/jars/RemoveQuotesUDF.jar ;

  create temporary function My_RemoveQuotes as "org.apache.hadoop.udf.RemoveQuotesUDF" ;

  DateTransformUDF 加载成udf 函数：

  add jar /home/hadoop/jars/DateTransformUDF.jar ;

  create temporary function My_DateTransform as "org.apache.hadoop.udf.DateTransformUDF" ;

1.5 创建生成所要要求表：

create table db_bflog.bf_log_comm(
remote_addr string,
time_local string,
request string,
http_referer string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
STORED AS ORC tblproperties ("orc.compress"="SNAPPY");

从原有表中提取相关的数据处理：

insert into table db_bflog.bf_log_comm select remote_addr, time_local, request, http_referer from db_bflog.bf_log_src ;

执行sql 统计每小时的pv 访问量：

select t.hour,count(*) cnt
from
(select substring(my_datetransform(my_removequotes(time_local)),12,2) hour from bf_log_comm) t
group by t.hour order by cnt desc ;

二： hive 数据python 的数据清洗

  统计国外一家影院的每周看电影的人数
  测试数据下载地址：

 wget http://files.grouplens.org/datasets/movielens/ml-100k.zip
 unzip ml-100k.zip

2.1 创建hive 的数据表

 CREATE TABLE u_data (
  userid INT,
  movieid INT,
  rating INT,
  unixtime STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

2.2 加载数据：

LOAD DATA LOCAL INPATH '/home/hadoop/ml-100k/u.data'
OVERWRITE INTO TABLE u_data;

2.3 创建weekday_mapper.py 脚本

import sys
import datetime

for line in sys.stdin:
  line = line.strip()
  userid, movieid, rating, unixtime = line.split('\t')
  weekday = datetime.datetime.fromtimestamp(float(unixtime)).isoweekday()
  print '\t'.join([userid, movieid, rating, str(weekday)])

2.4 创建临时hive 表用于提取数据：

 CREATE TABLE u_data_new (
  userid INT,
  movieid INT,
  rating INT,
  weekday INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';

增加python 脚本到hive

add FILE /home/hadoop/weekday_mapper.py;

2.5 从旧表中数据提取

INSERT OVERWRITE TABLE u_data_new
SELECT
  TRANSFORM (userid, movieid, rating, unixtime)
  USING 'python weekday_mapper.py'
  AS (userid, movieid, rating, weekday)
FROM u_data;

2.6 查找所需要的数据：

SELECT weekday, COUNT(*)
FROM u_data_new
GROUP BY weekday;

转载于:https://blog.51cto.com/flyfish225/2097283

你可能感兴趣的:(hive 的日志处理统计网站的 PV 、UV案例与给合 python的数据清洗数据案例)

校长老刘文字黔言
●小小说校长老刘文/黔北2017最近老刘很烦恼。烦恼的原因不是学校教学质量下滑和校园安全出现了问题，在老刘苦口婆心几天一个会的正确领导下，学校教学质量可谓一直名列县城小学前茅，安全方面每年也拿州级、省级示范校。让他烦恼闹心的是，他拟提拔为校长助理的几个中层干部，都不约而同地出了事，让他吃不下饭，睡不着觉。一个是办公室主任小张。天还没亮，睡的迷糊的老刘被肥腻的老婆齐肉肉地压在身下，在老刘兴奋激昂想和
【静静日记】第391篇：学时间管理，成为人生赢家Day1 静靖的故事
7月5日郑州晴好书《高能要事》一起读！“高能要事”是时间管理的核心！时间管理能力，是不断精进的过程，从今天开始重新学习叶武滨老师时间管理九段，过线上人生！如何如何实现高能？就是每个人每一天都要利用最优质的时间空间和最旺盛的精力，去选择并首先完成对人生有积极影响的事情，如此就可以创造你想要的人生，实现16倍的效能跃升。生活中的三类人，你中枪了吗？第一类，忙死。忙死的人，白天过不好，晚上睡不好，生活一
绘本书评《七只瞎老鼠》——绘本是如何引发幼儿想象力的绘本发烧友
绘本《七只瞎老鼠》《七只瞎老鼠》可以说是《盲人摸象》的老鼠版，我们都知道这是一个有关“部分”和“整体”的哲学小故事，对于这本书来说，大部分的篇幅都是在写当一只老鼠观察了局部之后所得出的答案，而这些描述对幼儿来说正是一个发展想象力的绝佳时机，这时就需要良性的互动，因为良性的互动更有利于幼儿主动的思考。七只瞎老鼠遇到了一个“怪东西”（大象），吓的它们急急忙忙跑回了家。星期一，红老鼠出来想“看”个究竟。
《狂飙》剖析陈书婷的智慧（借势布局篇）本初说剧
《狂飙》里，陈书婷究竟有多聪明？出场虽不多，但一出手就能绝处逢生，转败为胜。看懂了大嫂的这几波操作，你才能真正体会到大哥的那句：没有你，我不行的。第一任老公白江波死后，陈书婷处于绝对不利的位置，靠山倒了台，仇家在追杀，但她并没有因为这些乱了阵脚，而是暗中调查清楚关键的人证，并利用这个消息获得了警方的保护。之后又借高家兄弟之手除掉了自己最大的威胁徐江。陈书婷借机会介绍高启强认干爹，那场戏很有看点，高
谈谈怎么从网上找人帮忙投票，小程序投票快速涨票的实用方法神州网络公司
谈谈怎么从网上找人帮忙投票，小程序投票快速涨票的实用方法怎样使投票的次数增加要快速涨票需要采取以下措施：1.社交平台宣传：在各种社交平台上发帖或发布动态，分享投票链接并鼓励朋友们投票，可以快速增加票数。2.利用群体优势：在社交群或者朋友圈里面发起投票活动，邀请亲朋好友参与投票，可以快速涨票。3.利用其他渠道宣传：可以借助微信、微博等大众传媒，将投票链接分享出去，提高b光率，增加投票量。4.利用奖励
一比一高仿maxmara衣服，大家在哪买？高端顶级奢侈品
一比一高仿maxmara衣服在哪买MaxMara是意大利风格的象征标志，其成衣系列独具高级定制女装的剪裁设计、奢华材质以及精致细节，彰显了这一品牌系列的优雅自信与现代品味。MaxMara由极富远见的AchilleMaramotti创立于1951年，以其时尚的外套、简约的单品、干练的西装和优雅的配饰而闻名。MaxMara系列如今远销90多个国家和地区，共有2254个销售网点，而且是MaxMara集团
深入解析 SymPy 中的符号计算：导数与变量替换的实践指南老歌老听老掉牙 python sympy
在符号计算领域，SymPy作为Python的核心代数库，为数学推导提供了强大支持。然而，当处理复杂表达式时，用户常遇到两个典型挑战：函数导数的正确计算和变量的有效替换。本文将深入探讨这些问题，提供专业解决方案，并揭示其背后的数学原理函数导数的正确计算方法问题本质分析在SymPy中计算导数时，常见错误是将函数视为独立符号而非变量依赖关系。考虑以下情景：h=symbols('h')R_h=symbol
全球气温逐年增高 CATTLECODE 人工智能
根据全球主要气候监测机构的权威数据，**全球气温确实在持续升高**，且呈现加速趋势。以下是关键事实和数据分析：一、科学共识与核心数据长期升温趋势（1880-2023）：工业革命前（1850-1900）相比：全球平均气温上升约1.45°C2023年成为有记录以来最热年份（比19世纪基线高1.48°C）过去10年（2014-2023）是史上最热的十年（WMO数据）加速升温证据：二、权威机构数据验证机构
springboot+vue生态系统的气象数据可视化平台Java+python-计算机毕业设计
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
对话访谈 | 盘古信息×锐明科技：中国企业高质量出海“走进去”和“走上去”
2025年4月28日上午，锐明技术越南第二工厂落成仪式在越南北宁圆满落幕。盘古信息与锐明团队齐聚越南，共同见证这一重要时刻。这期采访是我们首次来到海外，走进了美丽的越南，与锐明技术的COO刘垒展开了一场关于中国企业出海的深度对话。锐明技术作为一家全球化公司，在出海的道路上步伐坚定且成果显著，其经验对于众多想要“走出去”的中国企业来说，具有重要的借鉴意义。本期将采访内容总结为：破局、升维、突围一、破
记录此刻心情心灵诉说的港湾
上午找了一上午工作，竟然觉得自己有些迷茫了，找不到方向。太累了，休息休息下午继续。在这个时候，你认为你最在乎的人却还在跟你没事找事。心情是真的不爽。可又能怎么办呢？不得不说自私的人，我现在啥也不想说，啥也不想问，能承受的默默承受吧。熬过一阵就好了。我一直都是在掏心掏肺的对别人好，而当你发现别人是利用你的善良在成全自己的同时，心里是什么滋味，什么感受呢？我怕他怎么样，他就故意这样做，这些都是以前了。
精神明亮的人阅读答案（2017德州中考）想逢一笑
精神明亮的人王开岭（1）十九世纪的一个黎明，在巴黎乡下一栋亮灯的木屋里，居斯塔夫•福楼拜在给最亲密的女友写信:“我拼命工作，天天洗澡，不接待来访。不看报纸，按时看日出(像现在这样)。我工作到深夜，窗户敞开，不穿外衣，在寂静的书房里……（2）“按时看日出”，我被这句话碎然绊倒了。（3）一位以“面壁写作”为誓志的世界文豪一个如此吝惜时间的人，却每天惦记着“日出”，把再寻常不过的晨曦之降视若一件盛事，当
大模型日报10月21日大模型空间站人工智能
资讯篇资讯01清华开源混合精度推理系统MixQ量化权重与激活：MixQ同时量化权重和激活，使用INT8/INT4张量核心进行推理加速，并通过FP16张量核心处理少量激活中的离群值，既保持精度又提升吞吐量。其混合精度量化策略使推理精度几乎无损，精度下降不到0.1%。等价变换优化计算图：MixQ基于离群点的局部性，优化了混合精度推理的计算图，避免了重复检查离群点的开销。通过量化系数中的amax值判断矩
C51 贪吃蛇基于 Proteus V1.0 ForesterX proteus 单片机嵌入式硬件贪吃蛇 C51
文章目录0.效果演示1.开发环境2.项目地址3.项目目录4.设计与开发4.1整体原理图4.2方向键模块4.3点阵模块4.4整体逻辑说明4.4.1点阵怎么刷新4.4.2按键在哪里检测4.4.3蛇怎么移动4.4.4游戏规则4.5main.c5.不足与展望0.效果演示视频演示：C51单片机贪吃蛇基于Proteus1.开发环境系统：window10专业版。开发软件：Keil5仿真软件：ProteusPS：
Python：勾股数 Dominick_Su Python编程 python 开发语言后端
找出一定范围内的勾股数a,b,c（均为正整数），而且三个数互质。importmathMAX=100#设定范围,a,b,c都在100以内PN=[]#PythagoreanNumber勾股数forainrange(2,int(MAX//math.sqrt(2))+1):forbinrange(a+1,int(math.sqrt(MAX*MAX-a*a))+1,2):c=int(math.sqrt(s:
抖音优惠券怎么获取的?抖音满减优惠券怎么领取? 好项目氧券
详解抖音优惠券如何获取，抖音满减优惠券怎么领取随着抖音的火热，越来越多的用户在抖音平台上发现了一种新的优惠方式——抖音优惠券。通过领取和使用抖音优惠券，用户可以在抖音购物时享受到更多的折扣和优惠。那么，如何获取抖音优惠券，以及如何领取抖音满减优惠券呢？本文将为您详细解答。一、抖音优惠券获取方式1.直接领取优惠券用户可以在抖音官方网站或客户端上直接领取优惠券。进入抖音官网或客户端，在页面中找到优惠券
tar排除特定文件 hi error.cn 前端服务器数据库经验分享
tar排除特定文件在Linux系统中，tar命令是一个非常强大的工具，用于归档和压缩文件或目录。有时候，你可能需要在创建归档文件时排除某些特定的文件或者目录。本文将详细介绍如何使用tar命令来排除特定文件。1.使用--exclude参数tar命令中常用的参数之一是--exclude，它可以用来指定要从归档中排除的文件或目录。基本格式如下：tar[选项]--exclude='模式'-czvf归档文件
很热的冬至 Jaween
冬至的周末，热，难以想象，在冬至这一天，我不仅没有吃到饺子，却能上天台嗮被子，我的世界观都崩塌了。这绝对是我与众不同的周末，因为这个周末只有一天。上周公司发了邮件，下周二公司停电，就把周二的工作日提到了明天，就一改变，导致我整个周末的心情都不好了，整天心想着明天要上班，连过周末的心都没有了。当我们熟悉了我们所认知的生活，它一旦发生的改变，我们就会变得忧心忡忡。就好比如，冬至，我们穿着短袖上天台嗮被
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
我的暑假见闻分享记甯甯的花儿
同学们：两个月的暑假，说快不快，说慢也不慢，这两个月的时间里，你们的收获有哪些呢？我先来跟大家说一说，我的暑假见闻吧！众所周知，在期末考试前两天，我被学校临危受命，去参加县里的新课标考试，学校在两百多位教师中，派出语文数学老师各3人，英语一人，一共是七个人参加考试。大家都知道，为了让我们全心备考，我是连监考改卷都没参加，你们放假了，我依然还要来学校学习，最艰难的时候，背了忘忘了背，精神压力特别大，
2019.6.8 crescent_新月
鲇鱼效应充分体现了竞争的重要性。竞争对于人的发展和社会的进步都有促进作用。它给我们以直接现实的追求目标，赋予我们压力和动力，能最大限度地激发我们的潜能，提高我们的学习和工作效率，使我们在竞争、比较中客观地评价自己，发现自己的局限性，提高自己的水平。
2019-05-16 海牙kyogre
前端优化动画性能之requestAnimationFrame@(技术分享)在前端做动画很多人第一人的反应是用定时器，比如setInterval、setTimeout，除此之外css3可以使用transition和animation来实现。而编写动画循环的关键是要知道延迟时间多长合适。一方面，循环间隔必须足够短，这样才能让不同的动画效果显得平滑流畅；另一方面，循环间隔还要足够长，这样才能确保浏览器有
有哪些在手机上做的兼职副业？整理了8个正规手机兼职项目氧惠全网优惠
随着智能手机的普及和技术的不断进步，越来越多的人开始寻求利用手机进行的兼职副业。大家都希望能找到一份既方便自由安排时间，又能带来额外收入的兼职工作。那么，在手机上可以做哪些兼职副业呢？以下是我们整理的8个正规手机兼职项目，希望能为大家提供一些参考和帮助。对于没有接触过副业兼职，又想踏入其中的人也推荐一个适合新手小白的平台1.游戏陪玩随着电子竞技产业的蓬勃发展，游戏陪玩已经成为一个新兴且受欢迎的职业
宝妈可以做的兼职工作有哪些？分享十个适合女生的兼职副业平台，手机电脑可做氧惠好物
在这个快节奏的时代，越来越多的宝妈渴望拥有自己的兼职副业，以增加收入、提升技能或实现个人价值。晚上是空闲时间比较多的时候，这个时间段可以做很多事情，本文将为你详细介绍八种当下热门的兼职工作，助你找到心仪的副业方向。一，闲鱼闲鱼作为国内最大的二手交易平台，为许多热衷于二手市场的用户提供了丰富的商品资源。你可以在闲鱼上转售闲置物品，发掘隐藏的商机。只需掌握一定的市场动态，便能轻松在闲鱼上找到属于你的“
暑假随想 lily_8aed
明天就要正式上班了，暑假就要结束了。用时间静静的思考总结一下这个暑假还真是不同寻常。可以说是意义非凡，也可以说痛并快乐着。在这个暑假中宝贝女儿收到了她心怡的大学录取通知书，在这暑假我第一次开车带着全家自驾游，在这个暑假还认识了许多新朋友。还记得当女儿拿到大学通知书时兴奋的样子，我可爱的“小燕子”真的要展翅高飞了，我既不舍又高兴，以前为她所付出的一切辛苦此刻都化作了沁心的冰糖水，像个孩子似的与她抢着
DAY4精时力学习日志-【体力】冥想让你更健康更年轻波斯菊
【精时力学习日志】本训练营：2021年100天精时力营·除法今日主题：1-4【体力】冥想让你更健康更年轻学习日期：2021年12月9日1、[我记]我学(客观)+我思(主观)+正反栗子+行动：1.1睡眠限制疗法&睡眠时间计划法1.1.1[我记]睡眠限制疗法的关键点在于不困就不上床睡觉，睡眠时间计划法的关键点在于推迟就寝时间以提升睡眠质量。1.1.2[我思]检视：这个知识点和我之前的认知是一致的吗？回
2023-10-31 剐蹭了特斯拉不停的追梦人
上周六在一条小路上，与一辆停在路边的特斯拉剐蹭，剐蹭的部位只是后视镜，极轻微的摩擦。因为路面很窄，两边都着车，对面有个骑自行车的，为了避让左边，右边居然与特斯拉碰上了，只是在车上能听到“嘭”的一声，若不是声音根本意识不到，因为自己车子若不在安全距离，通常车上的警告装置会发出声音的，这次没有发出，可能与后视镜是伸出来的，可能探测不到有关。然后听到后面车鸣笛的声音，否则还没意识到车上有人。立即下来看了
麦吉丽产品适合什么年纪阶段用广州时尚王子
非常好用，网上的口碑反馈都不错。从麦吉丽素颜三部曲的成分上就能看出来，麦吉丽生物科技有限公司根据男女不同年龄、不同的肤质打造了干皮、油皮、敏感肌（使用之前先在耳后或者手心测敏，十五分钟没有红肿痒痛就可以放心使用了）都适用的套盒，而每个套盒里面都含有酵母精粹平衡水，青春浓缩精华素和贵妇美颜膏，是不是非常贴心……我们首先看酵母精粹平衡水，据说她里面蕴含着1.5亿酵母精粹，高端技术浓缩而成，同时还采用了
【成功日记108】风清雾茫
成功日记离财富最近❤️每天告诉自己，我能行！你怎么那么棒！1.我做到了早起站桩。2.我做到了梳头5分钟。3.我做到了完成阅读任务。4.我做到了坚持工作。5.我做到了经典诵读打卡，读经典增长智慧。感恩日记离幸福最近❤️感恩事情中心怀希望。感恩父母的无私付出。感恩冷冷的天预示春天到来。感恩自己单盘10分钟。感恩自己的自省。早起的1333天，早睡早起身体好。站桩的第457天，关注呼吸和放松。爱播诵读的第
最有爱的日子 11文青青
今天是个特别好的日子，2022年2月2日，大年初二。俗话说，好事成双，而且“2”的谐音是“爱”。网上说，这是“2022年最有爱的日子”，百年一遇。泰戈尔说：“爱是理解的别名。”雨果说：“人间没有爱，太阳也会灭。”因为有爱，才能在这薄凉的世界感觉到温暖。那么，最好的爱或许是被理解，被懂得，被珍惜！2022，愿所求皆所愿，所盼皆可期，所有美好都会在最后相遇！
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他