sakura小樱

大数据----Hive集成Python分析

一、Hive的基本使用
- - 1.1、HIVE的启用
  - 1.2、用法
    - - 1.2.1、简介
      - 1.2.2、实例
二、SQL进阶用法
三、PySpark集成Hive表数据分析
四、Hive+Python集成分析（电影评分数据）
- - 4.1、SQL实现实例
  - 4.2、python实现实例
五、提高:时间戳转化为星期

数据下载地址，点击这里

一、Hive的基本使用

1.1、HIVE的启用

如果安装了mysql，则要先打开mysql

1.2、用法

1.2.1、简介

Spark 大数据分析框架
-1. 功能：
类似MapReduce并行计算框架，对海量数据分析处理
-2. 数据结构：
          -a. 最原始数据结构，最核心
          RDD（弹性分布式数据集）：
          类比Python中列表
          处理数据调用函数Transformation（高阶函数）
    SparkContext: sc (实例对象名称)
          -b. 最新数据结构
              DataFrame = RDD + Schema（字段类型和字段名称）
              SparkSession: spark
              spark.read
                      cvs(.tsv)
              .json
              .jdbc
              .hdfs
              …..
       result_df.write
              .csv(.tsv)
              .json
              .jdbc
              .hdfs

=====================================================

无论是Hadoop框架还是Spark框架数据分析，最多的就是编写SQL分析
大数据机器学习中，算法的训练集数据
通常都是通过SQL语句分析而成
类似于MySQL数据库SQL语句，95%类似

SQL 语言：
提供从RDBMS中检索数据（查询数据、分析数据）
语法：
SELECT … FROM … WHERE … GROUP BY … ORDER BY …

SQL on HADOOP
能否给用户提供SQL语法，对海量数据进行分析（底层MR/Spark）

1.2.2、实例

● 创建数据库

CREATE DATABASE IF NOT EXISTS db_hive ;

● 使用数据库

USE db_hive ;

● 创建表

'''
样本数据：
00:00:00    2982199073774412    [360安全卫士]   8 3 download.it.com.cn/softweb/software/firewall/antivirus/20067/17938.html
'''
CREATE TABLE IF NOT EXISTS db_hive.sg_log(
access_time string,
user_id string,
search_word string,
sortId_clickId string,
url string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

● 加载数据文件到表中

LOAD DATA LOCAL INPATH '/home/rdedu/SogouQ.sample' INTO TABLE db_hive.sg_log ;
LOAD DATA LOCAL INPATH '/home/rdedu/SogouQ.reduced' INTO TABLE db_hive.sg_log ;

● 设置HiveQL转换MapReduce运行在LocalMode中

set hive.exec.mode.local.auto=true;

● 查看条目数

-- hive (db_hive)>
select count(1) from sg_log ;

● 查看样本数据

-- hive (db_hive)>
select * from sg_log limit 5 ;

● 删除表

DROP TABLE IF EXISTS db_hive.sg_log ;

● 设置HiveQL转换MapReduce运行在LocalMode中

set hive.exec.mode.local.auto=true;

● 对搜狗用户日志分析，一天的额数据，设置参数，以便运行在本地模式

set hive.exec.mode.local.auto.inputbytes.max = 160939050 ;

● 分析数据（依据业务）来分析

--1. 统计每个用户的PV数，降序排列desc   pv: pageview 用户浏览网页个数
SELECT user_id, COUNT(1) AS pv FROM db_hive.sg_log GROUP BY user_id ORDER BY pv DESC LIMIT 10 ;


--2.  统计每个小时的PV数
SELECT  t.hour_str, COUNT(1) AS pv 
FROM (
  SELECT SUBSTRING(access_time,0 ,2) AS hour_str, url  FROM db_hive.sg_log
)   AS t 
GROUP BY t.hour_str ORDER BY pv DESC ;


--3. 统计每个用户搜索关键词点击结果的次数
-- 从某种程度上，检验 搜索引擎底层技术
SELECT 
  user_id, search_word, COUNT(1) AS cnt
FROM
  db_hive.sg_log
GROUP BY 
  user_id, search_word
ORDER BY 
  cnt DESC 
LIMIT 20 ;


--4. 统计每个用户搜索关键词的的个数
SELECT user_id, COUNT(DISTINCT search_word) AS cnt FROM db_hive.sg_log GROUP BY user_id ORDER BY cnt DESC LIMIT 10 ;

二、SQL进阶用法

● 创建数据库

CREATE DATABASE IF NOT EXISTS db_movie ;

--创建表：用户信息表

-- 样本数据：
--  1|24|M|technician|85711
--  user id | age | gender | occupation | zip code
-- 
CREATE TABLE IF NOT EXISTS db_movie.ml_user(
user_id string,
age string,
gender string,
occupation string,
zipcode string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|';

-- 创建表： 电影评分表

-- 样本数据：    
--  196 242 3   881250949
--  user id | item id | rating | timestamp
-- 
CREATE TABLE IF NOT EXISTS db_movie.ml_rating(
user_id string,
item_id string,
rating string,
unixtime string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

● 加载数据到用户信息表

LOAD DATA LOCAL INPATH '/home/rdedu/ml-100k/u.user' INTO TABLE db_movie.ml_user ;

● 加载数据到电影评分表

LOAD DATA LOCAL INPATH '/home/rdedu/ml-100k/u.data' INTO TABLE db_movie.ml_rating ;

● 统计表中的条目数

SELECT COUNT(1) AS FROM db_movie.ml_rating ;
SELECT COUNT(1) AS FROM db_movie.ml_user ;

● 每部电影的评分人数及平均分

SELECT  
  item_id, COUNT(item_id) AS num, ROUND(AVG(rating), 2) AS avg_rating
FROM 
  db_movie.ml_rating
GROUP BY 
  item_id
ORDER BY 
  num DESC, avg_rating DESC 
LIMIT 
  10 ;

● 每个用户评分的次数和工作

SELECT 
  t1.user_id, t1.cnt, t2.occupation
FROM(
  SELECT user_id, COUNT(1) AS cnt FROM db_movie.ml_rating GROUP BY user_id ORDER BY cnt DESC 
) t1
JOIN 
  db_movie.ml_user t2 
ON
  t1.user_id = t2.user_id ;

● 将上述分析结果存储到一个临时结果表中，为后续进行分析提供方便

/*
    在Hive中使用CTAS方式创建表或将分析结果存储到新表中
        CTAS：Create Table As Select 
*/
CREATE TABLE IF NOT EXISTS db_movie.user_cnt_occu
AS
SELECT 
  t1.user_id, t1.cnt, t2.occupation
FROM(
  SELECT user_id, COUNT(1) AS cnt FROM db_movie.ml_rating GROUP BY user_id ORDER BY cnt DESC 
) t1
JOIN 
  db_movie.ml_user t2 
ON
  t1.user_id = t2.user_id ;

● 统计评分的用户中各个职业的人数

SELECT occupation, SUM(cnt) AS total FROM db_movie.user_cnt_occu GROUP BY occupation ORDER BY total DESC limit 21 ;

● 先统计有多少个职业

SELECT COUNT(DISTINCT occupation) AS cnt FROM db_movie.user_cnt_occu ;

三、PySpark集成Hive表数据分析

# SparkSQL从Hive表中读取数据

# 1. 启动pyspark交互式命令行
$ cd /opt/modules/spark-2.2.0-bin-hadoop2.7/
$ bin/pyspark --master local[2]

# 测试读取hive表的数据
spark.sql("show databases").show()

# 读取ml_user表中的数据
ml_user_df = spark.read.table("db_movie.ml_user")
ml_user_df.printSchema()

ml_user_df.groupBy('occupation').count().show()


"""
    使用SparkSession中sql函数，直接对hive表使用SQL分析
"""
week_day_df = spark.sql('SELECT weekday, COUNT(1) AS total FROM db_movie.ml_rating_new GROUP BY weekday ORDER BY total DESC')

# 复杂数据分析
user_movie_df = spark.sql("""
SELECT 
  t1.user_id, t1.cnt, t2.occupation
FROM(
  SELECT user_id, COUNT(1) AS cnt FROM db_movie.ml_rating GROUP BY user_id ORDER BY cnt DESC 
) t1
JOIN 
  db_movie.ml_user t2 
ON
  t1.user_id = t2.user_id
""")
user_movie_df.show()


# 将DataFrame 注册为一个临时视图
user_movie_df.createOrReplaceTempView('view_tmp_movie')

# 继续使用SQL分析
spark.sql('SELECT occupation, SUM(cnt) AS total FROM view_tmp_movie GROUP BY occupation ORDER BY total DESC limit 21').show()

四、Hive+Python集成分析（电影评分数据）

4.1、SQL实现实例

CREATE TABLE IF NOT EXISTS db_movie.ml_rating_new(
user_id string,
item_id string,
rating string,
weekday string
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';


-- 加载脚本文件到集群开发环境 中
add file /home/rdedu/ml-100k/unixtime_to_weekday.py ;

-- 从原数据表中读取数据，加载到 业务数据表
INSERT OVERWRITE TABLE db_movie.ml_rating_new
SELECT 
  TRANSFORM (user_id, item_id, rating, unixtime)
  USING 'python unixtime_to_weekday.py'
  AS (user_id, item_id, rating, weekday)
FROM 
  db_movie.ml_rating ;


/*
    如何使用Python脚本处理Hive表中数据？？？？
        python脚本处理表的每条数据
    遵循原则: 
        -a. 输入数据  TRANSFORM
            表中的字段
        -b. 处理数据  USING
            指定python脚本处理数据
        -c. 输出数据   AS
            输出字段
*/

--  统计一周中 每天观看电影的人数
SELECT weekday, COUNT(1) AS total FROM db_movie.ml_rating_new GROUP BY weekday ORDER BY total DESC ;

4.2、python实现实例

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
@version: v1.0
@author: Kian
@time: 2018/7/24 14:34
"""
import os
import time
from pyspark.sql import SparkSession

if __name__ == "__main__":

    # 由于在系统的环境变量中没有设置相关看见的安装目录，所以在程序中设置
    os.environ['JAVA_HOME'] = 'C:/Java/jdk1.8.0_91'
    # 设置HADOOP框架安装目录，为了HADOOP在Windows兼容性设置
    os.environ['HADOOP_HOME'] = 'C:/Java/hadoop-2.6.0-cdh5.7.6'
    # 设置SPARK框架安装目录，必须设置
    os.environ['SPARK_HOME'] = 'C:/Java/spark-2.2.0-bin-2.6.0-cdh5.7.6'

    # 实例化SparkSession对象，以本地模式是运行Spark程序
    spark = SparkSession \
        .builder \
        .appName("Hello_World_Application") \
        .master("local[2]")\
        .getOrCreate()
    # print type(spark)
    # print spark

    # 读取数据, 一行一行的读取文本文件中的数据，每行数据的字段名称为value，数据类型为字符串
    log_data = spark.read.text("datas/README.md")
    print type(log_data)
    # Row(value=u'# Apache Spark')
    print log_data.first()
    print "Count: " + str(log_data.count())
    print '\n'

    # 在Spark框架中可以将数据进行缓存，以便再次使用时，直接从缓存中读取数据
    # 默认缓存级别：MEMORY_AND_DISK，先放内存，不足放磁盘
    log_data.cache()

    # 对DataFrame中每条数据进行过滤，获取每条数据中的value字段的只值，进行筛选
    nums_spark = log_data.filter(log_data.value.contains('Spark')).count()
    nums_python = log_data.filter(log_data.value.contains('Python')).count()

    print("Lines with Spark: %i, lines with Python: %i" % (nums_spark, nums_python))

    print "==============================================="

    """
    使用SparkSession读取wc.data，进行WordCount统计
    """
    # 读取数据，数据封装在DataFrame集合中
    wc_df = spark.read.text('datas/wc.data')
    print type(wc_df)
    wc_df.show(n=5,  truncate=False)

    # DataFrame = RDD + schema, 如何将DataFrame转换为RDD
    # wc_df.rdd()

    """
    SparkSQL中对数据分析两种方式：
        -1. DSL分析
            调用DataFrame中函数
        -2. SQL分析
            需要将DataFrame注册为临时视图，编写类似MySQL中SQL进行分析
    """
    # 导入SparkSQL中函数库
    from pyspark.sql.functions import *

    word_df = wc_df\
        .select(explode(split(wc_df.value, '\\s+')).alias('word'))\

    word_count_df = word_df.groupBy('word').count()  # 操作以后, 聚合count以后的字段名称为count

    word_count_df.show()

    # fitler_df = word_df.filter("length(word_df.word.strip) > 0")
    print '======================================'

    # 注册时临时视图
    word_df.createOrReplaceTempView('view_tmp_word')
    spark.sql('SELECT word, COUNT(1) AS count FROM view_tmp_word GROUP BY word').show()

    # 读取CSV文件
    csv_df = spark.read.csv('datas/flights.csv', header=True, inferSchema=True)
    csv_df.printSchema()
    csv_df.show(n=10, truncate=False)

    csv_df.write.csv('datas/flights.tsv', header=True, sep='\t')

    # 为了查看Spark程序运行是的WEB UI界面，让线程休眠一段时间
    time.sleep(100000)

    # SparkContext Stop
    spark.stop()

五、提高:时间戳转化为星期

#!/usr/local/bin/python
# -*- coding: utf-8 -*-

import sys
import datetime

"""
  将878887116 时间戳转换为星期几
"""
# 从标准输入读取数据(913 209 2   881367150)
for line in sys.stdin:
   # 去除字符串左右空格
   line = line.strip()
   # 按照制表符进行分割
   user_id, item_id, rating, unixtime = line.split("\t")
   # 调用函数 转换时间戳为星期几
   weekday = datetime.datetime.fromtimestamp(float(unixtime)).isoweekday()
   # 标准输出
   print '\t'.join([user_id, item_id, rating, str(weekday)])

【经验总结】 PostgreSQL的COALESCE 函数用法 Xcong_Zhu 学习笔记 postgresql 数据库
COALESCE函数在PostgreSQL中是一个非常有用的函数，它不仅可以用来自动替换NULL值，还可以用于多种其他场景。COALESCE函数接受一系列的参数，并返回第一个非NULL的参数值。如果所有参数都是NULL，那么COALESCE函数将返回NULL。以下是一些COALESCE函数的常见用途：提供默认值：当你查询数据库时，如果某个字段可能包含NULL值，但你希望显示一个默认值，可以使用CO
SQL Server数据库基于SQL性能优化王小工数据库数据库 sql 性能优化
以下是SQLServer数据库SQL性能优化的实战策略，综合高频优化场景与核心技巧：一、索引优化‌1.合理创建索引‌对WHERE、JOIN、ORDERBY常用字段创建索引，优先选择选择性高的列（如唯一性高的字段）‌。使用聚集索引（ClusteredIndex）优化范围查询和排序操作，非聚集索引（Non-clusteredIndex）用于单列或组合列查询‌。避免在频繁更新的列上创建过多索引，以平衡读
T-SQL语言的物联网尤宸翎包罗万象 golang 开发语言后端
T-SQL语言在物联网中的应用引言物联网（InternetofThings，IoT）是一个迅猛发展的领域，它将各种物理设备通过互联网连接起来，实现数据的实时采集和分析。随着物联网技术的不断发展，数据的规模和复杂性急剧提升，这对数据存储、处理和分析提出了更高的要求。在众多数据库编程语言中，T-SQL（Transact-SQL）以其强大而灵活的特性，成为物联网数据管理和分析中一种重要的工具。本文将探讨
微信小程序点餐系统的设计与实现（开题报告+源码+论文）_在线点餐外卖系统设计与实现文献 2301_82243979 程序员微信小程序小程序
二.技术环境jdk版本：1.8及以上ide工具：Eclipse或者IDEA，微信小程序开发工具数据库:mysql5.7（必须5.7）编程语言:Javajava框架：ssmmaven:3.6.1详细技术：HTML+CSS+JAVA+SSM+MYSQL+VUE+MAVEN+微信开发工具三.功能设计本基于微信小程序的外卖点餐系统的设计与实现有管理员，外卖员，餐厅，用户共四个角色。管理员功能有个人中心，外
MySQL的基本使用咖啡の猫 mysql 数据库
MySQL作为最流行的关系型数据库管理系统之一，被广泛应用于各种规模的应用程序中。无论是构建小型个人项目还是大型企业级应用，掌握MySQL的基础使用对于开发者来说都是必不可少的技能。本文将带你从零开始，学习如何使用MySQL进行基本的数据操作。一、连接到MySQL服务器在开始任何操作之前，首先需要确保你已经安装并运行了MySQL服务器，并且能够通过客户端工具或命令行接口连接到它。使用命令行连接：打
SQL必知必会40-SQLite：为什么微信用SQLite存储聊天记录？程序员zhi路 MYSQL专栏 sql sqlite jvm
我在上一篇文章中讲了WebSQL，当我们在Chrome、Safari和Firefox等浏览器客户端中使用WebSQL时，会直接操作SQLite。实际上SQLite本身是一个嵌入式的开源数据库引擎，大小只有3M左右，可以将整个SQLite嵌入到应用中，而不用采用传统的客户端／服务器（Client/Server）的架构。这样做的好处就是非常轻便，在许多智能设备和应用中都可以使用SQLite，比如微信就
doris：SQL 方言兼容向阳1218 大数据 doris
提示从2.1版本开始，Doris可以支持多种SQL方言，如Presto、Trino、Hive、PostgreSQL、Spark、Clickhouse等等。通过这个功能，用户可以直接使用对应的SQL方言查询Doris中的数据，方便用户将原先的业务平滑的迁移到Doris中。警告该功能目前是实验性功能，您在使用过程中如遇到任何问题，欢迎通过邮件组、GitHubIssue等方式进行反馈。部署服务下载最新版
mybatisSql拼接报错严欣铷 sql mybatis 数据库
Column'id'inwhereclauseisambiguous;nestedexceptionisjava.sql.SQLIntegrityConstraintViolationException:Column'id'inwhereclauseisambiguousSELECTs.id,s.serial_no,s.material_requisition_id,s.material_requ
25年大数据开发省赛样题第一套，离线数据处理答案 Tometor 大数据 spark scala
省赛样题一，数据抽取模块这一模块的作用是从mysql抽取数据到ods层进行指标计算，在题目中要求进行全量抽取，并新增etl-date字段进行分区，日期为比赛前一天importorg.apache.spark.sql.SparkSessionimportjava.util.PropertiesobjectTask1{defmain(args:Array[String]):Unit={valspark
Mybatis的基本使用学c真好玩 mybatis
MyBatis简介MyBatis用于持久层框架,持久层是对数据库操作的部分，前版本iBatis由Apache软件基金组织进行更名并维护。特点:简化数据库的操作SQL映射灵活(半ORM框架)支持高级映射易于集成维护配置动态SQL缓存机制功能：替代JDBC,JDBC是java中提供的用于操作数据库的技术及方案数据库的连接控制难。连接池SQL语句硬编码。将sql语句存放到xml配置文件中参数传递问题。提
html5使用本地sqlite数据库小祁爱编程 sqlite html5 big data
html5使用本地sqlite数据库本地数据库概述在HTML5中，大大丰富了客户端本地可以存储的内容，添加了很多功能将原本必须要保存在服务器上的数据转为保存在客户端本地，从而大大提高了Web应用程序性能，减轻了服务器的负担，使用Web时代重新回到了“客户端为重、服务器端为轻”的时代。HTML5中内置了两种本地数据库，一种是SQLite,一种是indexedDBSQLite数据库使用操作本地数据库的
MySQL 事务的隔离级别重生之我在成电转码 java mysql 事务
MySQL事务的隔离级别定义了多个事务并发执行时，如何防止相互影响。隔离级别越高，数据一致性越强，但并发性能可能降低。四种事务隔离级别MySQL提供4种事务隔离级别（从低到高）：隔离级别脏读（DirtyRead）不可重复读（Non-repeatableRead）幻读（PhantomRead）1.读未提交（ReadUncommitted）❌可能发生❌可能发生❌可能发生2.读已提交（ReadCommi
主流架构模式全景解析：微服务 vs SOA vs 单体架构的终极抉择指南 Eqwaak00 分布式系统设计实战科技微服务架构
一、架构演进史：从巨石到微粒的进化之路（图示：1970s单体→2000sSOA→2010s微服务→2020s云原生）二、三大架构模式深度拆解2.1单体架构（MonolithicArchitecture）核心特征graphTDA[单体应用]-->B[用户界面]A-->C[业务逻辑]A-->D[数据访问]B-->E[Web/移动端]C-->F[订单处理]C-->G[支付处理]D-->H[MySQL]D
MySQL主从复制架构原理及部署（work）只想按时下班 Mysql mysql 数据库 memcached
文章目录一、原理1、什么是MySQL主从复制2、MySQL主从复制应用场景3、MySQL主从复制架构及原理4、MySQLbinlog日志三种模式二、主从复制配置搭建1、MySQL8二进制安装2、主从复制配置3、测试主从复制三、二进制日志管理说明四、MySQL主从复制常见问题1、从库binlog落后主库binlog？2、主库update，从库迟迟没有更新3、主从复制延时配置（从库配置）4、主从复制故
Mysql 主从复制架构百里自来卷 mysql 架构数据库
MySQL主从复制（Master-SlaveReplication）是一种常见的数据库架构，广泛用于提高数据库的可扩展性、读写分离以及数据备份和容灾恢复。主从复制架构中，一个MySQL实例作为主库（Master），负责处理所有的写操作，而一个或多个从库（Slave）从主库复制数据，并负责处理读操作。主库（Master）：主库负责处理数据库的所有写操作（如INSERT、UPDATE和DELETE），
mysqldump踩坑！！！忽略Warning 导致主备不同步喝醉酒的小白 MySQL 数据库 mysql 服务器
Warning:ApartialdumpfromaserverthathasGTIDswillbydefaultincludetheGTIDsofalltransactions,eventhosethatchangedsuppressedpartsofthedatabase.Ifyoudon’twanttorestoreGTIDs,pass--set-gtid-purged=OFF.Tomakea
ERROR 2061 (HY000): Authentication plugin ‘caching_sha2_password‘ reported error: Authentication 喝醉酒的小白 MySQL mysql java 数据库
错误信息“ERROR2061(HY000):Authenticationplugin‘caching_sha2_password’reportederror:Authenticationrequiressecureconnection.”表示MySQL数据库配置了caching_sha2_password认证插件，并要求使用安全连接来进行身份验证。该错误通常出现在以下情况下：使用的MySQL客户端
2025年2月中国数据库排行榜：OceanBase迎来开门红，金仓、GBASE排名节节高
2025年2月，中国数据库流行度排行榜正式发布。在春节之际，DeepSeek凭借突破性的技术成功出圈，而在此前，各大数据库厂商便已开始探索AI与数据库的深度融合，并陆续推出了相关产品和功能。相信在这股技术革新的浪潮下，将涌现越来越多的新产品和解决方案。接下来，我们将逐一盘点各大数据库的最新动态，探索未来的潜力与挑战。一、金仓、GBASE排名再攀升，TDSQL升第九与上月相比，榜单前十的位次出现了细
Mysql高频八股——SQL语句的执行过程钢板兽高频八股 mysql sql 数据库面试后端
大家好，我是钢板兽！今天这篇文章本来想把SQL语句的执行过程和事务与undolog、redolog的联系放在一起写的。SQL语句的执行过程中会涉及到undolog、redolog，而undolog、redolog更深入的原理也是面试中经常会问到的，所以把它们放在一起再合适不过了，但是写着写着发现内容太多，于是拆成了两篇。这篇文章会带你理解SQL语句的执行过程，在探究SQL语句的执行过程前，我们要先
【MySQL基础-3】SQL语言详解：定义、分类、注意事项与注释 AllenBright #MySQL mysql sql
SQL（StructuredQueryLanguage，结构化查询语言）是用于管理和操作关系型数据库的标准编程语言。无论是查询数据、插入新记录、更新数据还是删除数据，SQL都是与数据库交互的核心工具。本文将深入探讨SQL语言的定义、分类、注意事项以及注释的使用，帮助你全面掌握这一强大的数据库操作语言。1.什么是SQL语言？SQL是一种专门用于管理关系型数据库的编程语言。它允许用户执行以下操作：查询
【赵渝强老师】达梦数据库的目录结构数据库关系型数据库
达梦数据库安装成功后，通过使用Linux的tree命令可以非常方便地查看DM8的目录结构。tree-L1-d/home/dmdba/dmdbms#输出的信息如下：/home/dmdba/dmdbms├──bin存放DM数据库的可执行文件，例如disql命令等。├──bin2├──data数据库实例目录，该目录存放各个实例的文件。├──desktop存放DM数据库各个工具的桌面图标。├──doc存放
查看真实执行计划 sqlmonitor 数据库急诊日记 SQL优化 sql 性能优化运维数据库 java oracle
创建测试用表，及sql语句createtablet1020asselect*fromdba_objects;createtablet1020_Basselect*fromdba_objects;select/*+use_nl(A,B)leading(A)*/count(b.object_id)fromt1020A,t1020_BBwhereA.object_name=B.object_name;查
MySQL Buffer Pool、Undo Log、脏页详解学堂在线 Mysql 数据库 mysql 数据库
文章目录1.BufferPool2.UndoLog3.脏页（DirtyPage）三者的协同工作常见问题总结MySQL中的BufferPool、UndoLog和脏页是InnoDB存储引擎的核心组件，共同保障了事务处理的高效性、一致性与持久性。以下是它们的详细解释及关联：1.BufferPool作用：BufferPool是InnoDB的内存缓存区域，用于缓存数据页和索引页，减少直接访问磁盘的开销，显著
【MYSQL学习】MySQL索引：删除索引的5大绝招你GET到了吗？墨瑾轩 MySql入门~精通 mysql 学习数据库
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣MySQL索引：删除索引的5大绝招你GET到了吗？引言❓在数据库操作中，索引是一个非常重要的概念。合理的索引设计可以显著提高查询性能，而不合理的索引则可能导致性能下降。但你知道如何有效地删除索引吗？今天，我们就来一场深入浅出的探索之旅，带你了解删除索引的5大绝
Mysql-InnoDB索引：普通索引、主键索引、唯一索引、组合索引豪大大ya mysql 数据库 java
InnoDB和MyISAM的区别事务方面InnoDB支持事务，MyISAM不支持事务。这是Mysql将默认存储引擎从MyISAM变成InnoDB的重要原因之一外键方面InnoDB支持外键，而MyISAM不支持。对一个包含外键的InnoDB表转为MyISAM会失败索引层面InnoDB是聚集（聚簇）索引，MyISAM是非聚集（非聚簇）索引。MyISAM支持FULLTEXT类型的全文索引。InnoDB不
3-002： MySQL 中使用索引一定有效吗？如何排查索引效果？盖盖衍上_染染熊_代码集 00-刷题 mysql 数据库
1.索引失效的常见原因虽然索引可以加速查询，但在某些情况下，MySQL可能不会使用索引，甚至使用索引反而更慢。以下是一些常见导致索引失效的原因：①查询条件使用了!=或30时仍能利用索引。2.如何排查索引效果？可以使用EXPLAIN命令分析SQL是否走索引，以及索引的效率。①使用EXPLAIN分析SQL执行计划EXPLAINSELECT*FROMusersWHEREage=30;返回示例：idsel
4-002：如何使用 MySQL 的 EXPLAIN 语句进行查询分析？盖盖衍上_染染熊_代码集 00-刷题 mysql 数据库
EXPLAIN是MySQL中用于分析查询性能的工具，能够帮助你理解查询的执行计划。通过EXPLAIN，你可以查看MySQL如何执行查询，包括使用的索引、表连接顺序等信息。基本用法在查询前加上EXPLAIN即可：EXPLAINSELECT*FROMyour_tableWHEREyour_column='value';输出字段说明EXPLAIN的输出包含多个字段，以下是主要字段及其含义：id:查询标识
MySQL 的索引数量是否越多越好 Zero_pl Mysql基础知识面试题 mysql 数据库
MySQL的索引并不是越多越好，索引数量需要根据查询需求合理设置。虽然索引可以提高查询效率，但过多的索引也会带来额外的开销，影响数据库的性能。✅索引的优点提高查询速度索引类似于书籍的目录，可以快速查找数据，减少查询时间。如SELECT*FROMusersWHEREemail='[email protected]';，如果email字段有索引，MySQL可以直接找到匹配数据，否则需要全表扫描。加速排序（
4-001：MySQL 中的索引数量是否越多越好？为什么？盖盖衍上_染染熊_代码集 00-刷题 mysql 数据库
MySQL中的索引并不是越多越好，索引数量要合理控制！过多索引的影响增加存储开销每个索引都会占用额外的磁盘空间，索引多了，存储成本增加。降低INSERT、UPDATE、DELETE性能任何涉及数据修改的操作，都需要同时更新索引，影响性能。示例：INSERTINTOusers(id,name)VALUES(1,'Tom');，如果users表有多个索引，则插入时每个索引都需要更新，影响插入速度。可能
MyBatis底层原理深度解析：动态代理与注解如何实现ORM映射 rider189 java 开发语言 mybatis
一、引言MyBatis作为一款优秀的ORM框架，其核心设计思想是通过动态代理和注解将接口方法与SQL操作解耦。开发者只需定义Mapper接口并添加注解，便能实现数据库操作，这背后隐藏着精妙的动态代理机制与源码设计。本文将从源码层解析MyBatis如何实现这一过程。二、动态代理机制：从接口到实现类关键点：MyBatis通过JDK动态代理为Mapper接口生成代理对象，拦截所有方法调用，将其路由到SQ
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d