AAEllisonPang

ClickHouse优化技巧实战指南：从原理到案例解析

目录

ClickHouse优化核心思想
表结构设计优化
查询性能优化技巧
数据写入优化方案
系统配置调优实战
高可用与集群优化
真实案例解析
总结与建议

1. ClickHouse优化核心思想

ClickHouse作为OLAP领域的明星引擎，其优化需遵循列式存储特性，把握以下原则：

批量操作优于单行处理
预计算替代实时计算
数据有序存储提升检索效率
利用硬件资源最大化吞吐量

2. 表结构设计优化

2.1 分区键选择

选择低基数且高频过滤的字段（如日期字段）：

sql

CREATE TABLE logs (
    event_time DateTime,
    user_id Int32,
    ...
) ENGINE = MergeTree()
PARTITION BY toYYYYMM(event_time)
ORDER BY (user_id, event_time);

2.2 主键索引优化

主键顺序遵循查询模式，将高筛选字段前置：

sql

-- 查询场景：WHERE product_type=1 AND create_date>='2023-01-01'
ORDER BY (product_type, create_date, user_id)

2.3 数据类型优化

使用LowCardinality优化枚举字段
DateTime代替字符串存储时间
避免使用Nullable字段

3. 查询性能优化技巧

3.1 索引命中原则

sql

-- 低效查询：
SELECT * FROM orders WHERE total_amount > 1000

-- 优化方案：
ALTER TABLE orders ADD INDEX amount_index total_amount TYPE minmax GRANULARITY 4

3.2 物化视图预聚合

sql

CREATE MATERIALIZED VIEW sales_summary
ENGINE = SummingMergeTree()
PARTITION BY toYYYYMM(event_date)
ORDER BY product_id
AS 
SELECT 
    product_id,
    sum(sales) AS total_sales,
    count() AS transactions
FROM sales_raw
GROUP BY product_id;

3.3 查询写法优化

避免使用SELECT *
使用LIMIT采样调试
禁用JOIN改用IN查询

sql

-- 低效JOIN：
SELECT a.*, b.info 
FROM table_a a
LEFT JOIN table_b b ON a.id = b.id

-- 优化方案：
SELECT a.*, 
    (SELECT info FROM table_b WHERE id = a.id) AS info
FROM table_a a

4. 数据写入优化方案

4.1 批量写入配置

xml


    1048576
    1000

4.2 数据分片策略

sql

CREATE TABLE distributed_table 
ENGINE = Distributed(cluster_name, db_name, local_table, rand())

4.3 异步写入处理

使用Buffer表作为写入缓冲：

sql

CREATE TABLE buffer_table AS origin_table
ENGINE = Buffer(db, origin_table, 16, 10, 100, 10000, 1000000, 10000000, 100000000)

5. 系统配置调优实战

5.1 内存优化

xml


    10000000000
    16
    16

5.2 存储策略优化

冷热数据分层存储：

sql

SET storage_policy = 'hot_cold_storage'

6. 高可用与集群优化

6.1 分片副本配置

xml

6.2 查询负载均衡

sql

SELECT * FROM cluster('cluster_3shards_2replicas', db.table)

7. 真实案例解析

案例1：电商日志分析优化

问题现象：
200亿条日志数据查询响应超时

优化方案：

重建主键顺序：将user_id前置
增加物化视图：按小时预聚合
启用冷热数据分层

优化结果：
查询耗时从45s降至1.2s，存储成本降低60%

案例2：金融风控实时统计

问题场景：
每分钟处理百万级交易流水统计

解决方案：

采用AggregatingMergeTree引擎
启用TTL自动淘汰旧数据
优化写入批次为10万/批

效果提升：
写入吞吐量从5w/s提升至25w/s，CPU使用率下降40%

8. 总结与建议

定期执行OPTIMIZE FINAL清理数据碎片
使用query_log分析慢查询
关注系统表（system.*）监控运行状态
版本升级时注意配置变更项

sql

-- 查询当前正在执行的任务
SELECT * FROM system.processes
WHERE elapsed > 10
ORDER BY elapsed DESC

通过持续监控和迭代优化，ClickHouse可支撑PB级数据的亚秒级响应。建议每季度进行全链路性能评估，根据业务变化调整优化策略。

相关推荐
《ClickHouse集群管理最佳实践》
《实时数仓建设中的ClickHouse架构设计》

你可能感兴趣的:(Clickhouse,clickhouse)

SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
ClickHouse 导入数据报错愿与狸花过一生 ClickHouse clickhouse
报错信息ERROR:Thereisnolinefeed."�"foundinstead.It'slikeyourfilehasmorecolumnsthanexpected.Andifyourfilehastherightnumberofcolumns,maybeithasanunquotedstringvaluewithacomma.ClickHouse导入csv文件中发现多了一列导致报错解决方
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？数据库
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
Clickhouse源码分析-Replicated Database创建流程
前置准备DDL：CREATEDATABASEmy_replicated_dbENGINE=Replicated('/clickhouse/databases/my_replicated_db','{shard}','{replica}');这里需要你提前启动1个clickhouse，1个clickhouse-keeper。源码分析断点：bInterpreters/DDLWorker.cpp:146
ClickHouse：在 CentOS7.4 中编译 ClickHouse
目录一、环境准备二、创建编译使用的脚本三、编译ClickHouse一、环境准备1.1、CentOS版本为7.4.17081.2、从githubcloneClickHouse源码，checkout到tagv21.2.6.1-stable。cloneClickHOuse代码的时候需要把依赖的子项目也都clone下来，命令如下：gitclone--recursivehttps://github.com/
CentOS 7 编译ClickHouse 24.8完整指南
前言在CentOS7上编译ClickHouse24.8可能会遇到一些挑战，主要是因为CentOS7的默认软件版本较旧。本文将详细介绍从零开始构建ClickHouse24.8的完整过程，包括依赖安装和环境配置。准备工作首先确保系统已更新到最新版本：yumupdate-y1.安装CMakeClickHouse需要CMake3.1.7以上版本，我们安装3.25.3：wget--no-check-cert
gorm 配置数据库三金C_C go 数据库
介绍GORM是Go语言中最流行的ORM（对象关系映射）库之一，基于数据库操作的封装，提供类似DjangoORM/SQLAlchemy的开发体验。特性描述支持多种数据库MySQL、PostgreSQL、SQLite、SQLServer、ClickHouse等自动迁移自动根据struct生成数据库表结构CRUD操作简洁简洁直观的增删查改接口支持事务内置事务管理预加载一行代码加载关联数据（Preload
Clickhouse数据库的探索与安装 PerterTingle 华为云+Ubuntu操作系统 spring boot java 华为云数据库
以下是一个简洁的教程，指导你在Ubuntu系统上通过Docker下载并运行ClickHouse（一个开源的列存储数据库，专为在线分析处理OLAP设计），并确保其支持远程访问。教程基于官方文档和相关资源，适用于初学者。使用Docker部署ClickHouse教程前提条件Ubuntu系统（本教程以Ubuntu22.04为例）。已安装Docker和DockerCompose（若未安装，见下方步骤）。具有
clickhouse安装日记唯独不开心 clickhouse 数据库
#下载安装包下载地址：Indexof/repos/clickhouse#安装rpm-ivh*.rpm错误：依赖检测失败：libcrypto.so.10()(64bit)被clickhouse-compressor-1.1.54236-4.el7.x86_64需要libicudata.so.50()(64bit)被clickhouse-compressor-1.1.54236-4.el7.x86_6
信创 CDC 实战｜国产数据库的数据高速通道：OceanBase 实时入仓 StarRocks 数据库
国产数据库加速进入核心系统，传统同步工具却频频“掉链子”。本系列文章聚焦OceanBase、GaussDB、TDSQL、达梦等主流信创数据库，逐一拆解其日志机制与同步难点，结合TapData的实践经验，系统讲解从CDC捕获到实时入仓（Doris、StarRocks、ClickHouse等）的完整链路构建方案，为工程师提供切实可行的替代路径与最佳实践。本篇任务：OceanBase→StarRocks
Python实现MySQL建表语句转换成Clickhouse SQL weixin_30777913 python mysql clickhouse sql 数据库
主程序：**main_converter.py**importreimportjsonimportargparsedefload_config(config_path:str)->dict:'''配置管理模块:加载JSON格式配置文件'''withopen(config_path,mode="r",encoding="utf-8")asf:returnjson.load(f)classBaseCo
大数据学习（141）-分布式数据库 viperrrrrrr 大数据学习分布式 clickhouse hdfs hbase
在分布式数据库中主要有hdfs、hbase、clickhouse三种。HDFS（HadoopDistributedFileSystem）、HBase和ClickHouse都是处理大数据的分布式系统，但它们的设计目标、架构和适用场景有所不同。一、HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生态系统的一部分，是一个高度容错的系统，适合存储大量数据。它被设计为
PostHog 的核心原理草明运维 PosHog op
“事件驱动的数据采集+本地部署的分析系统+全栈可观测能力”下面是对PostHog工作原理的详细拆解，从架构层次到数据流转流程，并涵盖其核心模块。架构总览PostHog通常由以下几个关键组件构成：用户前端→PostHogJSSDK/API→IngestionPipeline→Kafka（事件队列）↓PostgreSQL/ClickHouse（事件存储）↓后端处理服务+插件系统+分析引擎↓WebUI/
Python实现高效导入Excel数据到ClickHouse weixin_30777913 python 开发语言 clickhouse excel pandas
设计一个从Excel文件导入Clickhouse表的程序流程，并用Python来实现。单进程读取Excel文件，分批读取，每批读取1000条，使用INSERT的语句带多组值来写入数据库，比如100组值，可以创建多个列表来缓存这些插入数据库的语句，实现连续读取数据不中断，创建单个进程来读取顺序这些列表来写入表，读取完列表的数据之后，清空列表以便下一次再写入插入数据库的依据，我希望读取和写入数据库的操
数据库选型之路YMatrix与Clickhouse对比星*语数据库数据仓库时序数据库
背锅我们是被迫的数据库问题‘触发’越来越频繁了，开发、业务人员也一直抱怨数据库不行，作为运维人员，天天各种处理问题，还被其他部门喷，有问题矛头全部指向数据库。刚上任的部门领导整天也是压力山大，内部会议分析了当前的情况，最终解决方案是架构变更。当前的生产系统运行在Mysql上，从开始的保留半年的数据，到现在缩减到保留不足三个月的数据，全量数据实时同步到Hadoop，随着业务的发展，Mysql和Had
Clickhouse统计指定表中各字段的空值、空字符串或零值比例 weixin_30777913 clickhouse 运维数据仓库
下面是一段ClickhouseSQL代码，用于统计指定数据库中多张表的字段空值情况。代码通过动态生成查询语句实现自动化统计，处理逻辑如下：从系统表获取指定数据库（替换your_database）中所有表的字段元数据根据字段类型动态生成对应的空值统计逻辑使用sum聚合函数统计空值记录数计算空值占比百分比结果包含数据库名、表名、字段名、字段类型、空值计数、总行数和空值占比SELECTdatabase,
dbeaver 查询clickhouse，数据库时间差了8小时 Sayai 大数据数据库 clickhouse oracle
️调整步骤修改DBeaver连接配置在DBeaver中右键点击ClickHouse连接，选择“编辑连接”。切换到“驱动属性”选项卡，找到以下参数并修改：use_server_time_zone：设置为true（强制使用服务器时区）。use_server_time_zone_for_dates：设置为true（日期字段同步服务器时区）。use_time_zone：设置为目标时区（例如Asia/Sha
硬核实战 | 3分钟Docker部署ClickHouse列存数据库
本文来自「大千AI助手」技术实战系列，专注用真话讲技术，拒绝过度包装。ClickHouse作为OLAP领域性能标杆，其列式存储引擎比传统数据库快100倍以上。本文将用Docker实战部署，并解析关键配置：安装# 拉取最新镜像（当前版本23.8）docker pull clickhouse/clickhouse-server# 运行容器（关键参数解析）docker run -d \ --name=
开源夜莺支持MySQL数据源，更方便做业务指标监控了开源运维监控sremysql
夜莺监控项目最核心的定位，是做一个告警引擎，支持多种数据源的告警。这个版本的更新主要是增加了对MySQL数据源的支持，进一步增强了夜莺在业务指标监控方面的能力。之前版本的夜莺主要聚焦在Prometheus、VictoriaMetrics、ElasticSearch等传统监控数据源上，从上个版本引入ClickHouse开始，夜莺开始支持更多样化的数据源，本次版本迭代则引入了MySQL数据源的支持，给
ClickHouse在数据库领域的多租户架构设计数据库管理艺术 clickhouse 数据库 ai
ClickHouse在数据库领域的多租户架构设计关键词：ClickHouse、数据库、多租户架构、资源隔离、数据安全摘要：本文深入探讨了ClickHouse在数据库领域的多租户架构设计。首先介绍了多租户架构在数据库领域的背景和重要性，接着阐述了ClickHouse多租户架构的核心概念与联系，包括其原理和架构示意图。详细讲解了实现多租户架构的核心算法原理和具体操作步骤，并给出了相应的Python代码
我借鉴了 PHP PDO 对象预处理的方式，设计并开发一个组件 php组件设计
在KK集团工作期间开发过一个组件，至于为啥要开发这个组件，每家公司业务不一样，当时是用于从Elasticsearch和ClickHouse两个数据源里面查询数据，代码实现并不复杂，我自豪的是设计思路，分享一下。因为我看过也用过PDO的预处理，所以借鉴了其预处理思路，文档地址https://www.php.net/manual/zh/pdo.prepare.phpPDO的好处是，SQL语句只解析一次
开源夜莺V8.Beta11发版，支持CK告警、事件Pipeline等运维监控开源开源监控软件
这个版本来得迟了一些，主要是新功能加的多，下面简单介绍一下新功能，下下周也计划做一次直播讲解。支持ClickHouse告警夜莺最重要的定位是告警引擎，所以会持续增加各类数据源的告警支持，ClickHouse之后还有Doris、MySQL、Postgres等。开源版主要是支持告警，不会支持看图可视化，实在是做不过来，答疑也答疑不过来。引入事件Pipeline告警引擎根据告警规则产生告警事件之后，会有
jemalloc环境变量介绍小卡丘性能优化 c++
jemalloc环境变量详解与设置方法jemalloc是一款高性能、可扩展的通用内存分配器，广泛应用于Redis、MySQL、ClickHouse、Facebook等高并发场景。合理配置jemalloc的环境变量，可以更好地控制内存分配和调优程序性能。本文将详细介绍jemalloc常见环境变量的含义及其设置方式。一、环境变量作用jemalloc支持通过环境变量调整其运行时行为，涵盖内存分配策略、统
实时数仓flick+clickhouse启动命令遥遥领先zzl 服务器数据库运维
FlinkCDC环境部署启动flink-yarn模式1、启动zookeeperzk.shstart2、启动DFS，Hadoop集群start-dfs.sh3、启动yarnstart-yarn.sh4、启动kafka（如果需要在启用）启动Kafka集群bin/kafka-server-start.sh-daemonconfig/server.properties查看Kafkatopic列表bin/k
ClickHouse与Presto对比：OLAP引擎选型指南 AI天才研究院 ChatGPT 计算 AI大模型应用入门实战与进阶 clickhouse 网络 ai
ClickHouse与Presto对比：OLAP引擎选型指南关键词：ClickHouse、Presto、OLAP引擎、选型指南、数据分析摘要：本文旨在为读者提供一份全面的ClickHouse与Presto对比的OLAP引擎选型指南。通过对这两款流行的OLAP引擎的核心概念、算法原理、数学模型、实际应用场景等多方面进行深入分析，并结合项目实战案例和代码解读，帮助读者了解它们各自的特点和优势。同时，还
【ClickHouse】RollingBitmap risc123456 clickhouse
ClickHouse的RollingBitmap是一种基于Bitmap的数据结构，用于高效处理数据的动态变化和时间窗口计算。以下是关于ClickHouseRollingBitmap的相关信息：RollingBitmap的应用场景RollingBitmap主要用于需要处理动态数据和时间窗口计算的场景，例如：-实时数据处理：在广告投放、用户行为分析等场景中，需要实时计算用户在特定时间窗口内的行为数据。
ClickHouse 中`MergeTree` 和 `ReplicatedMergeTree`表引擎区别流烟默 clickhouse clickhouse
在ClickHouse中，MergeTree和ReplicatedMergeTree都是用于存储和管理数据的表引擎，但它们的主要区别在于是否支持数据复制。下面详细解释两者的不同点及其适用场景。MergeTree定义：MergeTree是ClickHouse中最基本的表引擎之一，适用于需要高效写入和复杂查询的数据存储。它提供了排序、分区、索引等功能，非常适合于大规模数据分析。特点：排序：可以指定一个
ClickHouse性能优化技术深度解析与实践指南 weixin_30777913 数据库 clickhouse 性能优化架构
作为面向OLAP场景的列式数据库，ClickHouse凭借其卓越的查询性能和大数据吞吐能力广受青睐。但要充分发挥其潜力，必须深入理解其架构特性并实施针对性优化。本文综合官方文档与最佳实践，系统阐述ClickHouse性能优化的核心技术、技巧与实践策略。所有优化都应基于实际业务场景，通过EXPLAIN和ANALYZE工具验证优化效果，避免过度优化。一、表设计与存储优化1.1主键与索引设计稀疏主索引：
APM（应用性能监控）、Apache Flink、ClickHouse在监控场景下的数据流关系及处理流程 djdlg2023 flink clickhouse
数据处理关系图核心组件关系说明APM（如SkyWalking/ElasticAPM）角色：数据采集端输出：应用性能指标（QPS/延迟/错误率）、调用链日志流向：通过Agent上报至APMServer进行初步聚合ApacheFlink角色：实时流处理引擎关键操作：从Kafka消费原始监控数据窗口聚合（如每分钟错误次数统计）异常检测（基于规则或机器学习）输出：结构化聚合数据（Parquet/JSON）
基于Redis bitmaps人群圈群 colodoo（纸伞）大数据 redis 大数据 java clickhouse
由于基于bitmap技术的圈群场景在Clickhouse和Doris的压测表现不是很理想，查阅了资料发现很少有文章提到bitmap在高并发人群圈选的性能问题，难道钱能解决的问题就不是问题了？由于硬件资源有限只能通过工程去弥补这个问题，于是我做了一系列的尝试和测试，有了以下的一些测试和演进方案。测试方案方案1：基于SQL哈希，缓存结果这个方式能够解决同一SQL的多次查询，如果遇到真实的高并发场景，依
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他