翱翔的江鸟

面试题整理(Hive)

1. Hive数据倾斜

原因

key分布不均匀
业务数据本身的特性
SQL语句造成数据倾斜

解决方法

hive设置hive.map.aggr=true和hive.groupby.skewindata=true
有数据倾斜的时候进行负载均衡，当选项设定为true,生成的查询计划会有两个MR Job。第一个MR Job中，Map的输出结果集合会随机分布到Reduce中，每个Reduce做部分聚合操作，并输出结果，这样处理的结果是相同Group By Key有可能被分发到不同的Reduce中，从而达到负载均衡的目的；第二个MR Job在根据预处理的数据结果按照 Group By Key 分布到Reduce中(这个过程可以保证相同的 Group By Key 被分布到同一个Reduce中)，最后完成最终的聚合操作。
SQL语句调整:
1. 选用join key 分布最均匀的表作为驱动表。做好列裁剪和filter操作，以达到两表join的时候，数据量相对变小的效果。
2. 大小表Join：使用map join让小的维度表（1000条以下的记录条数）先进内存。在Map端完成Reduce。
3. 大表Join大表：把空值的Key变成一个字符串加上一个随机数，把倾斜的数据分到不同的reduce上，由于null值关联不上，处理后并不影响最终的结果。
4. count distinct大量相同特殊值：count distinct时，将值为空的情况单独处理，如果是计算count distinct，可以不用处理，直接过滤，在做后结果中加1。如果还有其他计算，需要进行group by，可以先将值为空的记录单独处理，再和其他计算结果进行union.

2. Hive中的排序关键字有哪些

sort by ，order by ，cluster by ，distribute by

sort by ：不是全局排序，其在数据进入reducer前完成排序
order by ：会对输入做全局排序，因此只有一个reducer(多个reducer无法保证全局有序).只有一个reducer,会导致当输入规模较大时，需要较长的计算时间。
cluster by ：当distribute by 和sort by的字段相同时，等同于cluster by.可以看做特殊的distribute + sort
distribute by ：按照指定的字段对数据进行划分输出到不同的reduce中

3. 海量数据分布在100台电脑中，想个办法高效统计出这批数据的TOP10

方案1:

在每台电脑上求出TOP10，可以采用包含10个元素的堆完成(TOP10小，用最大堆，TOP10大，用最小堆)。
比如求TOP10大，我们首先取前10个元素调整成最小堆，如果发现，然后扫描后面的数据，并与堆顶元素比较，如果比堆顶元素大，那么用该元素替换堆顶，然后再调整为最小堆。
最后堆中的元素就是TOP10大。

方案2

求出每台电脑上的TOP10后，然后把这100台电脑上的TOP10组合起来，共1000个数据
再利用上面类似的方法求出TOP10就可以了。

4. Hive中追加导入数据的4种方式是什么？请写出简要语法

从本地导入： load data local inpath ‘/home/1.txt’ (overwrite)into table student;
从Hdfs导入： load data inpath ‘/user/hive/warehouse/1.txt’ (overwrite)into table student;
查询导入： create table student1 as select * from student;(也可以具体查询某项数据)
查询结果导入：insert （overwrite）into table staff select * from track_log;

5. Hive导出数据有几种方式？如何导出数据

用insert overwrite导出方式
1. 导出到本地：
  insert overwrite local directory ‘/home/robot/1/2’ rom format delimited fields terminated by ‘\t’ select * from staff;(递归创建目录)
2. 导出到HDFS
  insert overwrite directory ‘/user/hive/1/2’ rom format delimited fields terminated by ‘\t’ select * from staff;
Bash shell覆盖追加导出
例如：$ bin/hive -e “select * from staff;” > /home/z/backup.log
Sqoop把hive数据导出到外部

6. hive 内部表和外部表区别

创建表时：创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。
删除表时：在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。这样外部表相对来说更加安全些，数据组织也更加灵活，方便共享源数据。

7. 分区和分桶的区别

分区

是指按照数据表的某列或某些列分为多个区，区从形式上可以理解为文件夹，比如我们要收集某个大型网站的日志数据，一个网站每天的日志数据存在同一张表上，由于每天会生成大量的日志，导致数据表的内容巨大，在查询时进行全表扫描耗费的资源非常多。
那其实这个情况下，我们可以按照日期对数据表进行分区，不同日期的数据存放在不同的分区，在查询时只要指定分区字段的值就可以直接从该分区查找

分桶

分桶是相对分区进行更细粒度的划分。
分桶将整个数据内容安装某列属性值得hash值进行区分，如要按照name属性分为3个桶，就是对name属性值的hash值对3取摸，按照取模结果对数据分桶。
如取模结果为0的数据记录存放到一个文件，取模为1的数据存放到一个文件，取模为2的数据存放到一个文件

8. Hive优化

通用设置

hive.optimize.cp=true：列裁剪
hive.optimize.prunner：分区裁剪
hive.limit.optimize.enable=true：优化LIMIT n语句
hive.limit.row.max.size=1000000：
hive.limit.optimize.limit.file=10：最大文件数

本地模式(小任务)

job的输入数据大小必须小于参数：hive.exec.mode.local.auto.inputbytes.max(默认128MB)
job的map数必须小于参数：hive.exec.mode.local.auto.tasks.max(默认4)
job的reduce数必须为0或者1
hive.exec.mode.local.auto.inputbytes.max=134217728
hive.exec.mode.local.auto.tasks.max=4
hive.exec.mode.local.auto=true
hive.mapred.local.mem：本地模式启动的JVM内存大小

并发执行

hive.exec.parallel=true ，默认为false
hive.exec.parallel.thread.number=8

Strict Mode：

hive.mapred.mode=true，严格模式不允许执行以下查询：
1. 分区表上没有指定了分区
2. 没有limit限制的order by语句
3. 笛卡尔积：JOIN时没有ON语句

动态分区

hive.exec.dynamic.partition.mode=strict：该模式下必须指定一个静态分区
hive.exec.max.dynamic.partitions=1000
hive.exec.max.dynamic.partitions.pernode=100：在每一个mapper/reducer节点允许创建的最大分区数
DATANODE：dfs.datanode.max.xceivers=8192：允许DATANODE打开多少个文件

推测执行

mapred.map.tasks.speculative.execution=true
mapred.reduce.tasks.speculative.execution=true
hive.mapred.reduce.tasks.speculative.execution=true;

多个group by合并

hive.multigroupby.singlemar=true：当多个GROUP BY语句有相同的分组列，则会优化为一个MR任务

虚拟列

hive.exec.rowoffset：是否提供虚拟列

分组

两个聚集函数不能有不同的DISTINCT列，以下表达式是错误的：
INSERT OVERWRITE TABLE pv_gender_agg SELECT pv_users.gender, count(DISTINCT pv_users.userid), count(DISTINCT pv_users.ip) FROM pv_users GROUP BY pv_users.gender;
SELECT语句中只能有GROUP BY的列或者聚集函数。

Combiner聚合

hive.map.aggr=true;在map中会做部分聚集操作，效率更高但需要更多的内存。
hive.groupby.mapaggr.checkinterval：在Map端进行聚合操作的条目数目

数据倾斜

hive.groupby.skewindata=true：数据倾斜时负载均衡，当选项设定为true，生成的查询计划会有两个MRJob。
第一个MRJob 中，Map的输出结果集合会随机分布到Reduce中，每个Reduce做部分聚合操作，并输出结果，这样处理的结果是相同的GroupBy Key
有可能被分发到不同的Reduce中，从而达到负载均衡的目的；
第二个MRJob再根据预处理的数据结果按照GroupBy Key分布到Reduce中（这个过程可以保证相同的GroupBy Key被分布到同一个Reduce中），最后完成最终的聚合操作。

排序

ORDER BY colName ASC/DESC
hive.mapred.mode=strict时需要跟limit子句
hive.mapred.mode=nonstrict时使用单个reduce完成排序
SORT BY colName ASC/DESC ：每个reduce内排序
DISTRIBUTE BY(子查询情况下使用 )：控制特定行应该到哪个reducer，并不保证reduce内数据的顺序
CLUSTER BY ：当SORT BY 、DISTRIBUTE BY使用相同的列时。

合并小文件

hive.merg.mapfiles=true：合并map输出
hive.merge.mapredfiles=false：合并reduce输出
hive.merge.size.per.task=256*1000*1000：合并文件的大小
hive.mergejob.maponly=true：如果支持CombineHiveInputFormat则生成只有Map的任务执行merge
hive.merge.smallfiles.avgsize=16000000：文件的平均大小小于该值时，会启动一个MR任务执行merge。

自定义map/reduce数目

减少map数目：
　　set mapred.max.split.size
　　set mapred.min.split.size
　　set mapred.min.split.size.per.node
　　set mapred.min.split.size.per.rack
　　set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat
增加map数目：
1. 当input的文件都很大，任务逻辑复杂，map执行非常慢的时候，可以考虑增加Map数，来使得每个map处理的数据量减少，从而提高任务的执行效率。
2. 假设有这样一个任务：
  select data_desc, count(1), count(distinct id),sum(case when …),sum(case when ...),sum(…) from a group by data_desc
3. 如果表a只有一个文件，大小为120M，但包含几千万的记录，如果用1个map去完成这个任务，肯定是比较耗时的，这种情况下，我们要考虑将这一个文件合理的拆分成多个，这样就可以用多个map任务去完成。
  　　set mapred.reduce.tasks=10;
  　　create table a_1 as select * from a distribute by rand(123);
4. 这样会将a表的记录，随机的分散到包含10个文件的a_1表中，再用a_1代替上面sql中的a表，则会用10个map任务去完成。每个map任务处理大于12M（几百万记录）的数据，效率肯定会好很多。
reduce数目设置：
1. 参数1：hive.exec.reducers.bytes.per.reducer=1G：每个reduce任务处理的数据量
2. 参数2：hive.exec.reducers.max=999(0.95*TaskTracker数)：每个任务最大的reduce数目
3. reducer数=min(参数2,总输入数据量/参数1)
4. set mapred.reduce.tasks：每个任务默认的reduce数目。典型为0.99*reduce槽数，hive将其设置为-1，自动确定reduce数目。

使用索引：

hive.optimize.index.filter：自动使用索引
hive.optimize.index.groupby：使用聚合索引优化GROUP BY操作

你可能感兴趣的:(面试题)

如何确保Kafka集群的高可用？ java1234_小锋 java kafka 分布式
大家好，我是锋哥。今天分享关于【如何确保Kafka集群的高可用？】面试题。希望对大家有帮助；如何确保Kafka集群的高可用？超硬核AI学习资料，现在永久免费了！要确保Kafka集群的高可用性，可以采取以下几种策略：1.副本机制（Replication）Kafka通过副本机制来提高消息的可靠性和集群的容错性。每个Kafka主题的分区都有多个副本（Replica），这些副本分布在不同的Broker上。
Redis有哪些常用应用场景?
大家好，我是锋哥。今天分享关于【Redis有哪些常用应用场景?】面试题。希望对大家有帮助；Redis有哪些常用应用场景?超硬核AI学习资料，现在永久免费了！Redis是一种高性能的内存数据库，常用于以下应用场景：缓存Redis常作为缓存解决方案，提高数据读取效率，减轻数据库负担。常用于存储热点数据、频繁访问的资源。会话存储Redis可以高效存储用户会话信息（Session），支持大规模高并发的读写
RocketMQ延迟消息是如何实现的? java1234_小锋 java rocketmq
大家好，我是锋哥。今天分享关于【RocketMQ延迟消息是如何实现的?】面试题。希望对大家有帮助；RocketMQ延迟消息是如何实现的?超硬核AI学习资料，现在永久免费了！RocketMQ的延迟消息是通过特定的时间延迟来控制消息的消费时间，其实现方式主要是利用消息的定时投递和消息的定时存储，通常是基于以下两种方式：1.定时消息+事务消息方式（定时投递）RocketMQ通过在消息中设置定时投递的时间
Zookeeper的典型应用场景?
大家好，我是锋哥。今天分享关于【Zookeeper的典型应用场景?】面试题。希望对大家有帮助；Zookeeper的典型应用场景?超硬核AI学习资料，现在永久免费了！Zookeeper是一个开源的分布式协调服务，它被广泛应用于需要分布式系统协调的场景。以下是Zookeeper的一些典型应用场景：1.分布式锁在分布式系统中，多个节点可能需要对共享资源进行访问，这时就需要确保访问的排他性。Zookeep
框架面试题07Spring框架中bean的创建过程？
Spring框架中Bean的创建过程是一个精细控制的生命周期流程，涉及多个关键步骤和扩展点。以下是Spring容器（如ApplicationContext）创建Bean的完整过程详解：一、核心流程图
一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO…… Python算法实战大模型理论与实战算法深度学习人工智能 transformer 大模型 RLHF ppo
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。《大模型面试宝典》(2024版)正式发布喜欢本文记得收藏、关注、点赞。更多实战和面试交流，文末加入我们为了对齐LLM，各路研究者妙招连连。LLM很强大了，但
【面试系列】C++ 高频面试题野老杂谈全网最全IT公司面试宝典 c++面试编程语言
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录C++初级面试题及其详细解答1.解释C
2022年MySQL最新面试题 m0_54850467 面试学习路线阿里巴巴 android 前端后端
2022年MySQL最新面试题目录前言一、数据库基础知识0、概要1、平时MySQL主要用哪个版本2、数据库三大范式是什么3、MySQL有关权限的表都有哪几个4、MySQL的binlog有有几种录入格式？分别有什么区别？平时用到哪些关系型数据库和非关系数据库,可以谈谈你对它们的理解吗?5、可以简单说说你对MySQL的逻辑架构了解吗？6、了解MySQL中的MVCC是什么?7、PostgreSQL相对于
自动化运维工程师实操面试题
以下是针对Ansible、Zabbix、ElasticsearchLogstashKibana（ELK）设计的2道综合实操题，难度适中且结合实际应用场景：实操题1：Ansible自动化部署Zabbix监控平台并集成ELK日志分析题目背景某企业需要通过Ansible自动化部署Zabbix监控服务器（含Agent）、Elasticsearch、Logstash、Kibana（ELK）日志分析系统，并实
Python面试题：使用Python进行元编程：元类和元编程技巧
在Python中，元编程是一种编程技巧，它涉及到代码本身的结构和行为的编程。元编程允许你编写能够操作、修改或生成代码的代码。最常见的元编程技术包括使用元类、装饰器和类装饰器。以下是对Python元编程的详细讲解，包括元类和一些常用的元编程技巧。1.元类（Metaclasses）1.1定义和概念元类是用来创建类的类。换句话说，元类定义了类的行为，就像类定义了对象的行为一样。在Python中，type
20 道 Node.js 高频面试题
文章目录1.**Node.js是什么？有哪些特点？**2.**Node.js中的事件循环是什么？如何工作？**3.**Node.js的模块系统有哪几种？区别是什么？**4.**什么是Buffer？为什么需要它？**5.**Node.js如何实现异步编程？**6.**Node.js中的Stream是什么？有哪些类型？**7.**Node.js中的Cluster模块有什么作用？**8.**Node.j
经典面试题 - LAZYMAN (HARDMAN / 懒汉) 秀秀_heo 小轮子 javascript
主要考察JavaScript异步编程、事件循环、链式调用和任务调度的综合能力。题目要求实现一个hardMan函数，支持链式调用study()、rest()和restFirst()方法，并满足特定时序逻辑。一、题目要求与行为分析hardMan('潘潘')//输出:Hi!Iam潘潘.hardMan('潘潘').study('敲码')//输出:Hi!Iam潘潘.→Iamstudying敲码.hardMa
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
2024年最新4大典型安全漏洞是怎么来的？如何解决？，【2024网络安全最新学习路线】 2401_84297193 程序员 web安全学习网络
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
LeetCode之面试题02.06回文链表烁华算法题
题目：编写一个函数，检查输入的链表是否是回文的。示例：进阶：你能否用O(n)时间复杂度和O(1)空间复杂度解决此题？方法一：反转链表比较值思路：1.计算链表长度2.翻转前半部分链表。比如1->2->3->3->2->1,将其翻转为12->1。链表长度为奇数时不用管最中间的那个节点。3.从两个子链表的head开始，一一比较节点值，如果有不一样，就返回false，全部一样返回true时间复杂度O(n)
面试题 02.06 回文链表 qxwithlsy leetcode
1.普通版把链表的每个值存储在数组中，然后从链表两端向中间挨个对比，如果有不等的，就返回false。/***Definitionforsingly-linkedlist.*structListNode{*intval;*structListNode*next;*};*/boolisPalindrome(structListNode*head){//快慢指针？先找到中间位置，然后一个从中间开始，新建
OPPO Java面试题及参考答案大模型大数据攻城狮 java java开发后端面试后端面经八股文大厂校招 sql注入
Java语言的特点Java是一种面向对象的编程语言，它具有以下显著特点。首先是简单性。Java的语法相对简单，它摒弃了C和C++语言中一些复杂的特性，比如指针操作。这使得程序员能够更专注于业务逻辑的实现，而不是陷入复杂的语法细节中。例如，Java的内存管理是自动进行的，通过垃圾回收机制来回收不再使用的对象所占用的内存，程序员不需要手动释放内存，大大降低了出错的概率。其次是面向对象。Java支持封装
OPPO Android面试题及参考答案（下）大模型大数据攻城狮安卓面试 android面经 kotlin flutter面试 okhttp ART 垃圾回收
讲一下TCP每接收多少数据包进行一次处理（结合项目）？在不同的TCP应用项目中，每接收多少数据包进行一次处理并没有一个固定的统一标准，它会受到多种因素的影响，以下从常见的项目场景来分析。在网络文件传输项目中，接收方一般不会严格按照固定数量的数据包来进行处理。通常是一边接收数据包，一边将接收到的数据按照文件的格式规则进行组装。比如要接收一个大的视频文件，TCP将视频文件分割成多个报文段（数据包）进行
JAVA——JAVA知识点集锦（下） Faith_chao JAVA基础 JAVA基础知识点
转自：http://blog.csdn.net/Scythe666/article/details/51994782这部分主要是开源JavaEE框架方面的内容，包括Hibernate、MyBatis、Spring、SpringMVC等，由于Struts2已经是明日黄花，在这里就不讨论Struts2的面试题，如果需要了解相关内容，可以参考我的另一篇文章《Java面试题集（86-115）》。此外，这篇
美团Android开发200道面试题及参考答案（下）大模型大数据攻城狮 android java jvm内存 jvm调优安卓面经安卓面试信号量
单例模式中的双锁机制，分别起到了什么作用在单例模式的双重检查锁定（DCL，DoubleCheckedLocking）机制中，涉及到两重“锁”相关的操作，各自有着重要作用。首先是外层的同步锁，也就是synchronized关键字修饰的代码块部分。它的主要作用是控制在多线程环境下，同一时刻只有一个线程能够进入到创建单例对象实例的关键代码区域。当多个线程同时调用getInstance方法尝试获取单例对象
前端面试题集锦（5）
目录1、Promsie.all()使用过吗,它是怎么使用的?2、forin和forof循环的区别?3、什么是事件流以及事件流的传播机制?4、token一般存放在哪里?为什么不存放在cookie内?5、数组方法forEach和map的区别?6、ES6中Set和Map的区别?7、0.1+0.2为什么不等于0.3,在项目中遇到要怎么处理?8、什么是模块化思想?9、说说怎么用js写无缝轮播图10、闭包的使
如何道破信息差，精准准备秋招？——应届生秋招全流程解析
信息差，是大多数应届生秋招失败的关键。本文将从认知差距、平台渠道、实战建议三大维度，帮你打破信息壁垒，走上offer收割之路。一、什么是秋招中的“信息差”？在秋招中，应届生之间的差距并非仅仅是技术实力，更在于“知道什么”和“知道怎么做”的能力差异。常见的信息差类型：信息差类型表现形式企业信息差不知道哪些公司在招人，不清楚岗位要求面试流程差不知道面试题类型、不清楚流程节点技术准备差不知道八股文、项目
UI自动化常见面试题程序员的世界你不懂 UI自动化相关 ui 自动化运维
一：元素定位不到的场景有几种，解决方式是怎么样的？1、有可能是元素没有加载出来，可以添加显示等待、强制等待、隐式等待2、元素可能嵌在Iframe中，此时需要切换到元素所在的Iframe3、元素可能在新的Windows窗口，此时需要切换Windows4、可能存在Alert弹窗，此时需要先关闭Alert窗口5、可能元素信息在迭代中发生了变化，此时需要更改元素定位信息6、可能元素无法通过selenium
数据库面试题06为什么要用MyBatis框架？
MyBatis是一个优秀的持久层框架（虽然常被归类为“半自动化”ORM，但其核心更侧重于SQL映射），它在Java开发中广泛应用，尤其在需要精细控制SQL、处理复杂查询或与遗留数据库交互的场景中备受青睐。选择MyBatis的主要原因可以总结为以下几点：对SQL的完全控制权（核心优势）:开发者手写SQL：MyBatis要求开发者直接编写SQL语句（在XML映射文件或注解中）。这与Hibernate/
Bash Shell面试题高级汇总002 韩公子的Linux大集市 Bash入门 bash 开发语言
文章目录一、Shell原理进阶二、性能与资源管理三、并发控制与IPC四、安全与防御五、调试与追踪六、文本处理黑科技七、系统级深入题八、容器化环境九、综合场景题十、面试官深度追问方向以下是一份深度梳理的LinuxShell高级面试题汇总，涵盖脚本优化、系统原理、故障排查、安全实践等高频考点，适用于中高级开发/运维岗位：一、Shell原理进阶exec3<>file的作用是什么？文件描述符0-2的默认指
【大厂面试题】千万级大表如何快速删除大量数据 CBeann 【面试题】【架构&案例】【MySQL】java 开源 spring jvm mysql 大厂面试题
-作者简介：大厂高级Java开发工程师-称号：CSDN博客专家✨、阿里云博客专家-公众号：云服务小管家。免费的阿里云服务器☁和云环境直接使用-生活：专注于后端技术分享迷茫时可来瞅瞅码农轨迹‍♂️-服务：提供模拟面试和简历辅导，提供生产项目。内推可私信✉-卷卷群：可以和大家一起学习，一起进步-如果感觉博主的文章还不错的话，请三连支持一下博主哦背景最近在做一个项目，除了验证功能，还需要验证性能，所以前
【面试题】为什么kafka的吞吐量这么高 oraen 面试系列 kafka 分布式
我们总结一下为什么kafka的吞吐量高核心：顺序写+零拷贝+批处理一数据模型简单+顺序读写磁盘1kafka的数据存储本质上使用的是Append-only日志模型，数据写入和读取是顺序的，不需要复杂索引或随机写，大大简化了写路径，2消息以顺序追加方式写入磁盘，避免了随机写，而且顺序写入能够更高效地配合操作系统的页缓存，进一步提升写的性能。3消息的消费也是顺序读取的，顺序读取硬盘数据再配合内存映射大大
Oracle面试题-体系结构加油干sit！数据库 oracle 数据库
1.如何查看Oracle数据库的版本信息？1.标准SQL查询（推荐）方法1：查询v$version视图（最常用）SELECT*FROMv$version;输出示例：BANNER--------------------------------------------------------------------------------OracleDatabase19cEnterpriseEditi
七牛云前端面试题及参考答案（上）大模型大数据攻城狮前端 vue组件 reactjs 前端面经防抖节流 fiber
目录基本数据类型有哪些？typeofnull的结果是什么？null和undefined的区别是什么？let关键字的特点有哪些？this指向的规则是什么？箭头函数中this指向哪里？如何实现JavaScript的深拷贝和浅拷贝？数组去重的常见方法（手写代码）数组扁平化（手写，不能使用flat(Infinity)）forEach和map方法的区别是什么？闭包的应用场景：实现链式加法add(1)(2)(
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他