十七✧ᐦ̤

Hive+Flume+Kafka章节测试六错题总结

题目2：

EXTERNAL关键字的作用？[多选]

A、EXTERNAL关键字可以让用户创建一个外部表
B、创建外部表时，可以不加EXTERNAL关键字
C、通过EXTERNAL创建的外部表只删除元数据，不删除数据
D、不加EXTERNAL的时候，默认创建内部表也叫管理表
【参考答案】: ACD
【您的答案】: ABC

external关键字可以让用户创建一个外部表，在建表的同时可以指定一个指向实际数据的路径（location），在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。默认创建的表都是所谓的管理表，有时也被称为内部表。因为这种表，Hive会（或多或少地）控制着数据的生命周期。所以ACD选项是正确的，不加external是内部表，B选项错误。

题目3：

对as和like的描述正确的是？[多选]

A、as可以将查询结果添加到新创建的表中
B、like根据已经存在的表结构创建表
C、as针对数据，like针对结构
D、as和like的作用一样
【参考答案】: ABC
【您的答案】: BC

根据查询结果创建表（查询的结果会添加到新创建的表中）

hive (default)>create table if not exists student2 AS select id, name from student;

这个就是将查询结果添加到新创建的表中，所以A选项正确。

题目7：

聚合函数sum()over(…order by cu),中order by描述正确的是？ [单选题]

A、只要开窗中如果使用order by ,有累加功能，默认等于UNBOUNDED PRECEDING and current row
B、在聚合函数后，开窗中如果使用order by ,有累加功能，默认等于UNBOUNDED PRECEDING and current row
C、在非聚合函数后，开窗中如果使用order by ,有累加功能，默认等于UNBOUNDED PRECEDING and current row
D、在聚合函数后,开窗中如果无论是否使用order by ，都具有累加功能，默认等于UNBOUNDED PRECEDING and current row
【参考答案】: B
【您的答案】: A

B、在聚合函数后，开窗中如果使用order by，有累加功能，默认等于UNBOUNDED PRECEDING and current row。

在使用聚合函数后，如果在开窗函数中使用ORDER BY子句，它会定义用于计算累积的顺序，通常是按照某个列的值排序。默认情况下，它等同于UNBOUNDED PRECEDING and current row，这意味着对当前行及其之前的所有行进行累加操作。这允许你在窗口中根据指定的排序顺序对聚合函数进行计算。

题目12：

下列关于减少topic的分区数的描述正确的是？[单选题]

A、可以减少，使用命令sub进行移除。
B、可以减少，使用命令alter进行修改。
C、不可以减少，因为是一旦创建就不能改变的。
D、不可以减少，被删除的分区数据难以处理。
【参考答案】: D
【您的答案】: C

D、不可以减少，被删除的分区数据难以处理。

分区数一旦创建后通常是不可以减少的。删除分区会导致删除数据，这些数据难以恢复，因此通常情况下，分区数的减少是不允许的。如果需要减少分区数，通常需要创建一个新的表或数据集来满足新的需求，并迁移数据到新表中，而不是修改现有的分区数。

题目13：

下列关于Exactly Once语义中描述错误的是？[单选题]

A、当ack=-1，可以保证数据不会丢失。
B、当ack=0，可以保证数据不会重复。
C、当ack=1，即可以保证数据不会重复，也可以保证数据不会丢失。
D、幂等性无法保证跨分区跨会话的Exactly Once。
【参考答案】: C
【您的答案】: B

C、当ack=1，只能保证数据不会丢失，但无法保证数据不会重复。A选项，当ack=-1时，默认数据是不会丢失的。B选项，当ack等于0时，数据只会发送一次，不需要等待回复确认，可以保证数据不会重复。D选项，如果生产者中途宕机，然后重新建立会话时，不能保证不同会话时PID是一样，这时候重新发送重复数据时无法保证幂等性。

C选项，只能保证数据不会丢失，不能保证数据不会重复的问题。

题目15：

下列关于kafka 造成数据丢失的场景描述正确的是？[多选题]

A、ack=0时，leader故障有可能丢失数据。
B、ack=1时，在follower同步成功之前leader故障，将会丢失数据。
C、ack=-1时，在follower同步完成后，broker发送ack之前，leader发生故障，可能会丢失数据。
D、ack=-1时，在follower同步完成前，broker发送ack之后，leader发生故障，可能会丢失数据。
【参考答案】: AB
【您的答案】: ABD

ack=-1时，不会丢数据，所以C, D 错误

题目17：

配置Metastore到MySql的说法正确的是？ [单选题]

A、默认数据库derby容量太小
B、为了能够实现多窗口启动hive
C、为了使用JDBC的方式连接Hive
D、默认数据库也能实现hive多窗口启动
【参考答案】: B
【您的答案】: C

在某些情况下，为了支持多个Hive客户端同时连接到Hive Metastore，需要将Metastore配置为使用外部数据库，如MySQL。这是因为默认的Derby数据库通常只支持单个连接，这意味着只能有一个Hive客户端会话在同一时间连接到Hive Metastore。通过将Metastore配置为使用外部数据库，可以允许多个Hive客户端并发连接到Metastore，实现多窗口启动Hive。

题目21：

Hive中对Parquet格式描述正确的是？[多选]

A、Parquet文件是以二进制方式存储的，所以是不可以直接读取的
B、文件中包括该文件的数据和元数据，因此Parquet格式文件是自解析的。
C、可以把每一个行组由一个Mapper任务处理，增大任务执行并行度
D、在Parquet中，有三种类型的页：数据页、字典页和索引页
【参考答案】: ABCD
【您的答案】: BC

A选项：Parquet文件是以二进制方式存储的，所以是不可以直接读取的，从某个角度来说不是很准确，是可以读取和解析的，但解释为不可以直接读取也是正确的。

D选项：正确，就是这三种类型。

题目23：

Hive中对本地模式描述正确的是？[多选]

A、Hive可以通过本地模式在单台机器上处理所有的任务
B、对于小数据集，执行时间可以明显被缩短。
C、用户可以通过设置hive.exec.mode.local.auto的值为true，来让Hive在适当的时候自动启动这个优化，默认是false。
D、设置local mr的最大输入数据量，当输入数据量小于这个值时采用local mr的方式，默认为134217728，即128M
【参考答案】: ABCD
【您的答案】: ABD

C选项是正确的，存在该参数，在hive/conf/hive-default.xml.template文件中可以查看到该参数的默认情况，默认为false。

<property>
    <name>hive.exec.mode.local.autoname>
    <value>falsevalue>
    <description>Let Hive determine whether to run in local mode automaticallydescription>
  property>

题目24：

Hive中对推测执行描述正确的是？[多选]

A、为了避免，一个作业的多个任务之间运行速度不一致，一个慢的任务会拖慢作业的整体执行进度这种情况，Hadoop采用了推测执行（Speculative Execution）机制。
B、根据一定的法则推测出“拖后腿”的任务，并为这样的任务启动一个备份任务，让该任务与原始任务同时处理同一份数据，并最终选用最先成功运行完成任务的计算结果作为最终结果。
C、Hadoop的mapred-site.xml文件中进行配置，mapreduce.map.speculative默认是true
D、hive本身也提供了配置项来控制reduce-side的推测执行：hive.mapred.reduce.tasks.speculative.execution默认是true
【参考答案】: ABCD
【您的答案】: ACD

C 选项，在mapred-default.xml文件总找到了该参数，默认确实为true。

<property>
  <name>mapreduce.map.speculativename>
  <value>truevalue>
  <description>If true, then multiple instances of some map tasks
               may be executed in parallel.description>
property>

D选项, 在hive/conf/hive-default.xml.template文件中确实存在配置项来控制推测执行，正确。

<property>
    <name>hive.mapred.reduce.tasks.speculative.executionname>
    <value>truevalue>
    <description>Whether speculative execution for reducers should be turned on. description>
  property>

题目25：

Hive中对动态分区描述正确的是？[多选]

A、对分区表Insert数据时候，hive自动会根据分区字段的值，将数据插入到相应的分区中,但需要进行相应的配置。
B、开启动态分区功能（默认true，开启）hive.exec.dynamic.partition=true
C、在所有执行MR的节点上，最大一共可以创建多少个动态分区。默认1000
D、整个MR Job中，最大可以创建多少个HDFS文件。默认100000
【参考答案】: ABCD
【您的答案】: ACD
B选项，在hive/conf/hive-default.xml.template文件中可以确定动态分区功能默认是开启的。

<property>
    <name>hive.exec.dynamic.partitionname>
    <value>truevalue>
    <description>Whether or not to allow dynamic partitions in DML/DDL.description>
  property>

题目26：

Hive中对内外表描述正确的是？[多选]

A、可以通过desc formatted table 来查询表的类型
B、修改内部表xxx为外部表alter table xxx set tblproperties(‘EXTERNAL’=‘TRUE’);
C、修改外部表xxx为内部表alter table xxx set tblproperties(‘EXTERNAL’=‘FALSE’);
D、(‘EXTERNAL’=‘TRUE’)和(‘EXTERNAL’=‘FALSE’)为固定写法，区分大小写
【参考答案】: ABCD
【您的答案】: AD
A、可以通过 desc formatted table 来查询表的类型。这是正确的，可以使用此命令来查看表的详细信息，包括表的类型（内部表或外部表）。

B、修改内部表为外部表的语法是使用以下命令：

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='TRUE');

这个命令是正确的，它将内部表修改为外部表。

C、修改外部表为内部表的语法是使用以下命令：

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='FALSE');

这个命令是正确的，它将外部表修改为内部表。

D、('EXTERNAL'='TRUE') 和 ('EXTERNAL'='FALSE') 是用于设置表属性的键值对，它们不是固定写法，而是用来指示表的类型的。这些键值对的大小写是敏感的，所以区分大小写是正确的。

所以正确的选项是 A、B、C 和 D。

你可能感兴趣的:(hive,flume,kafka)

开发者交流平台项目部署到阿里云服务器教程独自破碎E 阿里云服务器云计算 java 后端开发语言
本文使用PuTTY软件在本地Windows系统远程控制Linux服务器；其中，Windows系统为Windows10专业版，Linux系统为CentOS7.664位。1.工具软件的准备maven：https://archive.apache.org/dist/maven/maven-3/3.6.1/binaries/apache-maven-3.6.1-bin.tar.gztomcat：https
【1】阿里面试题整理独自破碎E Java面经 c#java kafka mybatis hash
[1].Kafka如何保证数据一致性？Kafka主要通过副本机制、ISR机制、持久化机制以及事务机制等多种方式共同保证了数据的一致性。副本机制是Kafka确保数据一致性的基础，使用ISR(In-SyncReplica)机制来处理副本之间的同步，将消息持久化到硬盘中，以确保消息在发生故障时不会丢失。引入事务机制来支持事务性消息，确保消息的原子性、一致性、隔离性和持久性，从而保证数据在生产和消费过程中
hive表指定分区字段搜索_Hive学习-Hive基本操作（建库、建表、分区表、写数据）... weixin_39710660 hive表指定分区字段搜索
hive简单认识Hive是建立在HDFS之上的数据仓库，所以Hive的数据全部存储在HDFS上。Hive的数据分为两部分，一部分是存在HDFS上的具体数据，一部分是描述这些具体数据的元数据信息，一般Hive的元数据存在MySQL上。Hive是类SQL语法的数据查询、计算、分析工具，执行引擎默认的是MapReduce，可以设置为Spark、Tez。Hive分内部表和外部表，外部表在建表的同时指定一个
hive 分区表select全部数据_【Hive教程】（六）HIVE分区表 (静态分区+动态分区) weixin_39658318 hive 分区表select全部数据
分区表分区表在实际企业中用途非常广，首先一个案例体验一下分区表的作用:假设我每天都要往HIVE表中插入一万条数据。经过一年的时间，我里面已经有365万条数据。现在我需要查询某个日期的数据，我select*fromtablenamewheredata=”20180101″,那么hive一般会扫描整个表内容，会消耗很多时间。如果引入partition概念。以日期作为分区字段，相同日期的数据在同一个分区
【hadoop学习之路】Hive HQL 语句实现查询新世纪debug战士 hadoop学习之路 hive
目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c
【大数据入门核心技术-Hive】（十一）HiveSQL数据分区 forest_long 大数据技术入门到21天通关大数据 hive hadoop 数据仓库 hdfs
目录一、分区的概念二、创建分区1）静态分区1、单分区测试2、多分区测试2)动态分区3、动态分区和静态分区混合使用三、分区的其它操作1、恢复分区2、归档分区3、交换分区四、分区数据查询1、单分区数据查询2、多分区数据查询方法1：通过union方法2：通过or一、分区的概念数据分区的概念以及存在很久了，通常使用分区来水平分散压力，将数据从物理上移到和使用最频繁的用户更近的地方，以及实现其目的。hive
本地Apache Hive的Linux服务器集群复制数据到SQL Server数据库的分步流程 weixin_30777913 数据库数据仓库 hive sqlserver
我们已经有安装ApacheHive的Linux服务器集群，它可以连接到一个SQLServerRDS数据库，需要在该Linux服务器上安装配置sqoop，然后将Hive中所有的表数据复制到SQLServerRDS数据库。以下是分步指南，用于在Linux服务器上安装配置Sqoop并将Hive表数据迁移至SQLServerRDS：1.安装Sqoop步骤：下载Sqoop前往ApacheSqoop下载页面，
设计转换Apache Hive的HQL语句为Snowflake SQL语句的Python程序方法 weixin_30777913 python 数据仓库 hive sql
首先，根据以下各类HQL语句的基本实例和官方文档记录的这些命令语句各种参数设置，得到各种HQL语句的完整实例，然后在Snowflake的官方文档找到它们对应的SnowflakeSQL语句，建立起对应的关系表。在这个过程中要注意HQL语句和SnowflakeSQL语句的区别，比如Hive可以给单个用户加权限，但是Snowflake数据仓库是RBAC，也就是基于角色的权限控制，所以HQL语句中给用户加
Kafka 如何实现高性能言之。架构面试 kafka 分布式
1.高吞吐量的设计分布式架构：Kafka通过分布式的集群架构设计来横向扩展，提高吞吐量。多个生产者、消费者和节点可以同时并行工作，分担流量负载。分区机制：Kafka使用分区来分散负载，每个topic可以有多个分区，每个分区可以独立处理读写操作。消费者可以并行地处理多个分区的数据，从而提升性能。分区内部的消息顺序性得到保证，但多个分区之间消息顺序不保证，这种设计能够实现高并发的处理。2.顺序写入与高
windows注册表详解 ywwow 计算机科学与技术 windows microsoft system 磁盘 dos 网络
偶尔得转点文章。空格键坏了，想用修改键盘映射的方法来代替一下，于是就找到了注册表。然后在不断的搜索中，发现了这篇有点收藏价值的文章，转过来保存下。windows注册表详解http://blog.donews.com/converter/archive/2004/09/16/100404.aspx注册表对有的人还是比较陌生的，因为现在第三方软件太多了，如优化大师、魔法兔子等等，但个人觉得改善系统的第
Python正则表达式指南 weixin_33755554 python
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html1.正则表达式基础1.1.简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不
Ubuntu20.4编译vlc、vlc-qt 小逍遥雪 Ubuntu vlc qt
1.安装Qt软件，文章中安装的Qt版本：5.11.3Qt官方下载链接：Indexof/new_archive/qt2.下载vlc源码，文章中vlc源码版本：vlc-3.0.8因为系统是linxu系统，所以下载时选择：vlc-3.0.8.tar.xzvlc官方源码下载链接：Indexof/vlc/3.下载vlc_qt源码vlc_qt官方源码下载链接：https://vlc-qt.tano.si/
Debezium系列之：debezium把sqlserver数据库多张表的数据发送到一个kafka topic 快乐骑行^_^ debezium Debezium sqlserver数据库 kafka topic
Debezium系列之：debezium把sqlserver数据库多张表的数据发送到一个kafkatopic一、需求二、debezium实现sqlservercdc三、相关参数详解四、完整参数一、需求把一个sqlserver数据库多张表的数据全部发送到kafka集群的一个topic二、debezium实现sqlservercdc相关技术实现参考博主以下几篇博客：Debezium系列之：安装部署de
MySql-MySqlConnector DataLu MySql-debezium mysql 数据库数据库开发大数据开源 java
提示：MySqlConnector类的主要职责是从MySQL数据库中捕获数据变更，并将这些变更以事件的形式发布到Kafka中。这使得下游的应用程序可以通过订阅Kafka主题来实时获取MySQL数据库中的变更信息。文章目录前言一、核心功能二、代码分析总结前言提示：MySqlConnector类是一个关键组件，它负责设置和管理整个数据捕获流程，从配置到数据库连接，再到数据变更事件的捕获和发送。这对于实
DB2-Db2StreamingChangeEventSource DataLu DB2-debezium 数据库数据库开发大数据开源
提示：Db2StreamingChangeEventSource类主要用于从IBMDb2数据库中读取变更数据捕获(CDC,ChangeDataCapture)信息。CDC是一种技术，允许系统跟踪数据库表中数据的更改，这些更改可以是插入、更新或删除操作。在大数据和实时数据处理场景中，CDC可以用来同步数据到其他系统，比如数据仓库、数据湖或者流处理平台如ApacheKafka。文章目录前言一、核心功能
【详细讲解】hive优化 songqq27 大数据 hive
1、开启本地模式大多数的HadoopJob是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过，有时Hive的输入数据量是非常小的。在这种情况下，为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多。对于大多数这种情况，Hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间可以明显被缩短。用户可以通过设置hive.exec.mode.local.auto的值
kakfa-消息不丢失华东算法王（原聪明的小孩子 facebook twitter 机器学习新浪微博微信公众平台
Kafka作为一个分布式流处理平台，设计时就高度关注消息的可靠性和不丢失，确保在分布式环境下即使发生故障，消息也不会丢失。Kafka的消息不丢失主要依赖以下几个机制：1.消息持久化Kafka保证消息在磁盘上的持久化，即使在系统崩溃的情况下，消息仍然可以恢复。这一机制是Kafka消息不丢失的基础。•写入日志文件：每个Kafka分区都将消息按顺序追加到磁盘上的日志文件中（logsegment）。这种顺
一. spring cloud gateway集成 spring cloud stream binder kafka，实现“动态路由“刷新与加载之采坑记录 yanfei_1986 spring cloud gateway cloud stream kafka
一、前言SpringCloudStream是用于构建消息驱动的微服务应用程序的框架。本文主要介绍如何集成SpringCloudStream，以Kafka发布订阅模式(topic)，实现发送消息>>消费消息。我所找到的帖子大部分都是关于binderRabbitMQ，后来又拜读了官方文档(google翻译)，逐渐对SpringCloudStream有了清晰的认识。真正集成时，并没有那么顺利；我看别人都
Kafka 压缩算法详细介绍王多鱼的梦想～ kafka 分布式运维 apache
文章目录一、Kafka压缩算法概述二、Kafka压缩的作用2.1降低网络带宽消耗2.2提高Kafka生产者和消费者吞吐量2.3减少Kafka磁盘存储占用2.4减少KafkaBroker负载2.5降低跨数据中心同步成本三、Kafka压缩的原理3.1Kafka压缩的基本原理3.2.Kafka压缩的工作流程3.3Kafka压缩的数据存储格式四、Kafka压缩方式配置4.1Kafka生产者（Produce
LEO、LSO、AR、ISR、HW都表示什么含义？ jasen91 kafka 大数据
LEO（LogEndOffset）：日志末端位移值或末端偏移量，表示日志下一条待插入消息的位移值。举个例子，如果日志有10条消息，位移值从0开始，那么，第10条消息的位移值就是9。此时，LEO=10。LSO（LogStableOffset）：这是Kafka事务的概念。如果你没有使用到事务，那么这个值不存在（其实也不是不存在，只是设置成一个无意义的值）。该值控制了事务型消费者能够看到的消息范围。它经
Kafka常见问题之 org.apache.kafka.common.errors.RecordTooLargeException 王多鱼的梦想～ Kafka修炼手册 kafka apache 分布式运维
文章目录Kafka常见问题之org.apache.kafka.common.errors.RecordTooLargeException:Themessageis1,048,576byteswhenserializedwhichislargerthanthemaximumrequestsize.1.错误解析2.错误原因3.错误复现案例3.1生产者发送超大消息4.解决方案4.1方法1：调整Kafka
Kafka常见问题之Kafka 报错：org.apache.kafka.common.errors.NotLeaderOrFollowerException 王多鱼的梦想～ Kafka修炼手册 kafka 分布式
Kafka常见问题之Kafka报错：org.apache.kafka.common.errors.NotLeaderOrFollowerException文章目录Kafka常见问题之Kafka报错：org.apache.kafka.common.errors.NotLeaderOrFollowerException0.NotLeaderOrFollowerException描述1.NotLeade
RabbitMQ面试题汇总 Blocking The Sky 项目 rabbitmq java rabbitmq 分布式 java spring boot
RabbitMQ面试题一、RabbitMQ基础1.什么是RabbitMQ，它的基本架构是怎样的？2.RabbitMQ支持哪些协议？3.说一下AMQP协议？4.为什么要使用RabbitMQ？5.MQ的应用场景有哪些？6.解耦、异步、削峰是什么？7.消息队列有什么缺点？8.Kafka、ActiveMQ、RabbitMQ、RocketMQ有什么优缺点？9.简单说一下RabbitMQ的缺点？10.说说Ra
大数据毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏豆瓣图书爬虫图书推荐系统 qq_79856539 javaweb java 大数据 hadoop 课程设计
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统，它可以根据用户的历史行为和偏好，为用户提供个性化的书籍推荐。该系统采用Spark技术，可以实现大数据的实时处理，从而提高推荐系统的准确性和可靠性。此外，该系统还可以根据用户的习惯和偏好，提供更加个性化的书籍推荐，从而满足用户的需求。系统的使用者包含普通用户和管理员两类，普通用户是系统的主要服务对象，主流人群是经常查看
ubuntu22.04 + isaac gym环境配置流程 Yakusha linux bash c++
1.CUDA安装1.看系统架构：uname-m2.去官网下载适配你显卡驱动的最新cuda，可以通过nvidia-smi查看https://developer.nvidia.com/cuda-toolkit-archive3.然后执行，全选continue和yessudo./cuda_12.4.1_550.54.15_linux.run在bashrc中添加：exportPATH=/usr/local
一个真正可用的docker-compse部署单机版kafka 版本2.x garen_dimon 软件研究 docker kafka 容器
注意：kafka3.x版本，Kafka3.x需要Java11或更高版本。确保系统已安装合适的Java版本。Kafka3.x推荐使用ZooKeeper3.5.x或更高版本。确保ZooKeeper集群与Kafka版本兼容。如果你计划使用KRaft模式替换传统的ZooKeeper模式，请确保你已经了解新模式的要求和配置。在网上搜索单机docker-compose部署kafka，出现最多的内容如下：ver
Docker-Compose以KRaft模式快速部署Kafka LUCIAZZZ docker kafka 容器 java 运维 spring boot
我们创建一个docker-compose.yaml文件然后后台启动我们的DockerComposedocker-composeup-d我们修改配置后可以关闭后重启docker-composedowndocker-compose.yaml文件内容version:"3"services:kafka:image:'bitnami/kafka:latest'user:rootenvironment:-KA
Kafka（一）使用Docker Compose安装单机Kafka以及Kafka UI_docker 部署单机kafka 2401_84166396 2024年程序员学习 kafka docker ui
开启JMX监控JMX_PORT=9998KAFKA_JMX_OPTS=-Dcom.sun.management.jmxremote-Dcom.sun.management.jmxremote.authenticate=false-Dcom.sun.management.jmxremote.ssl=false-Djava.rmi.server.hostname=kafka-Dcom.sun.mana
Kafka 副本 leader 是怎么选举的？？思维导图代码示例（java 架构) 用心去追梦 kafka java 架构
Kafka中的副本（Replica）Leader选举是确保数据高可用性和容错性的重要机制。当一个分区的Leader副本不可用时，Kafka需要从该分区的ISR（In-SyncReplicas）列表中选择一个新的Leader来继续处理生产者和消费者的请求。ISR列表包含所有与Leader保持同步的副本。Kafka副本Leader选举思维导图KafkaReplicaLeaderElection├──触
Kafka 深入客户端 — 事务黄名富微服务 kafka 分布式 java 微服务 zookeeper
Kafka事务确保了数据在写入Kafka时的原子性和一致性。1幂等幂等就是对接口的多次调用所产生的结果和调用一次是一致的。Kafka生产者在进行重试的时候可能会写入重复的消息，开启幂等性功能后就可以避免这种情况。将生产者客户端参数enable.idempotence设置为true即可。1.1实现原理Kafka引入了producerid（简称PID）和序列号（sequencenumber）这两个概念
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他