lxpbs8851

hive 配置参数说明

hive.exec.mode.local.auto

决定 Hive 是否应该自动地根据输入文件大小，在本地运行（在GateWay运行）

默认值：true

hive.exec.mode.local.auto.inputbytes.max

如果 hive.exec.mode.local.auto 为 true，当输入文件大小小于此阈值时可以自动在本地模式运行，默认是 128兆。

默认值：134217728L

hive.exec.mode.local.auto.tasks.max

如果 hive.exec.mode.local.auto 为 true，当 Hive Tasks（Hadoop Jobs）小于此阈值时，可以自动在本地模式运行。

默认值：4

hive.auto.convert.join

是否根据输入小表的大小，自动将 Reduce 端的 Common Join 转化为 Map Join，从而加快大表关联小表的 Join 速度。

默认值：false

hive.mapred.local.mem

Mapper/Reducer 在本地模式的最大内存量，以字节为单位，0为不限制。

默认值：0

mapred.reduce.tasks

所提交 Job 的 reduer 的个数，使用 Hadoop Client 的配置。

默认值：1

hive.exec.scratchdir

HDFS路径，用于存储不同 map/reduce 阶段的执行计划和这些阶段的中间输出结果。

默认值：/tmp/<user.name>/hive

hive.metastore.warehouse.dir

Hive 默认的数据文件存储路径，通常为 HDFS 可写的路径。

默认值："

hive.groupby.skewindata

决定 group by 操作是否支持倾斜的数据。

默认值：false

hive.merge.mapfiles

是否开启合并 Map 端小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。

默认值：true

hive.merge.mapredfiles

是否开启合并 Map/Reduce 小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。

默认值：false

hive.default.fileformat

Hive 默认的输出文件格式，与创建表时所指定的相同，

可选项为 'TextFile' 、 'SequenceFile' 或者 'RCFile'。 'TextFile'

hive.mapred.mode

Map/Redure 模式，如果设置为 strict，将不允许笛卡尔积。

默认值： 'nonstrict'

hive.exec.parallel

是否开启 map/reduce job的并发提交。

默认值： false

hive.security.authorization.enabled

Hive 是否开启权限认证。

默认值：false

hive.exec.plan

Hive 执行计划的路径，会在程序中自动进行设置

默认值：null

hive.exec.submitviachild

决定 map/reduce Job 是否应该使用各自独立的 JVM 进行提交（Child进程），默认情况下，使用与 HQL compiler 相同的 JVM 进行提交。

默认值：false

hive.exec.script.maxerrsize

通过 TRANSFROM/MAP/REDUCE 所执行的用户脚本所允许的最大的序列化错误数。

默认值：100000

hive.exec.script.allow.partial.consumption

是否允许脚本只处理部分数据，如果设置为 true ，因 broken pipe 等造成的数据未处理完成将视为正常。

默认值：false

hive.exec.compress.output

决定查询中最后一个 map/reduce job 的输出是否为压缩格式。

默认值：false

hive.exec.compress.intermediate

决定查询的中间 map/reduce job （中间 stage）的输出是否为压缩格式。

默认值：false

hive.intermediate.compression.codec

中间 map/reduce job 的压缩编解码器的类名（一个压缩编解码器可能包含多种压缩类型），该值可能在程序中被自动设置。

hive.intermediate.compression.type

中间 map/reduce job 的压缩类型，如 "BLOCK" "RECORD"。

hive.exec.reducers.bytes.per.reducer

每一个 reducer 的平均负载字节数。

默认值：1000000000

hive.exec.reducers.max

reducer 个数的上限。

默认值：999

hive.exec.pre.hooks

语句层面，整条 HQL 语句在执行前的 hook 类名。

默认值："

hive.exec.post.hooks

语句层面，整条 HQL 语句在执行完成后的 hook 类名。

hive.exec.parallel.thread.number

并发提交时的并发线程的个数。

默认值：8

hive.mapred.reduce.tasks.speculative.execution

是否开启 reducer 的推测执行，与 mapred.reduce.tasks.speculative.execution 作用相同。

默认值：false

hive.exec.counters.pull.interval

客户端拉取 progress counters 的时间，以毫秒为单位。

默认值：1000L

hive.exec.dynamic.partition

是否打开动态分区。

默认值：false

hive.exec.dynamic.partition.mode

打开动态分区后，动态分区的模式，有 strict 和 nonstrict 两个值可选，strict 要求至少包含一个静态分区列，nonstrict 则无此要求。

默认值：strict

hive.exec.max.dynamic.partitions

所允许的最大的动态分区的个数。

默认值：1000

hive.exec.max.dynamic.partitions.pernode

单个 reduce 结点所允许的最大的动态分区的个数。

默认值：100

hive.exec.default.partition.name

默认的动态分区的名称，当动态分区列为''或者null时，使用此名称。'' '__HIVE_DEFAULT_PARTITION__'

hadoop.bin.path

Hadoop Client 可执行脚本的路径，该路径用于通过单独的 JVM 提交 job，使用 Hadoop Client 的配置。

默认值：$HADOOP_HOME/bin/hadoop

hadoop.config.dir

Hadoop Client 配置文件的路径，使用 Hadoop Client 的配置。

默认值：$HADOOP_HOME/conf

fs.default.name

Namenode 的 URL，使用 Hadoop Client 的配置。

默认值：file:///

map.input.file

Map 的输入文件，使用 Hadoop Client 的配置。

默认值：null

mapred.input.dir

Map 的输入目录，使用 Hadoop Client 的配置。

默认值： null

mapred.input.dir.recursive

输入目录是否可递归嵌套，使用 Hadoop Client 的配置。

默认值：false

mapred.job.tracker

Job Tracker 的 URL，使用 Hadoop Client 的配置，如果这个配置设置为 'local'，将使用本地模式。

默认值：local

mapred.job.name

Map/Reduce 的 job 名称，如果没有设置，则使用生成的 job name，使用 Hadoop Client 的配置。

默认值：null

mapred.reduce.tasks.speculative.execution

Map/Reduce 推测执行，使用 Hadoop Client 的配置。

默认值：null

hive.metastore.metadb.dir

Hive 元数据库所在路径。

默认值："

hive.metastore.uris

Hive 元数据的 URI，多个 thrift://地址，以英文逗号分隔。

默认值："

hive.metastore.connect.retries

连接到 Thrift 元数据服务的最大重试次数。

默认值：3

javax.jdo.option.ConnectionPassword

JDO 的连接密码。

默认值："

hive.metastore.ds.connection.url.hook

JDO 连接 URL Hook 的类名，该 Hook 用于获得 JDO 元数据库的连接字符串，为实现了 JDOConnectionURLHook 接口的类。

默认值："

javax.jdo.option.ConnectionURL

元数据库的连接 URL。

默认值："

hive.metastore.ds.retry.attempts

当没有 JDO 数据连接错误后，尝试连接后台数据存储的最大次数。

默认值：1

hive.metastore.ds.retry.interval

每次尝试连接后台数据存储的时间间隔，以毫秒为单位。

默认值：1000

hive.metastore.force.reload.conf

是否强制重新加载元数据配置，一但重新加载，该值就会被重置为 false。

默认值：false

hive.metastore.server.min.threads

Thrift 服务线程池的最小线程数。

默认值：8

hive.metastore.server.max.threads

Thrift 服务线程池的最大线程数。

默认值：0x7fffffff

hive.metastore.server.tcp.keepalive

Thrift 服务是否保持 TCP 连接。

默认值：true

hive.metastore.archive.intermediate.original

用于归档压缩的原始中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_ORIGINAL'

hive.metastore.archive.intermediate.archived

用于归档压缩的压缩后的中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_ARCHIVED'

hive.metastore.archive.intermediate.extracted

用于归档压缩的解压后的中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_EXTRACTED'

hive.cli.errors.ignore

是否忽略错误，对于包含多的 SQL 文件，可以忽略错误的行，继续执行下一行。

默认值：false

hive.session.id

当前会话的标识符，格式为“用户名_时间”用于记录在 job conf 中，一般不予以手动设置。

默认值："

hive.session.silent

当前会话是否在 silent 模式运行。如果不是 silent 模式，所以 info 级打在日志中的消息，都将以标准错误流的形式输出到控制台。

默认值：false

hive.query.string

当前正在被执行的查询字符串。

默认值："

hive.query.id

当前正在被执行的查询的ID。

默认值： "

hive.query.planid

当前正在被执行的 map/reduce plan 的 ID。

默认值： "

hive.jobname.length

当前 job name 的最大长度，hive 会根据此长度省略 job name 的中间部分。

默认值：50

hive.jar.path

通过单独的 JVM 提交 job 时，hive_cli.jar 所在的路径

默认值："

hive.aux.jars.path

各种由用户自定义 UDF 和 SerDe 构成的插件 jar 包所在的路径。

默认值："

hive.added.files.path

ADD FILE 所增加的文件的路径。

默认值："

hive.added.jars.path

ADD JAR 所增加的文件的路径。

默认值： "

hive.added.archives.path

ADD ARCHIEVE 所增加的文件的路径。

默认值："

hive.table.name

当前的 Hive 表的名称，该配置将通过 ScirptOperator 传入到用户脚本中。

默认值："

hive.partition.name

当前的 Hive 分区的名称，该配置将通过 ScriptOperator 传入到用户脚本中。

默认值："

hive.script.auto.progress

脚本是否周期性地向 Job Tracker 发送心跳，以避免脚本执行的时间过长，使 Job Tracker 认为脚本已经挂掉了。

默认值：false

hive.script.operator.id.env.var

用于识别 ScriptOperator ID 的环境变量的名称。

默认值：'HIVE_SCRIPT_OPERATOR_ID'

hive.alias

当前的 Hive 别名，该配置将通过 ScriptOpertaor 传入到用户脚本中。

默认值："

hive.map.aggr

决定是否可以在 Map 端进行聚合操作

默认值：true

hive.join.emit.interval

Hive Join 操作的发射时间间隔，以毫秒为单位。

默认值：1000

hive.join.cache.size

Hive Join 操作的缓存大小，以字节为单位。

默认值：25000

hive.mapjoin.bucket.cache.size

Hive Map Join 桶的缓存大小，以字节为单位。

默认值：100

hive.mapjoin.size.key

Hive Map Join 每一行键的大小，以字节为单位。

默认值：10000

hive.mapjoin.cache.numrows

Hive Map Join 所缓存的行数。

默认值：25000

hive.groupby.mapaggr.checkinterval

对于 Group By 操作的 Map 聚合的检测时间，以毫秒为单位。

默认值：100000

hive.map.aggr.hash.percentmemory

Hive Map 端聚合的哈稀存储所占用虚拟机的内存比例。

默认值：0.5

hive.map.aggr.hash.min.reduction

Hive Map 端聚合的哈稀存储的最小 reduce 比例。

默认值：0.5

hive.udtf.auto.progress

Hive UDTF 是否周期性地报告心跳，当 UDTF 执行时间较长且不输出行时有用。

默认值：false

hive.fileformat.check

Hive 是否检查输出的文件格式。

默认值：true

hive.querylog.location

Hive 实时查询日志所在的目录，如果该值为空，将不创建实时的查询日志。

默认值：'/tmp/$USER'

hive.script.serde

Hive 用户脚本的 SerDe。

默认值：'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'

hive.script.recordreader

Hive 用户脚本的 RecordRedaer。

默认值：'org.apache.hadoop.hive.ql.exec.TextRecordReader'

hive.script.recordwriter

Hive 用户脚本的 RecordWriter。

默认值：'org.apache.hadoop.hive.ql.exec.TextRecordWriter'

hive.hwi.listen.host

HWI 所绑定的 HOST 或者 IP。

默认值：'0.0.0.0'

hive.hwi.listen.port

HWI 所监听的 HTTP 端口。

默认值：9999

hive.hwi.war.file

HWI 的 war 文件所在的路径。

默认值：$HWI_WAR_FILE

hive.test.mode

是否以测试模式运行 Hive

默认值：false

hive.test.mode.prefix

Hive 测试模式的前缀。

默认值：'test_'

hive.test.mode.samplefreq

Hive 测试模式取样的频率，即每秒钟取样的次数。

默认值：32

hive.test.mode.nosamplelist

Hive 测试模式取样的排除列表，以逗号分隔。

默认值："

hive.merge.size.per.task

每个任务合并后文件的大小，根据此大小确定 reducer 的个数，默认 256 M。

默认值：256000000

hive.merge.smallfiles.avgsize

需要合并的小文件群的平均大小，默认 16 M。

默认值：16000000

hive.optimize.skewjoin

是否优化数据倾斜的 Join，对于倾斜的 Join 会开启新的 Map/Reduce Job 处理。

默认值：false

hive.skewjoin.key 倾斜键数目阈值，超过此值则判定为一个倾斜的 Join 查询。

默认值： 1000000

hive.skewjoin.mapjoin.map.tasks

处理数据倾斜的 Map Join 的 Map 数上限。

默认值： 10000

hive.skewjoin.mapjoin.min.split

处理数据倾斜的 Map Join 的最小数据切分大小，以字节为单位，默认为32M。

默认值：33554432

mapred.min.split.size

Map Reduce Job 的最小输入切分大小，与 Hadoop Client 使用相同的配置。

默认值：1

hive.mergejob.maponly

是否启用 Map Only 的合并 Job。

默认值：true

hive.heartbeat.interval

Hive Job 的心跳间隔，以毫秒为单位。

默认值：1000

hive.mapjoin.maxsize

Map Join 所处理的最大的行数。超过此行数，Map Join进程会异常退出。

默认值：1000000

hive.hashtable.initialCapacity

Hive 的 Map Join 会将小表 dump 到一个内存的 HashTable 中，该 HashTable 的初始大小由此参数指定。

默认值：100000

hive.hashtable.loadfactor

Hive 的 Map Join 会将小表 dump 到一个内存的 HashTable 中，该 HashTable 的负载因子由此参数指定。

默认值：0.75

hive.mapjoin.followby.gby.localtask.max.memory.usage

MapJoinOperator后面跟随GroupByOperator时，内存的最大使用比例

默认值：0.55

hive.mapjoin.localtask.max.memory.usage

Map Join 的本地任务使用堆内存的最大比例

默认值：0.9

hive.mapjoin.localtask.timeout

Map Join 本地任务超时，淘宝版特有特性

默认值：600000

hive.mapjoin.check.memory.rows

设置每多少行检测一次内存的大小，如果超过 hive.mapjoin.localtask.max.memory.usage 则会异常退出，Map Join 失败。

默认值：100000

hive.debug.localtask

是否调试本地任务，目前该参数没有生效

默认值：false

hive.task.progress

是否开启 counters ，以记录 Job 执行的进度，同时客户端也会拉取进度 counters。

默认值：false

hive.input.format

Hive 的输入 InputFormat。

默认是org.apache.hadoop.hive.ql.io.HiveInputFormat，

其他还有org.apache.hadoop.hive.ql.io.CombineHiveInputFormat

hive.enforce.bucketing

是否启用强制 bucketing。

默认值：false

hive.enforce.sorting

是否启用强制排序。

默认值：false

hive.mapred.partitioner

Hive 的 Partitioner 类。

默认值：'org.apache.hadoop.hive.ql.io.DefaultHivePartitioner'

hive.exec.script.trust

Hive Script Operator For trust

默认值：false

hive.hadoop.supports.splittable.combineinputformat

是否支持可切分的 CombieInputFormat

默认值：false

hive.optimize.cp

是否优化列剪枝。

默认值：true

hive.optimize.ppd

是否优化谓词下推。

默认值：true

hive.optimize.groupby

是否优化 group by。

默认值：true

hive.optimize.bucketmapjoin

是否优化 bucket map join。

默认值：false

hive.optimize.bucketmapjoin.sortedmerge

是否在优化 bucket map join 时尝试使用强制 sorted merge bucket map join。默认值：false

hive.optimize.reducededuplication

是否优化 reduce 冗余。

默认值：true

hive.hbase.wal.enabled

是否开启 HBase Storage Handler。

默认值：true

hive.archive.enabled

是否启用 har 文件。

默认值：false

hive.archive.har.parentdir.settable

是否启用 har 文件的父目录可设置。

默认值：false

hive.outerjoin.supports.filters

是否启动外联接支持过滤条件。

默认值：true

hive.fetch.output.serde

对于 Fetch Task 的 SerDe 类

默认值：'org.apache.hadoop.hive.serde2.DelimitedJSONSerDe'

hive.semantic.analyzer.hook

Hive 语义分析的 Hook，在语义分析阶段的前后被调用，用于分析和修改AST及生成的执行计划，以逗号分隔。

默认值：null

hive.cli.print.header

是否显示查询结果的列名，默认为不显示。

默认值：false

hive.cli.encoding

Hive 默认的命令行字符编码。

默认值：'UTF8'

hive.log.plan.progress

是否记录执行计划的进度。

默认值：true

hive.pull.progress.counters

是否从 Job Tracker 上拉取 counters，淘宝特有配置项。

默认值：true

hive.job.pre.hooks

每个 Job 提交前执行的 Hooks 列表，以逗号分隔，淘宝特有配置项。

默认值："

hive.job.post.hooks

每个 Job 完成后执行的 Hooks 列表，以逗号分隔，淘宝特有配置项。

默认值："

hive.max.progress.counters

Hive 最大的进度 couters 个数，淘宝特有配置项。

默认值：100

hive.exec.script.wrapper

Script Operator 脚本调用的封装，通常为脚本解释程序。例如，可以把该变量值的名称设置为"python"，那么传递到 Script Operator 的脚本将会以"python <script command>"的命令形式进行调用，如果这个值为null或者没有设置，那么该脚本将会直接以"<script command>"的命令形式调用。

默认值：null

hive.check.fatal.errors.interval

客户端通过拉取 counters 检查严重错误的周期，以毫秒为单位，淘宝特有配置项。

默认值：5000L

你可能感兴趣的:(hive 配置参数说明)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
log4j配置 yy爱yy
#log4j.rootLogger配置的是大于等于当前级别的日志信息的输出#log4j.rootLogger用法:（注意appenderName可以是一个或多个）#log4j.rootLogger=日志级别,appenderName1,appenderName2,....#log4j.appender.appenderName2定义的是日志的输出方式，有两种：一种是命令行输出或者叫控制台输出，另一
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
CentOS 7官方源停服，配置本机光盘yum源码哝小鱼 linux运维 centos linux 运维
1、挂载系统光盘mkdir/mnt/isomount-oloop/tools/CentOS-7-x86_64-DVD-1810.iso/mnt/isocd/mnt/iso/Packages/rpm-ivh/mnt/iso/Packages/yum-utils-1.1.31-50.el7.noarch.rpm(图形界面安装，默契已安装）如安装yum-utils依赖错误，按提示安装依赖包rpm-ivh
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite