OSC-小小侦探

hive配置参数说明

hive.exec.mode.local.auto

决定 Hive 是否应该自动地根据输入文件大小，在本地运行（在GateWay运行）

默认值：true

hive.exec.mode.local.auto.inputbytes.max

如果hive.exec.mode.local.auto 为 true，当输入文件大小小于此阈值时可以自动在本地模式运行，默认是 128兆。

默认值：134217728L

hive.exec.mode.local.auto.tasks.max

如果hive.exec.mode.local.auto 为 true，当 Hive Tasks（Hadoop Jobs）小于此阈值时，可以自动在本地模式运行。

默认值：4

hive.auto.convert.join

是否根据输入小表的大小，自动将 Reduce 端的 Common Join 转化为 Map Join，从而加快大表关联小表的 Join 速度。

默认值：false

hive.mapred.local.mem

Mapper/Reducer在本地模式的最大内存量，以字节为单位，0为不限制。

默认值：0

mapred.reduce.tasks

所提交 Job 的 reduer 的个数，使用 Hadoop Client 的配置。

默认值：1

hive.exec.scratchdir

HDFS路径，用于存储不同 map/reduce 阶段的执行计划和这些阶段的中间输出结果。

默认值：/tmp/<user.name>/hive

hive.metastore.warehouse.dir

Hive 默认的数据文件存储路径，通常为 HDFS 可写的路径。

默认值："

hive.groupby.skewindata

决定 group by 操作是否支持倾斜的数据。

默认值：false

hive.merge.mapfiles

是否开启合并 Map 端小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。

默认值：true

hive.merge.mapredfiles

是否开启合并 Map/Reduce 小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。

默认值：false

hive.default.fileformat

Hive 默认的输出文件格式，与创建表时所指定的相同，

可选项为 'TextFile' 、 'SequenceFile' 或者 'RCFile'。 'TextFile'

hive.mapred.mode

Map/Redure 模式，如果设置为 strict，将不允许笛卡尔积。

默认值： 'nonstrict'

hive.exec.parallel

是否开启 map/reduce job的并发提交。

默认值： false

hive.security.authorization.enabled

Hive 是否开启权限认证。

默认值：false

hive.exec.plan

Hive 执行计划的路径，会在程序中自动进行设置

默认值：null

hive.exec.submitviachild

决定 map/reduce Job 是否应该使用各自独立的 JVM 进行提交（Child进程），默认情况下，使用与 HQL compiler 相同的 JVM 进行提交。

默认值：false

hive.exec.script.maxerrsize

通过 TRANSFROM/MAP/REDUCE 所执行的用户脚本所允许的最大的序列化错误数。

默认值：100000

hive.exec.script.allow.partial.consumption

是否允许脚本只处理部分数据，如果设置为 true ，因 broken pipe 等造成的数据未处理完成将视为正常。

默认值：false

hive.exec.compress.output

决定查询中最后一个 map/reduce job 的输出是否为压缩格式。

默认值：false

hive.exec.compress.intermediate

决定查询的中间 map/reduce job （中间 stage）的输出是否为压缩格式。

默认值：false

hive.intermediate.compression.codec

中间 map/reduce job 的压缩编解码器的类名（一个压缩编解码器可能包含多种压缩类型），该值可能在程序中被自动设置。

hive.intermediate.compression.type

中间 map/reduce job 的压缩类型，如 "BLOCK""RECORD"。

hive.exec.reducers.bytes.per.reducer

每一个 reducer 的平均负载字节数。

默认值：1000000000

hive.exec.reducers.max

reducer 个数的上限。

默认值：999

hive.exec.pre.hooks

语句层面，整条 HQL 语句在执行前的 hook 类名。

默认值："

hive.exec.post.hooks

语句层面，整条 HQL 语句在执行完成后的 hook 类名。

hive.exec.parallel.thread.number

并发提交时的并发线程的个数。

默认值：8

hive.mapred.reduce.tasks.speculative.execution

是否开启 reducer 的推测执行，与mapred.reduce.tasks.speculative.execution 作用相同。

默认值：false

hive.exec.counters.pull.interval

客户端拉取 progress counters 的时间，以毫秒为单位。

默认值：1000L

hive.exec.dynamic.partition

是否打开动态分区。

默认值：false

hive.exec.dynamic.partition.mode

打开动态分区后，动态分区的模式，有 strict 和 nonstrict 两个值可选，strict 要求至少包含一个静态分区列，nonstrict 则无此要求。

默认值：strict

hive.exec.max.dynamic.partitions

所允许的最大的动态分区的个数。

默认值：1000

hive.exec.max.dynamic.partitions.pernode

单个 reduce 结点所允许的最大的动态分区的个数。

默认值：100

hive.exec.default.partition.name

默认的动态分区的名称，当动态分区列为''或者null时，使用此名称。'' '__HIVE_DEFAULT_PARTITION__'

hadoop.bin.path

HadoopClient 可执行脚本的路径，该路径用于通过单独的 JVM 提交 job，使用 Hadoop Client 的配置。

默认值：$HADOOP_HOME/bin/hadoop

hadoop.config.dir

HadoopClient 配置文件的路径，使用 HadoopClient 的配置。

默认值：$HADOOP_HOME/conf

fs.default.name

Namenode 的 URL，使用 Hadoop Client 的配置。

默认值：file:///

map.input.file

Map 的输入文件，使用 Hadoop Client 的配置。

默认值：null

mapred.input.dir

Map 的输入目录，使用 Hadoop Client 的配置。

默认值： null

mapred.input.dir.recursive

输入目录是否可递归嵌套，使用 HadoopClient 的配置。

默认值：false

mapred.job.tracker

Job Tracker的 URL，使用 Hadoop Client 的配置，如果这个配置设置为 'local'，将使用本地模式。

默认值：local

mapred.job.name

Map/Reduce 的 job 名称，如果没有设置，则使用生成的 job name，使用 Hadoop Client 的配置。

默认值：null

mapred.reduce.tasks.speculative.execution

Map/Reduce 推测执行，使用 Hadoop Client 的配置。

默认值：null

hive.metastore.metadb.dir

Hive 元数据库所在路径。

默认值："

hive.metastore.uris

Hive 元数据的 URI，多个 thrift://地址，以英文逗号分隔。

默认值："

hive.metastore.connect.retries

连接到 Thrift 元数据服务的最大重试次数。

默认值：3

javax.jdo.option.ConnectionPassword

JDO 的连接密码。

默认值："

hive.metastore.ds.connection.url.hook

JDO 连接 URL Hook 的类名，该 Hook 用于获得 JDO 元数据库的连接字符串，为实现了JDOConnectionURLHook 接口的类。

默认值："

javax.jdo.option.ConnectionURL

元数据库的连接 URL。

默认值："

hive.metastore.ds.retry.attempts

当没有 JDO 数据连接错误后，尝试连接后台数据存储的最大次数。

默认值：1

hive.metastore.ds.retry.interval

每次尝试连接后台数据存储的时间间隔，以毫秒为单位。

默认值：1000

hive.metastore.force.reload.conf

是否强制重新加载元数据配置，一但重新加载，该值就会被重置为 false。

默认值：false

hive.metastore.server.min.threads

Thrift 服务线程池的最小线程数。

默认值：8

hive.metastore.server.max.threads

Thrift 服务线程池的最大线程数。

默认值：0x7fffffff

hive.metastore.server.tcp.keepalive

Thrift 服务是否保持 TCP 连接。

默认值：true

hive.metastore.archive.intermediate.original

用于归档压缩的原始中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_ORIGINAL'

hive.metastore.archive.intermediate.archived

用于归档压缩的压缩后的中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_ARCHIVED'

hive.metastore.archive.intermediate.extracted

用于归档压缩的解压后的中间目录的后缀，这些目录是什么并不重要，只要能够避免冲突即可。

默认值：'_INTERMEDIATE_EXTRACTED'

hive.cli.errors.ignore

是否忽略错误，对于包含多的 SQL 文件，可以忽略错误的行，继续执行下一行。

默认值：false

hive.session.id

当前会话的标识符，格式为“用户名_时间”用于记录在 job conf 中，一般不予以手动设置。

默认值："

hive.session.silent

当前会话是否在 silent 模式运行。如果不是 silent 模式，所以 info 级打在日志中的消息，都将以标准错误流的形式输出到控制台。

默认值：false

hive.query.string

当前正在被执行的查询字符串。

默认值："

hive.query.id

当前正在被执行的查询的ID。

默认值： "

hive.query.planid

当前正在被执行的 map/reduce plan 的 ID。

默认值： "

hive.jobname.length

当前 job name 的最大长度，hive 会根据此长度省略 job name 的中间部分。

默认值：50

hive.jar.path

通过单独的 JVM 提交 job 时，hive_cli.jar 所在的路径

默认值："

hive.aux.jars.path

各种由用户自定义 UDF 和 SerDe 构成的插件 jar 包所在的路径。

默认值："

hive.added.files.path

ADD FILE 所增加的文件的路径。

默认值："

hive.added.jars.path

ADD JAR 所增加的文件的路径。

默认值： "

hive.added.archives.path

ADDARCHIEVE 所增加的文件的路径。

默认值："

hive.table.name

当前的 Hive 表的名称，该配置将通过 ScirptOperator 传入到用户脚本中。

默认值："

hive.partition.name

当前的 Hive 分区的名称，该配置将通过 ScriptOperator 传入到用户脚本中。

默认值："

hive.script.auto.progress

脚本是否周期性地向 Job Tracker 发送心跳，以避免脚本执行的时间过长，使 JobTracker 认为脚本已经挂掉了。

默认值：false

hive.script.operator.id.env.var

用于识别 ScriptOperator ID 的环境变量的名称。

默认值：'HIVE_SCRIPT_OPERATOR_ID'

hive.alias

当前的 Hive 别名，该配置将通过 ScriptOpertaor 传入到用户脚本中。

默认值："

hive.map.aggr

决定是否可以在 Map 端进行聚合操作

默认值：true

hive.join.emit.interval

Hive Join 操作的发射时间间隔，以毫秒为单位。

默认值：1000

hive.join.cache.size

Hive Join 操作的缓存大小，以字节为单位。

默认值：25000

hive.mapjoin.bucket.cache.size

Hive MapJoin 桶的缓存大小，以字节为单位。

默认值：100

hive.mapjoin.size.key

Hive MapJoin 每一行键的大小，以字节为单位。

默认值：10000

hive.mapjoin.cache.numrows

Hive MapJoin 所缓存的行数。

默认值：25000

hive.groupby.mapaggr.checkinterval

对于 Group By 操作的 Map 聚合的检测时间，以毫秒为单位。

默认值：100000

hive.map.aggr.hash.percentmemory

Hive Map 端聚合的哈稀存储所占用虚拟机的内存比例。

默认值：0.5

hive.map.aggr.hash.min.reduction

Hive Map 端聚合的哈稀存储的最小 reduce 比例。

默认值：0.5

hive.udtf.auto.progress

Hive UDTF 是否周期性地报告心跳，当 UDTF 执行时间较长且不输出行时有用。

默认值：false

hive.fileformat.check

Hive 是否检查输出的文件格式。

默认值：true

hive.querylog.location

Hive 实时查询日志所在的目录，如果该值为空，将不创建实时的查询日志。

默认值：'/tmp/$USER'

hive.script.serde

Hive 用户脚本的 SerDe。

默认值：'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'

hive.script.recordreader

Hive 用户脚本的 RecordRedaer。

默认值：'org.apache.hadoop.hive.ql.exec.TextRecordReader'

hive.script.recordwriter

Hive 用户脚本的 RecordWriter。

默认值：'org.apache.hadoop.hive.ql.exec.TextRecordWriter'

hive.hwi.listen.host

HWI 所绑定的 HOST 或者 IP。

默认值：'0.0.0.0'

hive.hwi.listen.port

HWI 所监听的 HTTP 端口。

默认值：9999

hive.hwi.war.file

HWI 的 war 文件所在的路径。

默认值：$HWI_WAR_FILE

hive.test.mode

是否以测试模式运行 Hive

默认值：false

hive.test.mode.prefix

Hive 测试模式的前缀。

默认值：'test_'

hive.test.mode.samplefreq

Hive 测试模式取样的频率，即每秒钟取样的次数。

默认值：32

hive.test.mode.nosamplelist

Hive 测试模式取样的排除列表，以逗号分隔。

默认值："

hive.merge.size.per.task

每个任务合并后文件的大小，根据此大小确定 reducer 的个数，默认 256 M。

默认值：256000000

hive.merge.smallfiles.avgsize

需要合并的小文件群的平均大小，默认 16 M。

默认值：16000000

hive.optimize.skewjoin

是否优化数据倾斜的 Join，对于倾斜的 Join 会开启新的 Map/Reduce Job 处理。

默认值：false

hive.skewjoin.key 倾斜键数目阈值，超过此值则判定为一个倾斜的 Join 查询。

默认值： 1000000

hive.skewjoin.mapjoin.map.tasks

处理数据倾斜的 Map Join 的 Map 数上限。

默认值： 10000

hive.skewjoin.mapjoin.min.split

处理数据倾斜的 Map Join 的最小数据切分大小，以字节为单位，默认为32M。

默认值：33554432

mapred.min.split.size

Map ReduceJob 的最小输入切分大小，与 HadoopClient 使用相同的配置。

默认值：1

hive.mergejob.maponly

是否启用 Map Only 的合并 Job。

默认值：true

hive.heartbeat.interval

Hive Job 的心跳间隔，以毫秒为单位。

默认值：1000

hive.mapjoin.maxsize

Map Join 所处理的最大的行数。超过此行数，Map Join进程会异常退出。

默认值：1000000

hive.hashtable.initialCapacity

Hive 的 Map Join 会将小表 dump 到一个内存的 HashTable 中，该 HashTable 的初始大小由此参数指定。

默认值：100000

hive.hashtable.loadfactor

Hive 的 Map Join 会将小表 dump 到一个内存的 HashTable 中，该 HashTable 的负载因子由此参数指定。

默认值：0.75

hive.mapjoin.followby.gby.localtask.max.memory.usage

MapJoinOperator后面跟随GroupByOperator时，内存的最大使用比例

默认值：0.55

hive.mapjoin.localtask.max.memory.usage

Map Join 的本地任务使用堆内存的最大比例

默认值：0.9

hive.mapjoin.localtask.timeout

Map Join 本地任务超时，淘宝版特有特性

默认值：600000

hive.mapjoin.check.memory.rows

设置每多少行检测一次内存的大小，如果超过hive.mapjoin.localtask.max.memory.usage 则会异常退出，Map Join 失败。

默认值：100000

hive.debug.localtask

是否调试本地任务，目前该参数没有生效

默认值：false

hive.task.progress

是否开启 counters ，以记录 Job 执行的进度，同时客户端也会拉取进度 counters。

默认值：false

hive.input.format

Hive 的输入 InputFormat。

默认是org.apache.hadoop.hive.ql.io.HiveInputFormat，

其他还有org.apache.hadoop.hive.ql.io.CombineHiveInputFormat

hive.enforce.bucketing

是否启用强制 bucketing。

默认值：false

hive.enforce.sorting

是否启用强制排序。

默认值：false

hive.mapred.partitioner

Hive 的 Partitioner 类。

默认值：'org.apache.hadoop.hive.ql.io.DefaultHivePartitioner'

hive.exec.script.trust

Hive ScriptOperator For trust

默认值：false

hive.hadoop.supports.splittable.combineinputformat

是否支持可切分的CombieInputFormat

默认值：false

hive.optimize.cp

是否优化列剪枝。

默认值：true

hive.optimize.ppd

是否优化谓词下推。

默认值：true

hive.optimize.groupby

是否优化 group by。

默认值：true

hive.optimize.bucketmapjoin

是否优化 bucket map join。

默认值：false

hive.optimize.bucketmapjoin.sortedmerge

是否在优化 bucket map join 时尝试使用强制 sorted merge bucketmap join。默认值：false

hive.optimize.reducededuplication

是否优化 reduce 冗余。

默认值：true

hive.hbase.wal.enabled

是否开启 HBase Storage Handler。

默认值：true

hive.archive.enabled

是否启用 har 文件。

默认值：false

hive.archive.har.parentdir.settable

是否启用 har 文件的父目录可设置。

默认值：false

hive.outerjoin.supports.filters

是否启动外联接支持过滤条件。

默认值：true

hive.fetch.output.serde

对于 Fetch Task 的 SerDe 类

默认值：'org.apache.hadoop.hive.serde2.DelimitedJSONSerDe'

hive.semantic.analyzer.hook

Hive 语义分析的 Hook，在语义分析阶段的前后被调用，用于分析和修改AST及生成的执行计划，以逗号分隔。

默认值：null

hive.cli.print.header

是否显示查询结果的列名，默认为不显示。

默认值：false

hive.cli.encoding

Hive 默认的命令行字符编码。

默认值：'UTF8'

hive.log.plan.progress

是否记录执行计划的进度。

默认值：true

hive.pull.progress.counters

是否从 Job Tracker 上拉取 counters，淘宝特有配置项。

默认值：true

hive.job.pre.hooks

每个 Job 提交前执行的 Hooks 列表，以逗号分隔，淘宝特有配置项。

默认值："

hive.job.post.hooks

每个 Job 完成后执行的 Hooks 列表，以逗号分隔，淘宝特有配置项。

默认值："

hive.max.progress.counters

Hive 最大的进度 couters 个数，淘宝特有配置项。

默认值：100

hive.exec.script.wrapper

ScriptOperator 脚本调用的封装，通常为脚本解释程序。例如，可以把该变量值的名称设置为"python"，那么传递到 Script Operator 的脚本将会以"python<script command>"的命令形式进行调用，如果这个值为null或者没有设置，那么该脚本将会直接以"<scriptcommand>"的命令形式调用。

默认值：null

hive.check.fatal.errors.interval

客户端通过拉取 counters 检查严重错误的周期，以毫秒为单位，淘宝特有配置项。

默认值：5000L

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
log4j配置 yy爱yy
#log4j.rootLogger配置的是大于等于当前级别的日志信息的输出#log4j.rootLogger用法:（注意appenderName可以是一个或多个）#log4j.rootLogger=日志级别,appenderName1,appenderName2,....#log4j.appender.appenderName2定义的是日志的输出方式，有两种：一种是命令行输出或者叫控制台输出，另一
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
openssl+keepalived安装部署 _小亦_ 项目部署 keepalived openssl
文章目录OpenSSL安装下载地址编译安装修改系统配置版本Keepalived安装下载地址安装遇到问题安装完成配置文件keepalived运行检查运行状态查看系统日志修改服务service重新加载systemd检查配置文件语法错误OpenSSL安装下载地址考虑到后面设备可能没法连接到外网，所以采用安装包的方式进行部署，下载地址：https://www.openssl.org/source/old/
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
CentOS 7官方源停服，配置本机光盘yum源码哝小鱼 linux运维 centos linux 运维
1、挂载系统光盘mkdir/mnt/isomount-oloop/tools/CentOS-7-x86_64-DVD-1810.iso/mnt/isocd/mnt/iso/Packages/rpm-ivh/mnt/iso/Packages/yum-utils-1.1.31-50.el7.noarch.rpm(图形界面安装，默契已安装）如安装yum-utils依赖错误，按提示安装依赖包rpm-ivh
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

hive配置参数说明

你可能感兴趣的:(hive配置参数说明)