张伯毅

Hadoop2.7.7 API: hdfs-site.xml 解析

name	description	value	备注
hadoop.hdfs.configuration.version	配置文件版本	1
dfs.namenode.rpc-address	处理所有客户端请求的RPC地址，若在HA场景中，可能有多个namenode，就把名称ID添加到进来。该属性的格式为nn-host1:rpc-port。		bj-rack001-hadoop002:8020
dfs.namenode.rpc-bind-host	RPC服务器的真实地址，如果为空，则使用dfs.namenode.rpc-address属性中配置的主机名。该属性如果在HA场景中，可以在每个namenode中都指定。如果设置为0.0.0.0，则会在此namenode中监听所有的接口。
dfs.namenode.servicerpc-address	用于HDFS服务通信的RPC地址，所有的backupnode,datanode和其它服务都应该连接到这个地址。如果该属性未设置，则使用dfs.namenode.rpc-address属性的值。
dfs.namenode.servicerpc-bind-host	RPC服务器中服务的真实地址，如果为空，则使用dfs.namenode.servicerpc-bind-host属性中配置的主机名。该属性如果在HA场景中，可以在每个namenode中都指定。如果设置为
dfs.namenode.secondary.http-address	secondary namenode HTTP服务器地址和端口。	0.0.0.0:50090	bj-rack001-hadoop003:50090
dfs.namenode.secondary.https-address	secondary namenode HTTPS服务器地址和端口。	0.0.0.0:50091
dfs.datanode.address	datanode服务器地址和端口。	0.0.0.0:50010
dfs.datanode.http.address	datanode HTTP服务器地址和端口。	0.0.0.0:50075
dfs.datanode.ipc.address	datanode IPC服务器地址和端口。	0.0.0.0:50020	0.0.0.0:8010
dfs.datanode.handler.count	datanode的服务器线程数。	10	20
dfs.namenode.http-address	namenode web UI监听的地址和端口。	0.0.0.0:50070	bj-rack001-hadoop002:50070
dfs.namenode.http-bind-host	HTTP服务器绑定的真实地址。
dfs.namenode.heartbeat.recheck-interval	心跳检测的时间间隔，单位是毫秒。	300000
dfs.http.policy	用于配置是否在HDFS上支持HTTPS(SSL)。选项有HTTP_ONLY:只支持HHTPS； HTTPS_ONLY:只支持HTTPS； HTTPS_AND_HTTPS:同时支持HTTP和HTTPS。	HTTP_ONLY
dfs.client.https.need-auth	是否需要SSL客户端证书身份验证。	FALSE
dfs.client.cached.conn.retry	HDFS客户端从缓存中提取套接字的次数。一旦超过这个数量，客户端将尝试创建一个新的套接字。	3
dfs.https.server.keystore.resource	用于提取SSL服务器密钥存储信息的资源文件。	ssl-server.xml
dfs.client.https.keystore.resource	用于提取SSL客户端密钥存储信息的资源文件。	ssl-client.xml
dfs.datanode.https.address	datanode安全http服务器地址和端口。	0.0.0.0:50475
dfs.namenode.https-address	namenode安全http服务器地址和端口。	0.0.0.0:50470
dfs.namenode.https-bind-host	HTTPS的真实地址。
dfs.datanode.dns.interface	datanode的网络接口名称，例如eth2。建议使用hadoop.security.dns.interface代替dfs.datanode.dns.interface。	default
dfs.datanode.dns.nameserver	DNS服务器的主机名或IP地址。建议使用hadoop.security.dns.nameserver代替dfs.datanode.dns.nameserver。	default
dfs.namenode.backup.address	backup节点服务器地址和端口。如果端口为0，那么服务器将在自由端口启动。	0.0.0.0:50100
dfs.namenode.backup.http-address	backup节点http服务器地址和端口。如果端口为0，那么服务器将在自由端口启动。	0.0.0.0:50105
dfs.namenode.replication.considerLoad	在选择目标的时候，是否考虑目标的负载情况。	TRUE
dfs.default.chunk.view.size	在浏览器上能查看文件的字节数。	32768
dfs.datanode.du.reserved	每卷保留字节的空间。	0	229029233664
dfs.namenode.name.dir	存放namenode的名称表（fsimage）的目录，如果这是一个逗号分隔的目录列表，那么在所有目录中复制名称表，用于冗余。	file://${hadoop.tmp.dir}/dfs/name	/data/hadoop/hdfs/namenode
dfs.namenode.name.dir.restore	如果为true，则允许namenode尝试恢复之前失败的dfs.namenode.name.dir目录。当启用时，在检查点期间会尝试恢复任何失败的目录。	FALSE	true
dfs.namenode.fs-limits.max-component-length	定义路径中每个组件中UTF-8编码的最大字节数。0的值将禁用检查。	255
dfs.namenode.fs-limits.max-directory-items	定义目录可能包含的最大项目数。无法将属性设置为小于1或大于6400000的值。	1048576
dfs.namenode.fs-limits.min-block-size	最小的块大小，单位为字节。	1048576
dfs.namenode.fs-limits.max-blocks-per-file	每个文件的最大块数。	1048576
dfs.namenode.edits.dir	存放namenode的事务文件（edits）的目录，如果这是一个逗号分隔的目录列表，那么事务文件在所有目录中被复制，用于冗余。默认与dfs.namenode.name.dir属性目录一样。	${dfs.namenode.name.dir}
dfs.namenode.shared.edits.dir	用于HA场景中，多个namenode共享的目录。
dfs.namenode.edits.journal-plugin.qjournal		org.apache.hadoop.hdfs.qjournal.client.QuorumJournalManager
dfs.permissions.enabled	当为true时，则允许HDFS的检测，当为false时，则关闭HDFS的检测，但不影响其它HDFS的其它功能。	TRUE
dfs.permissions.superusergroup	超级用户组的名称。该值应该是单个组名。	supergroup	hdfs
dfs.cluster.administrators	管理员ACL列表，用于控制谁可以访问namenode的servlet，这个属性由逗号分隔，例如"user1,user2 group1,group2"。用户和组都可以为空，所以 "user1", " group1", "", "user1 group1", "user1,user2 group1,group2" 都是有效的。 '*' 表示授予所有用户和组的访问权限。		hdfs
dfs.namenode.acls.enabled	当为false时，拒绝所有与设置或获取ACL相关的RPC，默认情况下是false。	FALSE	true
dfs.namenode.lazypersist.file.scrub.interval.sec	namenode扫描lazypersist文件的时间间隔，当设置为负值时，则禁用此属性。	300
dfs.block.access.token.enable	当为true时，允许访问令牌访问datanode。	FALSE	true
dfs.block.access.key.update.interval	namenode更新其访问密钥的时间间隔，单位为分钟。	600
dfs.block.access.token.lifetime	访问令牌的生命周期，单位为分钟。	600
dfs.datanode.data.dir	存放datanode块的目录。如果这是一个逗号分隔的目录列表，那么数据将存储在所有命名的目录中，通常存储在不同的设备上。	file://${hadoop.tmp.dir}/dfs/data
dfs.datanode.data.dir.perm	datanode目录权限，可以为八进制，也可以为符号。	700	750
dfs.replication	副本数量。可以在创建文件时指定副本的实际数目。如果在创建时未指定复制，则使用默认值。	3
dfs.replication.max	最大副本数量。	512	50
dfs.namenode.replication.min	最小副本数量。	1
dfs.blocksize	新文件的块大小，单位为字节。可以使用如下后缀：k(kilo), m(mega), g(giga), t(tera), p(peta), e(exa) ，例如128k, 512m, 1g等。	134217728 (128M)
dfs.client.block.write.retries	datanode写入失败时，尝试重新写入的次数。	3
dfs.client.block.write.replace-datanode-on-failure.enable	当为true时，如果datanode写入失败，则重新写入新的datanode。	TRUE
dfs.client.block.write.replace-datanode-on-failure.policy	当dfs.client.block.write.replace-datanode-on-failure.enable属性为true时，该属性有效。选项有以下几种：ALWAYS，NEVER，DEFAULT。 ALWAYS：当一个存在的DataNode被删除时，总是添加一个新的DataNode NEVER：永远不添加新的DataNode DEFAULT：副本数是r，DataNode的数时n，只要r >= 3时，或者floor(r/2)大于等于n时，r>n时再添加一个新的DataNode，并且这个块是hflushed/appended	DEFAULT	NEVER
dfs.client.block.write.replace-datanode-on-failure.best-effort	当dfs.client.block.write.replace-datanode-on-failure.enable属性为true时使用。Best effort表示在继续写入新datanode时，如果仍然写入失败时采取的策略。当该属性为true时，如果新datanode写入失败，则继续找新的datanode写入；当该属性为false时，如果新datanode写入失败，则不再尝试写入新datanode，而是抛出异常。	FALSE
dfs.blockreport.intervalMsec	块报告的时间间隔，以毫秒为单位。	21600000
dfs.blockreport.initialDelay	第一次块报告的时间延迟，以秒为单位。	0	120
dfs.blockreport.split.threshold	当datanode的块数量小于该属性的值时，将用一条消息发送所有目录的块报告，如果datanode的块数量大于该属性的值，则每个目录用单独的消息发送块报告。	1000000
dfs.datanode.directoryscan.interval	datanode以秒为单位扫描数据目录，并协调内存块和磁盘上的块之间的差异。	21600
dfs.datanode.directoryscan.threads	线程池中用于编制卷报告的线程数。	1
dfs.datanode.directoryscan.throttle.limit.ms.per.sec	每秒钟用于报告编译的线程的运行时间，当有多个线程时，该属性的时间是多个线程的累计时间。	0
dfs.heartbeat.interval	datanode的心跳时间间隔，单位为秒。	3
dfs.namenode.handler.count	RPC服务器的监听client线程数，如果dfs.namenode.servicerpc-address属性没有配置，则线程会监听所有节点的请求。	10	300
dfs.namenode.safemode.threshold-pct	dfs.namenode.replication.min属性中副本需要满足的块的百分比。	0.999f	1
dfs.namenode.safemode.min.datanodes	在退出安全模式前，需要满足活跃的datanode的数量。	0
dfs.namenode.safemode.extension	在达到阈值后，经过多长时间后会退出安全模式，单位为毫秒。	30000
dfs.namenode.resource.check.interval	namenode resource checker运行的时间间隔，单位为毫秒。	5000
dfs.namenode.resource.du.reserved	存储或请求namenode存储目录的空间大小，单位为字节。	104857600
dfs.namenode.resource.checked.volumes	本地目录列表。
dfs.namenode.resource.checked.volumes.minimum	所需的冗余namenode存储卷的最小数量。	1
dfs.datanode.balance.bandwidthPerSec	datanode的最大带宽，可以使用如下后缀k(kilo)， m(mega)， g(giga)， t(tera)，p(peta)， e(exa)，例如128k, 512m, 1g等。或者提供完整的字节数，如134217728。	1048576 ( 1M )	10485760 (10M)
dfs.mover.max-no-move-interval	If this specified amount of time has elapsed and no block has been moved out of a source DataNode, on more effort will be made to move blocks out of this DataNode in the current Mover iteration.	60000
dfs.hosts	命名一个文件，该文件包含允许连接到namenode的主机列表。必须指定文件的完整路径名。如果值为空，则允许所有主机。
dfs.hosts.exclude	命名一个文件，该文件包含不允许连接到namenode的主机列表。必须指定文件的完整路径名。如果值为空，则不排除任何主机。		/etc/hadoop/conf/dfs.exclude
dfs.namenode.max.objects	DFS支持的文件、目录和块的最大数量。0的值指示DFS支持的对象数目没有限制。	0
dfs.namenode.datanode.registration.ip-hostname-check	当为true时，namenode连接datanode的地址必须解析成主机名。	TRUE
dfs.namenode.decommission.interval	namenode定期检查维护是否结束的时间间隔，单位是秒。	30
dfs.namenode.decommission.blocks.per.interval	在每次维护期间，处理块的近似数量。	500000
dfs.namenode.decommission.max.concurrent.tracked.nodes	同时进入decommisson或maintenance的datanode的数量。	100
dfs.namenode.replication.interval	namenode定期计算datanode副本数量的时间间隔，单位为秒。	3
dfs.namenode.accesstime.precision	HDFS文件访问时间的精确值，默认为1小时。当为0时，表示禁用。	3600000	0
dfs.datanode.plugins	逗号分隔的datanode插件列表。
dfs.namenode.plugins	逗号分隔的namenode插件列表。
dfs.namenode.block-placement-policy.default.prefer-local-node	控制默认块放置策略如何放置块的第一个副本。当TRUE时，它将更喜欢客户端正在运行的节点。当FALSE时，它将首选与客户端相同的机架中的节点。设置为FALSE避免了大文件的整个副本终止在单个节点上的情况，从而创建热点。	TRUE
dfs.stream-buffer-size	流文件的缓冲区大小。	4096
dfs.bytes-per-checksum	每个校验和的字节数，不能大于dfs.stream-buffer-size属性的值。	512
dfs.client-write-packet-size	客户端写入的数据包大小。	65536
dfs.client.write.exclude.nodes.cache.expiry.interval.millis	在客户机中排除DN列表中的DN的最大周期。在此阶段之后，以毫秒为单位，先前排除的节点将自动从缓存中移除，并且将再次被认为适合于块分配。在保持文件打开很长时间（如写前日志（WAL）文件）的情况下，可以使其降低或提高，从而使作者能够容忍集群维护重新启动。默认为10分钟。	600000
dfs.namenode.checkpoint.dir	DFS secondary name node存放临时镜像的目录。如果这是一个逗号分隔的目录列表，则在所有目录中复制该图像以进行冗余。	file://${hadoop.tmp.dir}/dfs/namesecondary	/hadoop/hdfs/namesecondary
dfs.namenode.checkpoint.edits.dir	DFS secondary name node存放临时edits的目录。如果这是一个逗号分隔的目录列表，则在所有目录中复制该图像以进行冗余。	${dfs.namenode.checkpoint.dir}	${dfs.namenode.checkpoint.dir}
dfs.namenode.checkpoint.period	两个周期检查点之间的秒数。	3600	21600
dfs.namenode.checkpoint.txns	创建检查点的时间间隔。	1000000	1000000
dfs.namenode.checkpoint.check.period	查询未检查的检查点事务的执行时间间隔，单位为秒。	60
dfs.namenode.checkpoint.max-retries	当加载fsimage或重演edits失败时，重试的次数。	3
dfs.namenode.num.checkpoints.retained	在namenode和seccondary namenode中保留image检查点（fsimage_*）的数量。	2
dfs.namenode.num.extra.edits.retained	namenode的需要保留的额外的事务。	1000000
dfs.namenode.max.extra.edits.segments.retained	额外的edit日志段的最大数量。	10000
dfs.namenode.delegation.key.update-interval	namenode中更新委托令牌主密钥的时间间隔，单位为毫秒。	86400000
dfs.namenode.delegation.token.max-lifetime	令牌的最大生命周期，单位为毫秒。	604800000
dfs.namenode.delegation.token.renew-interval	授权令牌的更新间隔以毫秒为单位。	86400000
dfs.datanode.failed.volumes.tolerated	在数据阳极停止服务之前允许失败的卷的数量。默认情况下，任何卷故障都会导致datanode关闭。	0
dfs.image.compress	dfs image是否应该压缩。	FALSE
dfs.image.compression.codec	如果DFS图像被压缩，它们应该如何压缩？必须是 io.compression.codecs属性中定义的编解码器。	org.apache.hadoop.io.compress.DefaultCodec
dfs.image.transfer.timeout	image传输超时时间，单位为毫秒。	60000
dfs.image.transfer.bandwidthPerSec	用于常规image传输的最大带宽，即每秒的字节数。	0
dfs.image.transfer.chunksize	上传检查点的块大小，以字节为单位。	65536
dfs.namenode.support.allow.format	是否允许namenode将自身进行格式化。建议设置为false。	TRUE
dfs.datanode.max.transfer.threads	datanode进行传输数据的最大线程数。	4096	16384
dfs.datanode.scan.period.hours	当为正值时，datanode将按照设定时间间隔进行块扫描。当为负值时，则禁止块扫描。当为0时，则使用默认的504小时（3周）进行定期扫描。	504
dfs.block.scanner.volume.bytes.per.second	当为0时，datanode的块扫描会被禁用，当为正数时，该属性为datanode每秒扫描的字节数。I	1048576
dfs.datanode.readahead.bytes	在读取块文件时，如果Hadoop本地库可用，datanode可以使用posix_fadvise系统调用来在当前阅读器位置之前将数据显式地写入操作系统缓冲区缓存中。这可以提高性能，尤其是当磁盘高度竞争时。此配置指定当前数据读取位置前面的字节数，datanode将尝试提前读取。通过将此属性配置为0，可以禁用此特性。如果本地库不可用，此配置没有效果。	4194304
dfs.datanode.drop.cache.behind.reads	在一些工作负载中，从HDFS读取的数据被认为足够大以至于在操作系统缓冲区高速缓存中不太有用。在这种情况下，datanode可以被配置为在传送到客户端之后从缓存高速缓存中自动清除所有数据。对于只读取短块（例如Hbase random IO工作负载）的工作负载，此行为被自动禁用。这可以通过释放缓存缓存空间使用更多可缓存数据来改善某些工作负载的性能。如果Hadoop本机库不可用，此配置没有效果。	FALSE
dfs.datanode.drop.cache.behind.writes	在一些工作负载中，已知写入HDFS的数据足够大，以至于在操作系统缓冲区高速缓存中不太有用。在这种情况下，datanode可以被配置为在写入到磁盘之后从缓存高速缓存中自动清除所有数据。这可以通过释放缓存缓存空间使用更多可缓存数据来改善某些工作负载的性能。如果Hadoop本机库不可用，此配置没有效果。	FALSE
dfs.datanode.sync.behind.writes	当为true时，datanode将指示操作系统在写入后立即将所有写入的数据排队到磁盘。这与通常的OS策略不同，它可能在触发写回之前等待30秒。这可以通过平滑写入磁盘的数据的IO配置文件来改善某些工作负载的性能。如果Hadoop本机库不可用，此配置没有效果。	FALSE
dfs.client.failover.max.attempts	client最多尝试次数，如果超过，则认为client失败。	15
dfs.client.failover.sleep.base.millis	错误重试的时间间隔，这是一个这是迄今为止尝试的数目的函数，具有+/- 50%的随机因子。此选项指定在故障转移计算中使用的基值。第一次故障转移将立即重试。第二次故障转移尝试将至少延迟dfs.client.failover.sleep.base.millis milliseconds，等等。	500
dfs.client.failover.sleep.max.millis	错误重试的时间间隔，这是一个这是迄今为止尝试的数目的函数，具有+/- 50%的随机因子。此选项指定在故障转移之间等待的最大值dfs.client.failover.sleep.max.millis milliseconds属性值的+/- 50%。	15000
dfs.client.failover.connection.retries	指示故障转移IPC客户端将建立服务器连接的重试次数。	0
dfs.client.failover.connection.retries.on.timeouts	在建立服务器连接时，故障转移IPC客户端将在套接字超时上进行重试次数。	0
dfs.client.datanode-restart.timeout	datanode重启等待时间，单位为秒。	30
dfs.nameservices	逗号分隔的名称服务器列表。
dfs.nameservice.id	nameservice的ID。
dfs.internal.nameservices	逗号分隔的属于集群的nameservice列表。
dfs.ha.namenodes.EXAMPLENAMESERVICE	给定nameservicce的前缀列表，可以用逗号分隔。这将被用于确定集群中中的namenode。
dfs.ha.namenode.id	namenode的ID。
dfs.ha.log-roll.period	standby节点向active节点询问edits的时间间隔，以秒为单位。	120
dfs.ha.tail-edits.period	standby节点检查log段的时间间隔，以秒为单位。	60
dfs.ha.automatic-failover.enabled	是否启用自动故障转移。	FALSE
dfs.client.use.datanode.hostname	client连接datanode时，是否应该使用datanode的主机名。	FALSE
dfs.datanode.use.datanode.hostname	datanode连接其它datanode进行数据传输时，是否应该使用datanode的主机名。	FALSE
dfs.client.local.interfaces	一个逗号分隔的网络接口名称列表，用于client和datanode之间的数据传输。
dfs.datanode.shared.file.descriptor.paths	一个逗号分隔的路径列表，用于创建将在datanode和client之间共享的文件描述符。	/dev/shm,/tmp
dfs.short.circuit.shared.memory.watcher.interrupt.check.ms	为单元测试使用的一个属性。	60000
dfs.namenode.kerberos.principal	namenode服务主体。这通常设置为nn/[email protected]。每个namenode将在启动时用它自己的完全限定主机名替换宿主。 _HOST占位符允许在HA设置中使用两个namenode上相同的配置设置。
dfs.namenode.keytab.file	namenode服务主体的keytab文件，主体参数由dfs.namenode.kerberos.principal属性配置。
dfs.datanode.kerberos.principal	datanode服务主体。
dfs.datanode.keytab.file	datanode服务主体的keytab文件，主体参数由dfs.datanode.kerberos.principal属性配置。
dfs.journalnode.kerberos.principal	JournalNode服务主体。这通常设置为jn/[email protected]。每个journalnode将在启动时用它自己的完全限定主机名替换宿主。 _HOST占位符允许使用与其它journalnode相同的配置设置。
dfs.journalnode.keytab.file	journalnode服务主体的keytab文件，主体参数由dfs.journalnode.kerberos.principal属性配置。
dfs.namenode.kerberos.internal.spnego.principal	当kerberos启用时，namenode用于web UI SPNEGO验证的服务主体。	${dfs.web.authentication.kerberos.principal}
dfs.journalnode.kerberos.internal.spnego.principal	当kerberos启用时，journalnode http server用于SPNEGO验证的服务主体。
dfs.secondary.namenode.kerberos.internal.spnego.principal	当kerberos启用时，secondary namenode用于web UI SPNEGO验证的服务主体。	${dfs.web.authentication.kerberos.principal}
dfs.web.authentication.kerberos.principal	namenode用于WebHDFS SPNEGO验证的服务主体，需要WebHDFS和安全性都启用。
dfs.web.authentication.kerberos.keytab	和dfs.web.authentication.kerberos.principal属性的主体相关的keytab文件。
dfs.namenode.kerberos.principal.pattern	在跨域环境中使用。	*
dfs.namenode.avoid.read.stale.datanode	是否允许读取“陈旧”datanode（也就是在设定时间间隔内没有向namenode发送心跳消息的节点）。	FALSE	true
dfs.namenode.avoid.write.stale.datanode	是否允许写入“陈旧”datanode（也就是在设定时间间隔内没有向namenode发送心跳消息的节点）。	FALSE	true
dfs.namenode.stale.datanode.interval	在设定的这个时间里，如果namenode没有收到datanode的心跳消息，则将datanode置为“陈旧”datanode，单位为毫秒。	30000
dfs.namenode.write.stale.datanode.ratio	当陈旧datanode的数量占比超过设置的值时，会停止写入陈旧的datanode。	0.5f	1.0f
dfs.namenode.invalidate.work.pct.per.iteration	注意：高级属性。谨慎改变。该属性决定了单条datanode心跳删除命令进行块无效（删除）的百分比。0.32f表示100%。	0.32f
dfs.namenode.replication.work.multiplier.per.iteration	注意：高级属性。谨慎改变。Datanode并行传输时的块数量。这个数字可以是任何正、非零整数。	2
nfs.server.port	nft的端口号。	2049
nfs.mountd.port	hadoop安装守护进程的端口号。	4242
nfs.dump.dir	该目录用于在写入HDFS之前临时保存无序的写入。对于每一个文件，无序的写入在累积到超过一定的阈值（例如1MB）之后被丢弃，因此需要确保目录有足够的空间。	/tmp/.hdfs-nfs
nfs.rtmax	这是NFS网关支持的读取请求的最大字节大小。	1048576
nfs.wtmax	这是NFS网关支持的写入请求的最大字节大小。	1048576
nfs.keytab.file	注意：高级属性。谨慎改变。这是HDFS NFS网关的keytab文件的路径。
nfs.kerberos.principal	注意：高级属性。谨慎改变。这是Kerberos主体的名称。格式为nfs-gateway-user/nfs-gateway-host@kerberos-realm
nfs.allow.insecure.ports	当为false时，会拒绝来自无特权端口（高于1023的端口）的客户端连接。	TRUE
dfs.webhdfs.enabled	是否允许在namenode和datanode中启用WebHDFS (REST API)。	TRUE
hadoop.fuse.connection.timeout	在fuse_dfs中缓存libhdfs连接对象的最小秒数。较低的值将导致较低的内存消耗；较高的值可以通过避免创建新连接对象的开销来加快访问速度。	300
hadoop.fuse.timer.period	fuse_dfs中缓存过期检查之间的秒数。	5
dfs.metrics.percentiles.intervals	默认情况下被禁用。
hadoop.user.group.metrics.percentiles.intervals	默认情况下被禁用。
dfs.encrypt.data.transfer	是否启用块数据的加密。	FALSE
dfs.encrypt.data.transfer.algorithm	选项有3des和rc4两种。
dfs.encrypt.data.transfer.cipher.suites	选项有AES/CTR/NoPadding		AES/CTR/NoPadding
dfs.encrypt.data.transfer.cipher.key.bitlength	client和datanode之间的密钥位长度，值有128，192和256三种。	128
dfs.trustedchannel.resolver.class	TrustedChannelResolver用于确定通道是否受信任以用于普通数据传输。
dfs.data.transfer.protection	一个逗号分隔的SASL保护值列表，用于读取或写入块数据时与datanode的安全连接。选项有authentication, integrity and privacy三种。
dfs.data.transfer.saslproperties.resolver.class	用于连接datanode的QOP的SaslPropertiesResolver，默认是hadoop.security.saslproperties.resolver.class。
dfs.datanode.hdfs-blocks-metadata.enabled	是否启用后面datanode支持DistributedFileSystem#getFileVBlockStorageLocations API。	FALSE
dfs.client.file-block-storage-locations.num-threads	DistributedFileSystem#getFileBlockStorageLocations()中进行并行RPC的线程数。	10
dfs.client.file-block-storage-locations.timeout.millis	DistributedFileSystem#getFileBlockStorageLocations()中进行RPC的超时时间，单位为毫秒。	1000
dfs.journalnode.rpc-address	JournalNode RPC服务器地址和端口。	0.0.0.0:8485
dfs.journalnode.http-address	JournalNode HTTP服务器监听的地址和端口。如果端口为0，那么服务器将在自由端口启动。	0.0.0.0:8480
dfs.journalnode.https-address	JournalNode HTTPS服务器监听的地址和端口。如果端口为0，那么服务器将在自由端口启动。	0.0.0.0:8481
dfs.namenode.audit.loggers	org.apache.hadoop.hdfs.server.namenode.AuditLogger的实现类。	default
dfs.datanode.available-space-volume-choosing-policy.balanced-space-threshold	当dfs.datanode.fsdataset.volume.choosing.policy属性设置为org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy时使用。该属性控制datanode卷在被认为不平衡之前允许在空闲磁盘空间上有多少不同字节。如果所有卷的自由空间都在这一范围内，则卷将被认为是平衡的，并且块分配将在纯循环的基础上完成。	10737418240
dfs.datanode.available-space-volume-choosing-policy.balanced-space-preference-fraction	当dfs.datanode.fsdataset.volume.choosing.policy属性设置为org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy时使用。此属性控制新的块分配百分比将被发送给具有比其他磁盘更可用的磁盘空间的卷。这个设置应该在0.0到1.0的范围内。	0.75f
dfs.namenode.edits.noeditlogchannelflush	是否刷新edit log文件通道。	FALSE
dfs.client.cache.drop.behind.writes	与dfs.datanode.drop.cache.behind.writes属性类似，该属性导致页面缓存被丢弃在HDFS写之后，可能释放更多的内存用于其他用途。
dfs.client.cache.drop.behind.reads	与dfs.datanode.drop.cache.behind.reads属性类似，该属性导致页面缓存被丢弃在HDFS读取之后，可能释放更多的内存用于其他用途。
dfs.client.cache.readahead	当使用远程读取时，此设置会导致datanode使用posix_fadvise在块文件中提前读取，可能会降低I/O等待时间。
dfs.namenode.enable.retrycache	当为true时，允许在namenode上重试缓存。	TRUE
dfs.namenode.retrycache.expirytime.millis	重试缓存条目被保留的时间。	600000
dfs.namenode.retrycache.heap.percent	此参数配置为重试缓存分配的堆大小（不包括响应缓存）。	0.03f
dfs.client.mmap.enabled	如果将此设置为false，客户端将不会尝试内存映射读取。	TRUE
dfs.client.mmap.cache.size	当使用0拷贝读取时，DFS client保持最近使用的内存映射区域的缓存。此参数控制将在该缓存中保留的最大条目数。这个数字越大，我们可能会使用更多的内存描述符文件描述符。注意，当这个大小设置为0时，仍然可以进行零拷贝读取。 Wh	256
dfs.client.mmap.cache.timeout.ms	在使用时，我们将在缓存中保持MMAP条目的最小时间长度。如果一个条目在缓存中比这个长，并且没有人使用它，它将被后台线程移除。	3600000
dfs.client.mmap.retry.timeout.ms	在重试失败的MMAP操作之前，我们将等待的最小时间量。	300000
dfs.client.short.circuit.replica.stale.threshold.ms	如果没有datanode的通信，我们将考虑短路副本的有效时间是最大的。经过这段时间后，即使在缓存中，我们也会重新获取短路副本。	1800000
dfs.namenode.path.based.cache.block.map.allocation.percent	分配给缓存块地图的java堆的百分比。	0.25
dfs.datanode.max.locked.memory	用于在datanode上缓存块副本的字节内存量。	0
dfs.namenode.list.cache.directives.num.responses	设置NAMENODE将响应于listDirectives RPC发送的高速缓存指令的数量。.	100
dfs.namenode.list.cache.pools.num.responses	设置NAMENODE将响应于listPools RPC发送的高速缓存池的数量。	100
dfs.namenode.path.based.cache.refresh.interval.ms	后续路径高速缓存之间的毫秒数。	30000
dfs.namenode.path.based.cache.retry.interval.ms	当NAMENODE需要取消缓存的东西，或者缓存未缓存的东西时，它必须通过发送 DNA_CACHE或DNA_UNCACHE命令来响应数据阳极心跳来引导数据。	30000
dfs.datanode.fsdatasetcache.max.threads.per.volume	用于缓存datanode上新数据的每卷的最大线程数。这些线程同时消耗I/O和CPU。这会影响正常的datanode操作。	4
dfs.cachereport.intervalMsec	以毫秒为单位确定缓存报告间隔。在这段时间之后，datanode将其缓存状态的完整报告发送到namenode。	10000
dfs.namenode.edit.log.autoroll.multiplier.threshold	确定active namenode何时滚动自己的edit log。	2
dfs.namenode.edit.log.autoroll.check.interval.ms	active namenode以毫秒为单位检查它是否需要滚动自己的edit log。	300000
dfs.webhdfs.user.provider.user.pattern	webhdfs用户名和组的有效模式，它必须是一个有效的java正则表达式。	^[A-Za-z_][A-Za-z0-9._-]*[$]?$
dfs.client.context	我们应该使用的DFSClient上下文的名称。	default
dfs.client.read.shortcircuit	此配置参数开启短路本地读取。	FALSE	true
dfs.client.socket.send.buffer.size	DFSClient的套接字发送缓冲区大小。这可能影响TCP连接吞吐量。如果设置为零或负值，则不显式设置缓冲区大小，从而使TCP自动调整到某些系统上。默认值为0。.	131072
dfs.domain.socket.path	可选项。DataNode 本地文件系统到 UNIX 域套接字的路径，用于 DataNode 和本地 HDFS 客户端之间的通信。该套接字用于 Short Circuit Read。只有 HDFS 系统用户和“root”拥有父目录及其所有上级的写入权限。		/var/lib/hadoop-hdfs/dn_socket
dfs.client.read.shortcircuit.skip.checksum	如果设置了此配置参数，则短路本地读取将跳过校验和。这通常是不推荐的，但它可能对特殊设置有用。如果正在HDFS之外进行自己的校验求和，则可以考虑使用此方法。	FALSE
dfs.client.read.shortcircuit.streams.cache.size	DFS客户端维护了一个最近打开的文件描述符的缓存，这个参数控制缓存中文件描述符的最大数量。	256	4096
dfs.client.read.shortcircuit.streams.cache.expiry.ms	控制文件描述符在client缓存中的最小时间。	300000
dfs.datanode.shared.file.descriptor.paths	创建共享内存段的目录，用逗号分隔。Client和datanode通过这个共享内存段交换信息。	/dev/shm,/tmp
dfs.client.use.legacy.blockreader.local	当audit log级别是debug时，写入到namenode audit log的命令列表，用逗号分隔。	FALSE
dfs.block.local-path-access.user	当为true时，使用基于HDFS-2246的 Legacy short-circuit reader实现方式。
dfs.client.domain.socket.data.traffic	控制是否会尝试通过UNIX域套接字传递正常的数据流量，而不是通过TCP套接字在节点本地数据传输上传递数据。	FALSE
dfs.namenode.reject-unresolved-dn-topology-mapping	当为true时，如果datanode的拓扑映射未被解析并且返回null，则namenode将拒绝此datanode的注册。	FALSE
dfs.client.slow.io.warning.threshold.ms	在dfsclient中记录慢io警告的阈值。	30000
dfs.datanode.slow.io.warning.threshold.ms	在datanode中记录慢io警告的阈值。	300
dfs.namenode.xattrs.enabled	是否支持扩展namenode的属性。	TRUE
dfs.namenode.fs-limits.max-xattrs-per-inode	每个索引节点的扩展属性的最大数目。	32
dfs.namenode.fs-limits.max-xattr-size	扩展属性的名称和值的最大组合大小（以字节为单位）。	16384
dfs.namenode.write-lock-reporting-threshold-ms	当一个写锁在NAMENODE上被保存很长时间时，当锁被释放时，这将被记录下来。这设置了日志记录发生时必须持有锁的时间。	5000
dfs.namenode.read-lock-reporting-threshold-ms	当读锁在NAMENODE上保存很长时间时，当锁被释放时将记录该日志。这设置了日志记录发生时必须持有锁的时间。	5000
dfs.namenode.lock.detailed-metrics.enabled	如果为true，NAMENODE将跟踪各种操作保存命名空间锁的时间，并将其作为度量。	FALSE
dfs.namenode.fslock.fair	如果为true，FS namesystem锁将在公平模式下使用，这将有助于防止编写器线程被饿死，但可以提供更低的锁定吞吐量。	TRUE	false
dfs.namenode.startup.delay.block.deletion.sec	在NAMENODE启动后，延迟设定时间后，我们将暂停块删除。默认情况下，它已被禁用。	0	3600
dfs.namenode.list.encryption.zones.num.responses	当列出加密区域时，将在批处理中返回的最大区域数。	100
dfs.namenode.inotify.max.events.per.rpc	将在单个RPC响应中发送给客户端的最大事件数。	1000
dfs.user.home.dir.prefix	该目录用于添加用户名以获得用户的home目录。	/user
dfs.datanode.cache.revocation.timeout.ms	当dfsclient读取缓存中的datanode块文件时，将跳过校验。datanode将保持块文件在缓存中，直到客户端完成。但是，如果客户端占用非常长的时间，那么datanode可能需要从缓存中逐出块文件。此属性数值控制datanode等待客户端释放其没有校验和读取的副本的时间。	900000
dfs.datanode.cache.revocation.polling.ms	datanode应该多久轮询一次，看看客户端是否停止使用datanode想要取消的副本。	500
dfs.datanode.block.id.layout.upgrade.threads	创建硬链接的最大线程数。	12
dfs.encryption.key.provider.uri	The KeyProvider to use when interacting with encryption keys used when reading and writing to an encryption zone.
dfs.storage.policy.enabled	允许用户更改文件和目录的存储策略。	TRUE
dfs.namenode.legacy-oiv-image.dir	在standby namenode和secondary namenode的检查点期间，保存fsimage的命名空间的位置。
dfs.namenode.top.enabled	启用nntop	TRUE
dfs.namenode.top.window.num.buckets	nntop的桶数。	10
dfs.namenode.top.num.users	顶部工具返回的顶级用户数。	10
dfs.namenode.top.windows.minutes	nntop在分钟内的报告周期，用逗号分隔。	1,5,25
dfs.namenode.blocks.per.postponedblocks.rescan	在postponedMisreplicatedBlocks每个迭代中扫描的块数。	10000
dfs.datanode.block-pinning.enabled	PIN块是否在受欢迎的datanode上。	FALSE
dfs.datanode.bp-ready.timeout	在接收到的请求失败之前，datanode的最大等待时间准备就绪。	20
dfs.balancer.keytab.enabled	设置为true以启用Kerberized Hadoop的keytab的登录。	FALSE
dfs.balancer.address	基于Kerberos登录时，用于keytab的主机名。	0.0.0.0:0
dfs.balancer.keytab.file	平衡器使用的keytab文件作为其服务主体登录。
dfs.balancer.kerberos.principal	平衡器主体，通常为balancer/[email protected]。
dfs.balancer.block-move.timeout	Maximum amount of time in milliseconds for a block to move. If this is set greater than 0, Balancer will stop waiting for a block move completion after this time. In typical clusters, a 3 to 5 minute timeout is reasonable. If timeout happens to a large proportion of block moves, this needs to be increased. It could also be that too much work is dispatched and many nodes are constantly exceeding the bandwidth limit as a result. In that case, other balancer parameters might need to be adjusted. It is disabled (0) by default.	0
dfs.balancer.max-no-move-interval	If this specified amount of time has elapsed and no block has been moved out of a source DataNode, on more effort will be made to move blocks out of this DataNode in the current Balancer iteration.	60000
dfs.lock.suppress.warning.interval	Instrumentation reporting long critical sections will suppress consecutive warnings within this interval.	10s
dfs.namenode.quota.init-threads	The number of concurrent threads to be used in quota initialization. The speed of quota initialization also affects the namenode fail-over latency. If the size of name space is big, try increasing this.	4
dfs.reformat.disabled	Disable reformat of NameNode. If it's value is set to "true" and metadata directories already exist then attempt to format NameNode will throw NameNodeFormatException.	FALSE
dfs.datanode.transfer.socket.send.buffer.size	Socket send buffer size for DataXceiver (mirroring packets to downstream in pipeline). This may affect TCP connection throughput. If it is set to zero or negative value, no buffer size will be set explicitly, thus enable tcp auto-tuning on some system.	131072
dfs.datanode.transfer.socket.recv.buffer.size	Socket receive buffer size for DataXceiver (receiving packets from client during block writing). This may affect TCP connection throughput. If it is set to zero or negative value, no buffer size will be set explicitly, thus enable tcp auto-tuning on some system.	131072

你可能感兴趣的:(Hadoop官方API,工具,API,速查)

理解 Node.js 中的 process`对象与常用操作 red润前端 node.js 前端 javascript
理解Node.js中的process对象与常用操作在Node.js中，process是一个全局对象，提供了与当前Node.js进程相关的信息和操作。无论是获取进程信息、处理信号、访问环境变量，还是控制进程行为，process都是不可或缺的工具。看到process不犯怵了1.获取进程信息process提供了许多属性和方法来获取当前进程的信息。process.pid：获取当前进程的PID（进程ID）。
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
Hive常用函数 - abs Called_Kingsley Hive hive 函数
Hive常用函数-abs官方解释abs(x)-returnstheabsolutevalueofx个人理解就是返回函数括号内数字的绝对值。想要获取该数的绝对值的时候就用这个函数没错使用示例selectabs(-1);>1官方示例abs(x)-returnstheabsolutevalueofxExample:>SELECTabs(0)FROMsrcLIMIT1;0>SELECTabs(-5)FRO
SNMP协议以及JAVA实战代码展示 potato_h java
SNMP协议以及代码实现主要是为了实现：Java通过SNMP协议和交换机进行交互JAVA开发SNMP明细第一步：（1）首先安装SNMP服务。（控制面板→添加与删除工具→添加与删除组件→管理和监视工具→详细信息→选择“简单网络管理协议”→确定）。（2）启动snmp服务。（3）下载snmp4j.jar（4）新建项目，加如snmp4j.jar，编写代码编写的代码中需要的内容：（1）枚举网元类型（目前只有
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
[解决方案]word文档无法存放过长过大的visio图片狮子再回头其他应用 visio word office UML
一：问题描述visio-UML画的流程图过长了，复制黏贴到word，一页无法显示全二：解决办法1.选择文档内容，工具栏“开始”——“段落”——“行距”——“单倍行距”，注意不能为固定值；2.选择“插入”---“对象”--“由文件创建”，如下图再选择浏览，打开自己的visio文件，确定。visio文件插入后，可能显示过大或不全，点击“图片工具”。调整下拉框中的高度/宽度，直到显示全visio图片.
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
在线生成自定义二维码 A__tao 其他
在线生成自定义二维码1.引言二维码已成为现代互联网的重要工具，广泛应用于链接分享、支付、身份认证等场景。然而，很多在线二维码生成工具功能有限，难以满足个性化需求。如果你需要自定义颜色、Logo、不同形状的二维码，那么推荐你使用gotool.top3.如何使用gotool.top生成自定义二维码？步骤1：访问二维码生成工具打开gotool.top，找到“二维码生成”工具。步骤2：输入二维码内容在输入
leetcode29. 两数相除-medium 智趣代码实验室 Leetcode leetcode c++
1题目：两数相除官方标定难度：中给你两个整数，被除数dividend和除数divisor。将两数相除，要求不使用乘法、除法和取余运算。整数除法应该向零截断，也就是截去（truncate）其小数部分。例如，8.345将被截断为8，-2.7335将被截断至-2。返回被除数dividend除以除数divisor得到的商。注意：假设我们的环境只能存储32位有符号整数，其数值范围是[−231,231−1]。
【Docker】搭建实用的内网穿透工具 - FRP UPToZ 群晖Docker docker 容器运维
前言本教程基于群晖的NAS设备DS423+的docker功能进行搭建FRP的客户端，DSM版本为7.2.1-69057Update5。采用香港机Debian12系统的服务器来安装FRP的服务端作为演示。服务器购买地址：https://www.crash.work/aff/AQXGDNKY简介FRP（FastReverseProxy）是一个高性能的反向代理应用，它可以帮助您将内网服务通过反向代理暴露
通俗易懂的讲解MobX luckucu javascript html5 react.js 前端
什么是MobX？想象一下，你有一个小白板，上面写着你每天要做的事情。你每完成一件事，就在白板上打个勾。这个小白板就像是你的“状态”，而你打勾的动作就是“更新状态”。MobX就是这样一个工具，它帮助你管理和更新你的“小白板”。核心概念MobX有几个核心概念：observable、action、computed和reaction。我们用一个家庭日常生活的例子来解释这些概念。Observable（可观察
Windows 和 MacOS 上安装配置ADB（安卓调试桥）网络安全苏柒 windows macos adb 网络安全 python web安全数据库
一、Android调试桥(ADB)Android调试桥（ADB）是一款多功能命令行工具，它让你能够更便捷地访问和管理Android设备。使用ADB命令，你可以轻松执行以下操作网络安全重磅福利：入门&进阶全套282G学习资源包免费分享！在设备上安装、复制和删除文件；安装应用程序；录制设备屏幕或截图；对设备进行调试，以便排查问题；检查手机上的日志文件；更新应用程序和系统组件的固件；完整地访问有关操作系
深度剖析哈希表数据结构：原理、冲突解决与优化策略麻辣酸甜笔记
摘要哈希表作为一种高效的数据结构，在计算机科学领域广泛应用。本文深入探讨哈希表的工作原理，详细分析常见的冲突解决方法，如开放地址法、链地址法等，并进一步研究哈希表在不同场景下的优化策略，旨在帮助读者全面理解哈希表数据结构及其应用。一、引言在计算机程序中，快速查找和插入数据是常见需求。哈希表以其平均时间复杂度为O(1)的高效查找和插入特性，成为解决这类问题的有力工具。从数据库索引到编程语言的集合类实
Ubuntu使用Docker部署Nginx并结合内网穿透实现公网远程访问鸭鸭渗透 eureka 云原生
目录1.安装Docker2.使用Docker拉取Nginx镜像3.创建并启动Nginx容器4.本地连接测试5.公网远程访问本地Nginx5.1内网穿透工具安装5.2创建远程连接公网地址5.3使用固定公网地址远程访问在开发人员的工作中，公网远程访问内网是其必备的技术需求之一。对于运维人员和开发者来说，能够通过公网远程访问内部的服务和应用，能够极大地提升工作效率和便利性。本文将介绍如何利用Ubuntu
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
aws s3 java使用教程_在 Amazon S3 对象上执行操作 - 适用于 Java 的 AWS 开发工具包 weixin_42510731 aws s3 java使用教程
本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。在AmazonS3对象上执行操作AmazonS3对象表示一个文件或数据集合。每个对象必须驻留在一个存储桶中。注意上传对象使用AmazonS3客户端的putObject方法，并为其提供存储桶名称、键名称和要上传的文件。存储桶必须存在，否则将出现错误。导入importcom.amazonaws.AmazonServiceExc
AWS SAP学习笔记-概念 HainesFreeman AWS aws
1、什么是ETL应用程序，举个例子说明？ETL（Extract,Transform,Load）应用程序是一种用于数据处理和迁移的工具或程序，它主要负责从多个数据源提取数据，对数据进行转换和清洗，然后将处理后的数据加载到目标数据仓库或数据库中。ETL应用程序广泛应用于数据集成、数据仓库构建、数据分析和数据迁移等场景。ETL的三个主要步骤：Extract（提取）：从各种数据源（如数据库、文件、API等
AWS WAF实战指南：从入门到精通 ivwdcwso 安全 aws 网络云计算 WAF 安全
1.引言AmazonWebServices(AWS)WebApplicationFirewall(WAF)是一款强大的网络安全工具，用于保护Web应用程序免受常见的Web漏洞攻击。本文将带您从入门到精通，深入探讨AWSWAF的实际应用策略，并提供具体案例，帮助您更好地保护您的Web应用程序。2.AWSWAF基础2.1什么是AWSWAF？AWSWAF是一种Web应用程序防火墙，可以帮助保护您的Web
探索安全的开发之路：Eclipse Steady深度揭秘尚竹兴
探索安全的开发之路：EclipseSteady深度揭秘steadyEclipseSteady:这是一个开源的持续集成和持续部署工具，用于自动化软件的开发和部署过程。它提供了一个基于Web的界面，用于创建和管理软件项目的构建和部署流程。适合用于需要自动化软件开发和部署的开发团队。特点包括简单易用、丰富的插件生态系统和与Maven和Jenkins的紧密集成。项目地址:https://gitcode.c
探索终端的新境界：Scurses与Onions框架深度揭秘雷竹榕
探索终端的新境界：Scurses与Onions框架深度揭秘ScursesScurses,terminaldrawingAPIforScala,andOnions,aScursesframeworkforeasyterminalUI项目地址:https://gitcode.com/gh_mirrors/sc/Scurses在数字化的今天，终端不仅是命令行交互的简单界面，它成为了开发人员和系统管理员的
使用 Selenium 控制现有 Edge 窗口以规避爬虫检测秋叶原の黑猫数据库
在网络爬虫开发中，网站的防爬机制常常会检测自动化工具（如Selenium）启动的浏览器实例。为了绕过这种检测，一种有效的方法是利用Selenium连接到手动打开的现有浏览器窗口，而不是每次都启动一个新的实例。本文将详细介绍如何使用Selenium控制现有的MicrosoftEdge浏览器窗口，并结合代码示例展示实现过程。1.背景介绍：为什么需要控制现有窗口？传统的Selenium脚本会通过WebD
一篇文章带你了解-selenium工作原理详解程序员笑笑软件测试 selenium 测试工具软件测试自动化测试功能测试程序人生职场和发展
前言Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
Selenium工作原理详解天才测试猿 selenium 测试工具自动化测试软件测试测试用例 python 职场和发展
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用
.gitlab-ci.yml 配置文件详解程序媛夏天 Git gitlab ci/cd .gitlab-ci.yml
个人主页：不爱吃糖的程序媛‍♂️作者简介：前端领域新星创作者、CSDN内容合伙人，专注于前端各领域技术，成长的路上共同学习共同进步，一起加油呀！✨系列专栏：前端面试宝典、JavaScript进阶、vue实战资料领取：前端进阶资料以及文中源码可以在公众号“不爱吃糖的程序媛”领取git工具文档说明：https://docs.gitlab.com/ee/ci/yaml/gitlab_ci_yaml.ht
OpenManus 架构的详细技术实现大势下的牛马搭建本地gpt 架构 OpenManus Manus Agent
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层：LLM层模型选择与适配：OpenManus允许用户替换底层LLM（如mPLUG-Owl3、Qwen、Llama等），通过统一接口调用模型API，实现跨模型兼容性Prompt工程设计：用户输入的自然语言指令通过精心设计的Prompt转换为结构化指令。例如，PlanningTool使用预定义的Prompt模板（如请将任务分解为可执
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
Fluent 与 Openfoam 网格比较 Hardess-god CFD 服务器
ANSYSFluent和OpenFOAM是两个广泛使用的计算流体动力学（CFD）软件，它们在网格生成、处理和使用方面存在一些基本差异。这些差异主要源于两者的设计哲学、目标用户群体和工作流程。以下是Fluent和OpenFOAM在网格生成方面的一些关键比较：1.网格生成工具ANSYSFluent:Fluent通常与ANSYSWorkbench集成使用，后者提供了一个强大的网格生成工具（如ANSYSM
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring