Leesin Dong

大数据学习笔记之HBase（五）：一些优化技巧（通用技巧、linux、HDFS、MapReduce、HBase、内存、JVM、zookeeper）

文章目录

三十七、一些优化技巧

37.1、通用优化

37.1.1、NameNode的元数据备份使用SSD
37.1.2、定时备份NameNode上的元数据，每小时或者每天备份，如果数据极其重要，可以5~10分钟备份一次。备份可以通过定时任务复制元数据目录即可。
37.1.3、为NameNode指定多个元数据目录，使用dfs.name.dir或者dfs.namenode.name.dir指定。一个指定本地磁盘，一个指定网络磁盘。这样可以提供元数据的冗余和健壮性，以免发生故障。
37.1.4、设置dfs.namenode.name.dir.restore为true，允许尝试恢复之前失败的dfs.namenode.name.dir目录，在创建checkpoint时做此尝试，如果设置了多个磁盘，建议允许。
37.1.5、NameNode节点必须配置为RAID1（镜像盘）结构。
37.1.6、补充：什么是Raid0、Raid0+1、Raid1、Raid5
37.1.7、保持NameNode日志目录有足够的空间，这些日志有助于帮助你发现问题。
37.1.8、因为Hadoop是IO密集型框架，所以尽量提升存储的速度和吞吐量（类似位宽）。

37.2、Linux优化

37.2.1、开启文件系统的预读缓存可以提高读取速度
37.2.2、关闭进程睡眠池
37.2.3、调整ulimit上限，默认值为比较小的数字
37.2.4、开启集群的时间同步NTP，请参看之前文档
37.2.5、更新系统补丁（尖叫提示：更新补丁前，请先测试新版本补丁对集群节点的兼容性）

37.3、HDFS优化（hdfs-site.xml）

37.3.1、保证RPC调用会有较多的线程数
37.3.2、副本数的调整
37.3.3.、文件块大小的调整

37.4、MapReduce优化（mapred-site.xml）

37.4.1、Job任务服务线程数调整
37.4.2、Http服务器工作线程数
37.4.3、文件排序合并优化
37.4.5、设置任务并发
37.4.6、MR输出数据的压缩
37.4.7、优化Mapper和Reducer的个数

37.5、HBase优化

37.5.1、在HDFS的文件中追加内容
37.5.2、优化DataNode允许的最大文件打开数
37.5.3、优化延迟高的数据操作的等待时间
37.5.4、优化数据的写入效率
37.5.5、优化DataNode存储
37.5.6、设置RPC监听数量
37.5.7、优化HStore文件大小
37.5.8、优化hbase客户端缓存
37.5.9、指定scan.next扫描HBase所获取的行数

37.6、内存优化
37.7、JVM优化

37.7.1、并行GC
37.7.2、同时处理垃圾回收的线程数
37.7.3、禁用手动GC

37.8、Zookeeper优化

37.8.1、优化Zookeeper会话超时时间

三十七、一些优化技巧

37.1、通用优化

37.1.1、NameNode的元数据备份使用SSD

需要在进群里面单独申请一块SSD（硬盘）

37.1.2、定时备份NameNode上的元数据，每小时或者每天备份，如果数据极其重要，可以5~10分钟备份一次。备份可以通过定时任务复制元数据目录即可。

复制的内容是hadoop根目录下的data目录

37.1.3、为NameNode指定多个元数据目录，使用dfs.name.dir或者dfs.namenode.name.dir指定。一个指定本地磁盘，一个指定网络磁盘。这样可以提供元数据的冗余和健壮性，以免发生故障。

dfs.name.dir、dfs.namenode.name.dir一个是本地的，把原数据做一个冗余，数据本身是有三个冗余的，而原数据本身是没有冗余的，所以一个指定本地，一个指定网路磁盘，进行冗余

37.1.4、设置dfs.namenode.name.dir.restore为true，允许尝试恢复之前失败的dfs.namenode.name.dir目录，在创建checkpoint时做此尝试，如果设置了多个磁盘，建议允许。

37.1.5、NameNode节点必须配置为RAID1（镜像盘）结构。

RAID1是逻辑上的算法或者概念，RAID磁盘阵列，RAID1的意思就是镜像盘，

37.1.6、补充：什么是Raid0、Raid0+1、Raid1、Raid5

Standalone
最普遍的单磁盘储存方式。

Cluster
集群储存是通过将数据分布到集群中各节点的存储方式,提供单一的使用接口与界面,使用户可以方便地对所有数据进行统一使用与管理。

Hot swap
用户可以再不关闭系统,不切断电源的情况下取出和更换硬盘,提高系统的恢复能力、拓展性和灵活性。
热插拔，就好像一台电脑，当前的硬盘坏了，然后插上另一块硬盘，这两个硬盘里面的内容是一样的。

Raid0
Raid0是所有raid中存储性能最强的阵列形式。其工作原理就是在多个磁盘上分散存取连续的数据,这样,当需要存取数据是多个磁盘可以并排执行,每个磁盘执行属于它自己的那部分数据请求,显著提高磁盘整体存取性能。但是不具备容错能力,适用于低成本、低可靠性的台式系统。

Raid1
又称镜像盘,把一个磁盘的数据镜像到另一个磁盘上,采用镜像容错来提高可靠性,具有raid中最高的数据冗余能力。存数据时会将数据同时写入镜像盘内,读取数据则只从工作盘读出。发生故障时,系统将从镜像盘读取数据,然后再恢复工作盘正确数据。这种阵列方式可靠性极高,但是其容量会减去一半。广泛用于数据要求极严的应用场合,如商业金融、档案管理等领域。只允许一颗硬盘出故障。

Raid0+1
将Raid0和Raid1技术结合在一起,兼顾两者的优势。在数据得到保障的同时,还能提供较强的存储性能。不过至少要求4个或以上的硬盘，但也只允许一个磁盘出错。是一种三高技术。

Raid5
Raid5可以看成是Raid0+1的低成本方案。采用循环偶校验独立存取的阵列方式。将数据和相对应的奇偶校验信息分布存储到组成RAID5的各个磁盘上。当其中一个磁盘数据发生损坏后,利用剩下的磁盘和相应的奇偶校验信息重新恢复/生成丢失的数据而不影响数据的可用性。至少需要3个或以上的硬盘。适用于大数据量的操作。成本稍高、储存新强、可靠性强的阵列方式。
RAID还有其他方式，请自行查阅。

最安全的是Raid1，这种存储方案比较增加成本，两个硬盘一模一样的数据，冗余出来4

37.1.7、保持NameNode日志目录有足够的空间，这些日志有助于帮助你发现问题。

如果日志没有足够的空间的话，就会把之前老的日志覆盖掉。

37.1.8、因为Hadoop是IO密集型框架，所以尽量提升存储的速度和吞吐量（类似位宽）。

买显卡的时候，评价一个显卡的标准是什么？很多人会说是显存，其实不是，是位宽，尾矿的意思是，同一单位时间内，能够处理的图像数据的个数，就相当于马路的宽度一样，停车场再大，将显存比喻为停车场，停车场再大，马路很窄，意味着同一时间内走过的车辆是很小的，也就是同一时间走过的数据流是很小的，即吞吐量。
相同的显存的显卡，比如都是2g的显存，一个是64位位宽的，一个是256位位宽的，他们的价格有时候能够差到一万多，显卡追求显存没有用，一般玩游戏2g的显存就够了，但是位宽很小的话，单位时间传输的不够，fps还是很小的，会很卡。

37.2、Linux优化

37.2.1、开启文件系统的预读缓存可以提高读取速度

打个比方，浏览网页，还没浏览到后面已经加载完了。

$ sudo blockdev --setra 32768 /dev/sda
（尖叫提示：ra是readahead的缩写）
这里操作的是sda这块硬盘
sudo blockdev 按tab键会有很多的提示
$ sudo blockdev --getra /dev/sda 查看是否修改成功

37.2.2、关闭进程睡眠池

$ sudo sysctl -w vm.swappiness=0

想设置的大一点的，不要大于10。
在linux里面如果有一个进程现在处于不活跃的状态，就会让他变成一个挂起的状态，睡眠，但是这个进程没有被杀死，还是会占用系统资源的。
上面这句话后面的数字如果是0的话，表示，后面不允许任何进程的挂起，如果不用了，就杀掉，释放资源，如果设置为567等数字，意思就是允许挂起的数量是多少。

37.2.3、调整ulimit上限，默认值为比较小的数字

设置linux允许的最大进程数和最大文件数
DataNode可能会访问多个文件，因为一个很大的文件可能分在很多的文件中进行存储，如果DataNode访问的达到了linux的上限，就会导致我想要访问，但是却访问不了了。
ResourceManager开了很多任务，现在进程数达到了linux的限制，任务就开不起来了。

$ ulimit -n 查看允许最大进程数
$ ulimit -u 查看允许打开最大文件数
修改：
$ sudo vi /etc/security/limits.conf 修改打开文件数限制
末尾添加：

*                soft    nofile          1024000
*                hard    nofile          1024000
Hive             -       nofile          1024000
hive             -       nproc           1024000

*的意思是所有用户，hive的意思是hive用户

$ sudo vi /etc/security/limits.d/20-nproc.conf 修改用户打开进程数限制
修改为：
#*          soft    nproc     4096
#root       soft    nproc     unlimited
*          soft    nproc     40960
root       soft    nproc     unlimited

unlimited是无限

保存退出之后需要重启机器，否则不会生效。

37.2.4、开启集群的时间同步NTP，请参看之前文档

一般而言，集群中的第一台机器，每过一段时间，将自己的系统时间跟网络同步一次，剩下的所有机器的时间都跟第一台机器同步。

37.2.5、更新系统补丁（尖叫提示：更新补丁前，请先测试新版本补丁对集群节点的兼容性）

一定不要升级，如果要升级，可以找另一台机器，升级看看有没有问题，测试一段时间稳定了之后，在把生产环境的进行升级。

37.3、HDFS优化（hdfs-site.xml）

37.3.1、保证RPC调用会有较多的线程数

哪里用到了rpc调用？ DataNode 需要存储数据的时候需要和 NameNode 进行通信，这个通信的过程就是rpc的过程

属性：dfs.namenode.handler.count
解释：该属性是NameNode服务默认线程数，的默认值是10，根据机器的可用内存可以调整为50~100

属性：dfs.datanode.handler.count
解释：该属性默认值为10，是DataNode的处理线程数，如果HDFS客户端程序读写请求比较多，可以调高到15_{20，设置的值越大，内存消耗越多，不要调整的过高，一般业务中，5}10即可。

一个NameNode对多个DataNode
一个DataNode对一个DataNode

所以DataNode可以设置的小一点
这两个配置都不能设置的过高，设置的过高的话，可能会因为某一次业务的暴增，把服务器拖死。

37.3.2、副本数的调整

属性：dfs.replication
解释：如果数据量巨大，且不是非常之重要，可以调整为2_{3，如果数据非常之重要，可以调整为3}5。

很少见备份超过两个的。

37.3.3.、文件块大小的调整

属性：dfs.blocksize
默认128m
解释：块大小定义，该属性应该根据存储的大量的单个文件大小来设置，如果大量的单个文件都小于100M，建议设置成64M块大小，对于大于100M或者达到GB的这种情况，建议设置成256M，一般设置范围波动在64M~256M之间。

设置何时的块大小，是为了更快的寻址，如果设置的块过大的话，需要过多的寻址，影响性能。

37.4、MapReduce优化（mapred-site.xml）

37.4.1、Job任务服务线程数调整

mapreduce.jobtracker.handler.count
该属性是Job任务线程数，默认值是10，根据机器的可用内存可以调整为50~100

当前的MapReduce任务一共有几个线程可以去跑，一个线程跑Map，一个线程跑Reduce，如果一个线程跑两个map，只能放到队列里面了，不能同时操作

37.4.2、Http服务器工作线程数

属性：mapreduce.tasktracker.http.threads
解释：定义HTTP服务器工作线程数，默认值为40，对于大集群可以调整到80~100

37.4.3、文件排序合并优化

属性：mapreduce.task.io.sort.factor
解释：文件排序时同时合并的数据流的数量，这也定义了同时打开文件的个数，默认值为10，如果调高该参数，可以明显减少磁盘IO，即减少文件读取的次数。
能够同时操作的文件的数量，设置大了效率高，效率高，但是开销大。

37.4.5、设置任务并发

属性：mapreduce.map.speculative
解释：该属性可以设置任务是否可以并发执行，如果任务多而小，该属性设置为true可以明显加快任务执行效率，但是对于延迟非常高的任务，建议改为false，这就类似于迅雷下载。

假如下载电影，电影都是一个十分钟，就需要并发下载，但是如果是蓝光的10g的电影，如果并发下载的话，详看其中的一个都要等很久，所以，小文件开并发，大文件不开并发。

37.4.6、MR输出数据的压缩

属性：mapreduce.map.output.compress、mapreduce.output.fileoutputformat.compress
解释：对于大集群而言，建议设置Map-Reduce的输出为压缩的数据，而对于小集群，则不需要。
20台一下的集群，几乎是不需要开的，但是很多小企业都开，用snappy压缩，这个不是官方自带的，需要自己集成一个开发工具包，snappy的压缩比是25%到40%，也就是说原来的文件大小乘25%或者40%是被压缩掉了

37.4.7、优化Mapper和Reducer的个数

属性：
mapreduce.tasktracker.map.tasks.maximum
mapreduce.tasktracker.reduce.tasks.maximum
解释：以上两个属性分别为一个单独的Job任务可以同时运行的Map和Reduce的数量。
设置上面两个参数时，需要考虑CPU核数、磁盘和内存容量。假设一个8核的CPU，业务内容非常消耗CPU，那么可以设置map数量为4，如果该业务不是特别消耗CPU类型的，那么可以设置map数量为40，reduce数量为20。这些参数的值修改完成之后，一定要观察是否有较长等待的任务，如果有的话，可以减少数量以加快任务执行，如果设置一个很大的值，会引起大量的上下文切换，以及内存与磁盘之间的数据交换，这里没有标准的配置数值，需要根据业务和硬件配置以及经验来做出选择。

在同一时刻，不要同时运行太多的MapReduce，这样会消耗过多的内存，任务会执行的非常缓慢，我们需要根据CPU核数，内存容量设置一个MR任务并发的最大值，使固定数据量的任务完全加载到内存中，避免频繁的内存和磁盘数据交换，从而降低磁盘IO，提高性能。
大概配比：

大概估算公式：
map = 2 + ⅔cpu_core
reduce = 2 + ⅓cpu_core

37.5、HBase优化

37.5.1、在HDFS的文件中追加内容

文件已经写在HDFS上面之后，能不能在不增加文件的基础上，直接在此文件的后面追加内容？
不是不允许追加内容么？没错，请看背景故事：

早期的HDFS系统是不支持添加操作的，如果文件一旦被关闭了，就认为这个文件已经上传完成了，不能再改变了，如果文件没有被成功的关闭，这个文件就像从来没有存在过一样，写过的数据还在，没写的数据就没有了，就认为这是一个坏的块，就扔掉了，
第一次支持HDFS追加操作是在0.15版本。

HDFS不支持随机添加，只支持从末尾添加

这个追加的功能对HBase有什么好处？
HBase需要频繁的对数据进行写入操作，如果每次写入都生成一个新的文件的话，必定会加大开销，所以这个功能完美的解决了这个问题。

属性：dfs.support.append
文件：hdfs-site.xml、hbase-site.xml
解释：开启HDFS追加同步，可以优秀的配合HBase的数据同步和持久化。默认值为true。

37.5.2、优化DataNode允许的最大文件打开数

属性：dfs.datanode.max.transfer.threads
文件：hdfs-site.xml
解释：HBase一般都会同一时间操作大量的文件，根据集群的数量和规模以及数据动作，设置为4096或者更高。默认值：4096

注意这里设置的是一个DataNode允许打开的最大文件数，之前设置的是linux允许允许打开的最大文件数，为什么linux的设置的很大，这里只能设置很小？因为在linux中不是一个DataNode。

37.5.3、优化延迟高的数据操作的等待时间

属性：dfs.image.transfer.timeout
文件：hdfs-site.xml
解释：如果对于某一次数据操作来讲，延迟非常高，socket需要等待更长的时间，建议把该值设置为更大的值（默认60000毫秒），以确保socket不会被timeout掉。

jvm在进行gc操作的时候RegionServer是不可用的，虽然只有几毫秒，但是假设现在RegionServer中有一个非常非常大的region，垃圾回收一次需要大量的时间，比如是五秒，也就意味着RegoinServer五秒钟之内没办法工作，只能等待gc完成，RegionServer在不能工作的状态下，是不能和zookeeper相互通信的，HMaster去zookeeper中找RegionServer，找不到，认为RegionServer死掉了，可是RegionServer明明还是可用的。

还有当前的region要分配给另外一个RegoinServer管理的时候，也会涉及到数据的传输，如果太的的话也会相应超时，也会没有挂掉，但是被认为挂掉了。

所以把上面配置的时间调的大一点

37.5.4、优化数据的写入效率

属性：
mapreduce.map.output.compress
mapreduce.map.output.compress.codec
文件：mapred-site.xml
解释：开启这两个数据可以大大提高文件的写入效率，减少写入时间。第一个属性值修改为true，第二个属性值修改为：org.apache.hadoop.io.compress.GzipCodec

mapreduce.map.output.compress，map这个过程输出的文件进行压缩，压缩完之后再给reduce，传输的效率会很高，往磁盘里面写的速度也会提高

mapreduce.map.output.compress.codec ，通过gzip的的方式压缩map输出的文件

37.5.5、优化DataNode存储

属性：dfs.datanode.failed.volumes.tolerated
文件：hdfs-site.xml
解释：默认为0，意思是当DataNode中有一个磁盘出现故障，则会认为该DataNode shutdown了。如果修改为1，则一个磁盘出现故障时，数据会被复制到其他正常的DataNode上，当前的DataNode继续工作。

假如DataNode中有三个数据块，如果当前客户端访问某个数据块的时候，数据块坏了，当时DataNode没有坏，就会认为DataNode挂了。

如果设置为1的话，就是当前的数据块挂掉就挂掉了，将挂掉的数据块中的数据复制到当前的DataNode的其他的数据块中，然后继续使用。

37.5.6、设置RPC监听数量

属性：hbase.regionserver.handler.count
文件：hbase-site.xml
解释：默认值为30，用于指定RPC监听的数量，可以根据客户端的请求数进行调整，读写请求较多时，增加此值。

如果单位时间内调用频发的话，可以改的高一点，但是不要太高，否则可能出现问题，比如急群众可能会出现日志文件的错误、数据文件的错误等错误，出现错误之后会自己大量的重试，大量的数据迁移，就会导致rpc的值上升，然后rpc又设置的特别高，就会导致一直到达不了阈值，性能容易被拖死。

37.5.7、优化HStore文件大小

属性：hbase.hregion.max.filesize
文件：hbase-site.xml
解释：默认值10737418240（10GB），如果需要运行HBase的MR任务，可以减小此值，因为一个region对应一个map任务，如果单个region过大，会导致map任务执行时间过长。该值的意思就是，如果HFile的大小达到这个数值，则这个region会被切分为两个Hfile。

就是store file，store file里面有Hfile，官网的描述是，如果Hfile如果到达10g的话就会分成两个，优化的方法是减小map任务的延迟，减小map任务的压力，一个region对应一个map任务，如果region10g的话，map任务处理的数据相当的打，需要减小值，比如1g。
不要把Hfile的分别和region的分裂搞混。一个RegionServer包含多个region，一个region包含多个Hfile。

37.5.8、优化hbase客户端缓存

属性：hbase.client.write.buffer
文件：hbase-site.xml
解释：用于指定HBase客户端缓存，增大该值可以减少RPC调用次数，但是会消耗更多内存，反之则反之。一般我们需要设定一定的缓存大小，以达到减少RPC次数的目的。默认2g，根据实际情况修改

客户端访问HBase的时候，第一次产生了一些数据流，然后缓存到客户端里，下次再访问的时候，直接就返回了。

37.5.9、指定scan.next扫描HBase所获取的行数

属性：hbase.client.scanner.caching
文件：hbase-site.xml
解释：用于指定scan.next方法获取的默认行数，值越大，消耗内存越大。

扫描表的时候默认返回的行数，可能当前的表中有十几亿行，只返回默认的100多行，建议不要设置太大，容易消耗过多的内存，卡死。

37.6、内存优化

HBase操作过程中需要大量的内存开销，毕竟Table是可以缓存在内存中的，一般会分配整个可用内存的70%给HBase的Java堆。 但是不建议分配非常大的堆内存，因为GC过程持续太久会导致RegionServer处于长期不可用状态，一般16~48G内存就可以了，如果因为框架占用内存过高导致系统内存不足，框架一样会被系统服务拖死。

37.7、JVM优化

涉及文件：hbase-env.sh

37.7.1、并行GC

参数：-XX:+UseParallelGC
解释：开启并行GC

37.7.2、同时处理垃圾回收的线程数

参数：-XX:ParallelGCThreads=cpu_core – 1
解释：该属性设置了同时处理垃圾回收的线程数。一般是cpu的核数减一

37.7.3、禁用手动GC

参数：-XX:DisableExplicitGC
解释：防止开发人员手动调用GC，GC会造成RegionServer短暂的不可用，不要开发人员去调度gc，HBase有自己的方式

37.8、Zookeeper优化

37.8.1、优化Zookeeper会话超时时间

参数：zookeeper.session.timeout
文件：hbase-site.xml
解释：In hbase-site.xml, set zookeeper.session.timeout to 30 seconds or less to bound failure detection (20-30 seconds is a good start).该值会直接关系到master发现服务器宕机的最大周期，默认值为30秒，如果该值过小，会在HBase在写入大量数据发生而GC时，导致RegionServer短暂的不可用，从而没有向ZK发送心跳包，最终导致认为从节点shutdown。一般20台左右的集群需要配置5台zookeeper。
RegionServer在被回收的时候会有短暂的不可用，无法向zookeeper报告自己的状态，如果在一个时间周期内，RegionServer一直没有汇报自己的状态，HMaster就认为它已经挂掉了，这个RegionServer以后再也没有权利处理region了，这个时候需要把zookeeper这个延迟调高一点。

你可能感兴趣的:(Big,Data,Cloud,Technology❤️,#,Big,Data,------,HBase)

php中的hmac,JavaScript通过CryptoJS等效实现php中hash_hmac函数加密raw_output配置好想不取名 php中的hmac
在一个项目中，客户需要从前端签名，加密插件使用的cryptoJS，使用与后端一样的签名流程(HmacSHA1后Base64.encode)发现并不能通过签名认证，签名校验方后端php代码中使用hash_hmac函数，先来看一下则会个函数的官网说明：说明hash_hmac(string$algo,string$data,string$key[,bool$raw_output=FALSE]):stri
第八次作业
一、备份与恢复作业：创库,建表：CREATEDATABASEbooksDB;usebooksDB;CREATETABLEbooks(bk_idINTNOTNULLPRIMARYKEY,bk_titleVARCHAR(50)NOTNULL,copyrightYEARNOTNULL);CREATETABLEauthors(auth_idINTNOTNULLPRIMARYKEY,auth_nameVAR
spring--事务失效原因你我约定有三数据库 sql java 后端 spring
✅一、事务失效的常见原因及对应场景1.方法不是public的✅原因：SpringAOP默认使用基于代理的方式（JDK或CGLIB），只能拦截public方法。❌错误示例：@TransactionalvoidsaveData(){//非public，事务无效...}✅正确写法：@TransactionalpublicvoidsaveData(){...}2.同类中方法调用，导致自调用（SelfInv
python读写mysql cavin_2017 Python 学习
目前用到的连接数据库，主要实现连个功能：1.根据sql查询2.将dataframe数据通过pandas包写入mysql数据库中1.根据sql查询：通常我们通过sql查询mysql中的表，分三步1.连接数据库2.数据查询3.关闭连接，如果需要查询的步骤较多，将查询封装成函数，通过参数传递sql代码会省事很多。##定义连接数据库函数defmy_db(host,user,passwd,db,sql,po
Uniapp 微信小程序，实现页面滚动Tab悬停吸顶，点击tab内容跟随滚动
Uniapp微信小程序，实现页面滚动Tab悬停吸顶，点击tab内容跟随滚动页面股东tab悬停原理：运用uniapp原生提供方法uni.createSelectorQuery()获取滚动对应节点的信息，即节点距离页面顶部的距离，再通过uniapp原生监听页面滚动事件onPageScroll，获取页面内容滚动的高度，二者相加即定位到对应节点的滚动距离。1.页面template结构data(){retu
Spring MVC、Spring Boot 和 Spring Cloud简要介绍及区别箬敏伊儿 java spring boot spring spring cloud
SpringMVC、SpringBoot和SpringCloud是Spring生态系统中的三个重要组件，它们在不同层面上帮助开发者构建和管理应用程序。以下是对它们的介绍及其区别：SpringMVC介绍SpringMVC（Model-View-Controller）是一个基于Java的Web框架，用于构建Web应用程序和RESTful服务。它提供了一组组件和注解，简化了Web应用程序的开发，尤其是与
BSCAN 在糖尿病患者数据聚类分析中的应用 wh_xia_jun AI+医疗机器学习支持向量机人工智能
完整代码：importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportDBSCANfromsklearn.preprocessingimportStandardScalerfromsklearn.datasetsimportmake_blobs#设置随机种子，确保结果可复现np.random.seed(42)#1.生成模拟
Eureka 和 Nacos 简单程序猿 eureka 云原生
一、基本介绍EurekaEureka是Netflix公司开发的一款基于REST风格的服务注册与发现组件，专为分布式系统设计。它遵循AP原则（可用性、分区容错性优先），强调在网络分区等异常情况下的服务可用性，是SpringCloudNetflix生态中的核心组件之一。NacosNacos（DynamicNamingandConfigurationService）是阿里巴巴开源的一站式服务发现、配置管
vue怎么在style中使用data中定义的变量界面架构师 vue vue
需求动态修改三方组件的样式。思路项目开发中使用的某某某三方ui组件，所以想要修改这个组件的样式只能通过css进行修改，那么想要动态修改，就要在style中使用data里的变量。实现...mounted(){this.$el.style.setProperty('--colorStyle',this.color)}//若该变量是动态变化的watch:{color(val,oldVal){this.$
JWT 翻译 lsswear 学习
jwt官网：JSONWebTokenIntroduction-jwt.iohttps://jwt.io/introduction标准RFC7519：https://datatracker.ietf.org/doc/html/rfc7519#section-4.1https://datatracker.ietf.org/doc/html/rfc7519#section-4.1JWT定义JWT全称JS
vue如何使用websocket
//websocket连接letwebSocketPort=url+'/ws/socket'constdataList=ref([]);//用于展示从WebSocket获取的消息letws=null;//WebSocket实例letreconnectTimeout=null;//重连超时控制//建立WebSocket连接constconnectWebSocket=()=>{ws=newWebSoc
【Conda】conda config 查看当前源&恢复默认源&更换其他源 F_D_Z conda conda config
目录查看当前源恢复默认源更换其他源查看当前源showsource命令查看当前源情况condaconfig--show-sources恢复默认源通过remove命令恢复默认源condaconfig--remove-keychannels再次使用showsource命令查看当前源情况更换其他源清华源https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/
Mysql编译 Neng_Miao mysql adb 数据库
Mysql编译1、编译环境硬件环境：香橙派5aarch64架构软件环境：Ubuntu22.04.3LTS编译版本：mysql-5.7.43.tar.gz编译目录：/data/make_test/mysql_for_make/mysql-5.7.43#根据需要调整，本次测试使用2、编译操作（1）、获取源码包wgethttps://dev.mysql.com/get/Downloads/MySQL-5
[go] binary.Write 小坑一个兼论go的错误处理哲学勤奋happyfire
有如下go代码：const(foo=123)buffer:=new(bytes.Buffer)binary.Write(buffer,binary.BigEndian,foo)fmt.Println(buffer.Len())输出结果是0，foo没有写入到buffer中。原因在于，binary包的Write内部调用了intDataSize函数获取foo的长度：funcintDataSize(dat
使用C#对象将WinRiver项目文件进行复杂的XML序列化和反序列化实例详解中游鱼 C#序列化和反序列化 MMT c#xml 序列化和反序列化属性的序列化和反序列化完整序列化 ADCP和WinRiver
使用C#对象将WinRiver项目文件进行XML序列化和反序列化的实例详解一、序列化和反序列化的目的二、WinRiver的项目MMT文件架构示例三、以WinRiver为对象进行C#代码编程3.1声明WinRiver对象3.2声明Project对象3.3声明Site_Information对象3.4声明Site_Discharge对象3.5声明QA_QC、Collect_Data、DisplaySe
apache ignite系列（二）：配置 weixin_30521161
ignite有两种配置方式，一种是基于XML文件的配置，一种是基于JAVA代码的配置：这里将ignite常用的配置集中罗列出来了，一般建议使用xml配置。1，基于XML的配置-->org.cord.*-->java.lang.Longcom.palic.demo.data.domain.CommRate-->-->-->-->-->-->-->-->-->-->-->127.0.0.1:48500
nodejs、nvm、npm的使用
1.nvm的下载进入nvmgithub地址，下载最新版本：Releases·coreybutler/nvm-windows·GitHub2.傻瓜式安装。安装完成后，路径到C盘，安装路径有两个。NVM_SYMLINK：C:\ProgramFiles\nodejsNVM_HOME：C:\Users\Administrator\AppData\Roaming\nvm3.nvm使用命令查看nodejs安装
RISC-V基金会Datacenter SIG月会圆满举办，探讨RAS、PMU性能分析实践和经验 OpenAnolis小助手 risc-v Datacenter SIG 龙蜥社区RISC-V SIG 龙蜥社区开源
一直以来，龙蜥社区在RISC-V生态建设中持续投入，并积极贡献上游社区。多位龙蜥社区成员在RISC-V国际基金会担任主席/副主席角色，与来自阿里云、阿里达摩院、中兴通讯、浪潮信息、中科院软件所、字节跳动、Google、MIT、Akeana等企业的专家共同推动基金会DatacenterSIG的运作及相关标准的制定。（图/DatacenterSIG6月月会分享）近日，RISC-V基金会Datacent
开源短链接工具 Sink 无需服务器轻松部署到 Workers / Pages
本文首发于只抄博客，欢迎点击原文链接了解更多内容。前言Sink是一款开源免费的短链接生成工具，支持自定义短链接Slug以及设置到期时间，并且还可以借助Cloudflare的AnalyticsEngine功能分析短链接的统计数据。最重要的是实现以上这些功能并不需要有自己的服务器，Sink可以100%运行在Cloudflare上，主程序部署在CF的Workers或者Pages上，数据库存储在CF的KV
【Linux系列】rsync和mv 檀越@新空间 s5 Linux学习 linux 服务器 java
博客目录1.操作性质不同2.对源文件的影响3.使用场景4.示例对比使用`rsync-a`：使用`mv`：5.注意事项总结rsync-a/data/software/build0713/dist//usr/share/nginx/html/和mv是两种完全不同的操作，主要区别如下：1.操作性质不同rsync-a复制同步：将源目录（/data/software/build0713/dist/）的内容递
Android Room使用方法与底层原理详解你过来啊你 android room
Room是一个强大的SQLite对象映射库，旨在提供更健壮、更简洁、更符合现代开发模式的数据库访问方式。核心价值：消除大量样板代码，提供编译时SQL验证，强制结构化数据访问，并流畅集成LiveData、Flow和RxJava以实现响应式UI。一、使用流程(Step-by-StepWorkflow)Room的使用遵循一个清晰的结构化流程：添加依赖：//build.gradle(Module)depe
AWS架构师咸鱼一条_o.0?! aws 云计算
AWS架构师部分定义S3（S3存储桶）EC2弹性计算云EBS弹性块存储SNAPSHOT快照AMI：EC2镜像ELB弹性负载均衡器EFSDATABASEDATAWAREHOUSEOLTPOLAPElastiCacheVPCRoute53部分定义UserGroup:用户组下的用户继承该用户组所有权限Policy：Jasonformat：类似文字描述，指定object的类型。给user和group提供权
Redis——BigKey A2274 Java 面试 #Redis redis java BigKey
BigKey1多大算BigKey？阿里云Redis开发规范：string类型的数据控制在10KB以内，hash,list,set,zset元素数量不要超过5000。非字符串的BigKey，不要使用del删除，而是使用hsacn,sscan,zscan方式渐进式删除。同时，要防止BigKey过期时自动删除，因为自动删除会使用del指令。2.BigKey有什么危害？如果没有配置Redis非阻塞删除，则
时序数据库主流产品概览时序数据说时序数据库数据库物联网 iotdb 大数据
时序数据库(TimeSeriesDatabase,TSDB)是专为处理时间序列数据优化的数据库系统，近年来随着物联网(IoT)、金融科技、工业互联网等领域的快速发展而备受关注。本文将介绍当前主流的时序数据库产品。一、时序数据库概述时序数据是带时间戳记录的数据点序列，具有以下特点：数据时间属性强数据通常为追加写入近期数据访问频率高于历史数据数据量通常非常庞大，需要高效的压缩技术时序数据库针对这些特点
数据仓库和数据库的区别神秘打工猴数据仓库数据库
一，数据仓库数据仓库（DataWarehouse）是一种专门设计用于报告和分析的数据库系统，它允许将来自一个或多个数据源的数据集成、存储和分析。数据仓库的主要目的是支持决策制定，通过提供快速访问历史数据和进行复杂查询的能力。以下是数据仓库的一些关键特性和概念：1.主题导向：数据仓库围绕特定的业务主题构建，如销售、客户或财务，而不是围绕应用程序的功能。2.集成性：数据仓库集成了来自不同源系统的数据，
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
什么是arm-arm体系架构版本(指令集版本)-arm内核版本众里寻佳千百度1995 嵌入式-linux
1、什么是arm？arm公司：是英国一家电子公司的名字，该公司成立于1990年11月，是苹果电脑，Acorn电脑集团和VLSITechnology的合资企业。Acorn曾在1985年推出世界上首个商用单芯片RISC（ReducedInstructionSetComputing）处理器。ARM主要出售芯片设计技术的授权。ARM处理器：英国Acorn有限公司设计的低功耗成本的第一款RISC微处理器。全
前端Vue自定义顶部搜索框热门搜索历史搜索用于搜索跳转使用前端组件分享
前端Vue自定义顶部搜索框热门搜索历史搜索用于搜索跳转使用，下载完整代码请访问uni-app插件市场地址：https://ext.dcloud.net.cn/plugin?id=13128效果图如下：####自定义顶部搜索框用于搜索跳转使用方法```使用方法```####HTML代码实现部分```htmlimportCCBProjectListfrom'../../components/CCPro
CICS Application Programming Fundamentals 第8-7章沉迷学习w 主机开发学习笔记 zos cics
8.TheSign-onProcess-7.RegisteredUsersFile***************************************TopofData**********************************00000105Registered-User-Idpicx(08).00000205Registered-Passwordpicx(08).000003
Python关于pandas的基础知识 WeiJingYu. python pandas 开发语言
一.扫盲（一）、pandas是什么pandas是Python的一个第三方数据处理库，它提供了高效、灵活的数据结构（如Series和DataFrame），能方便地对结构化数据进行清洗、转换、分析和处理。（二）、pandas与NumPy的关系NumPy是Python中用于科学计算的基础库，主要用于存储和处理数值型数组。但它有一个局限，就是不能直接存储和处理字符串等非数值类型的数据。而pandas是在N
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str