搬金砖的小白

【Hadoop】Hadoop3基础

文章整理自尚硅谷B站视频：https://www.bilibili.com/video/BV1Qp4y1n7EN?t=7&p=39

文章目录

〇、要点
一、概念
- 1.1 Hadoop是什么
- 1.2 Hadoop发展历史
- 1.3 Hadoop的三大发行版本
- 1.4 Hadoop的优势
- 1.5 Hadoop的组成
- - 1.5.1 HDFS架构概述
  - 1.5.2 Yarn架构概述
  - 1.5.3 MapReduce架构概述
  - 1.5.4 HDFS、Yarn、MapReduce三者的关系
- 1.6 大数据技术生态体系
- 1.7 推荐系统案例
二、环境准备
- 2.1 模板虚拟机准备
- - 2.1.1 硬件
  - 2.1.2 操作系统
  - 2.1.3 IP和主机名
  - - 2.1.3.1 虚拟机VMnet8
    - 2.1.3.2 Win10主机VMnet8
    - 2.1.3.3 Linux配置
- 2.2 克隆
- 2.3 安装JDK
- 2.4 安装Hadoop
三、Hadoop生产集群搭建
- 3.1 本地模式
- 3.2 完全分布式集群
- - 3.2.1 编写集群分发脚本xsync
  - - 3.2.1.1 scp 安全拷贝：
    - 3.2.1.2 rsync 远程同步
    - 3.2.1.3 xsync 集群分发脚本（放在了```~/bin```目录下）
  - 3.2.2 SSH免密登录
  - 3.2.3 集群配置
  - - 3.2.3.1 配置位置：
    - 3.2.3.2 配置核心文件
  - 3.2.4 启动集群并测试
  - 3.2.5 配置历史服务器
  - 3.2.6 配置日志的聚集
  - 3.2.7 各个服务组件的逐一启动和停止
  - 3.2.8 编写Hadoop集群常用脚本
  - - 3.2.8.1 Hadoop集群启停脚本（包括HDFS、YARN、HistoryServer）：myhadoop.sh
    - 3.2.8.2 查看三台服务器的Java进程脚本：jpsall
  - 3.2.9 常用端口号
  - 3.2.10 常用配置文件
  - 3.2.11 集群时间同步
四、错误和解决方案

〇、要点

1.5.1 HDFS 架构概述
1.5.2 YARN 架构概述
1.5.3 MapReduce 架构概述
2.1.1 Linux 模板虚拟机硬件配置
2.1.2 Linux 模板虚拟机操作系统配置
2.1.3.1 VMware 虚拟机IP配置
2.1.3.2 Win10 VMnet8 IP配置
2.1.3.3 Linux 修改IP
2.1.3.3 Linux 修改主机名称
2.1.3.3 Linux 修改主机名称映射
2.1.3.3 Linux 创建新用户并修改权限
2.3 Linux JDK 安装
2.4 Hadoop 安装
3.2 Hadoop 完全分布式集群搭建
3.2.1.1 Linux scp 安全拷贝
3.2.1.2 Linux rsync 远程同步
3.2.1.3 集群分发脚本
3.2.2 Linux SSH免密登录
3.2.3.1 Hadoop 集群配置的位置
3.2.3.2 Hadoop 核心文件的配置
3.2.3.2 Hadoop 指定NameNode的地址
3.2.3.2 Hadoop 指定hadoop数据测存放目录
3.2.3.2 Hadoop 配置HDFS网页登录使用的静态用户
3.2.3.2 Hadoop NameNode web端访问地址
3.2.3.2 Hadoop SecondaryNameNode web端访问地址
3.2.3.2 Hadoop 指定ResourceManager的地址
3.2.4 浏览器访问HDFS界面
3.2.4 Hadoop 集群崩溃的处理办法
3.2.5 Hadoop 历史服务器的配置
3.2.5 Hadoop 指定历史服务器端地址
3.2.5 Hadoop 指定历史服务器web端地址
3.2.6 Hadoop 配置日志的聚集
3.2.6 Hadoop 开启日志聚集工鞥呢
3.2.6 Hadoop 设置日志聚集服务器地址
3.2.6 Hadoop 设置日志保留的时间
3.2.7 Hadoop 各个组件的分别启动和停止
3.2.8 Hadoop 集群常用脚本
3.2.9 Hadoop 常用端口号
3.2.10 Hadoop 常用配置文件
问题1：错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster
问题2：Win10 IP映射失败

一、概念

1.1 Hadoop是什么

hadoop是Apache的分布式系统基础架构，主要解决海量数据的存储和分析计算的问题

1.2 Hadoop发展历史

1.3 Hadoop的三大发行版本

1.4 Hadoop的优势

高可靠性：Hadoop底层维护多个数据版本，即使Hadoop某个计算元素或存储出现故障，也不会导致数据的的丢失
高扩展性：在集群间分配任务数据，可方便地扩展数以千计的节点（动态增加，动弹删除）
高效性：在MapReduce思想下，Hadoop是并行工作的，以加快任务处理速度
高容错性：能够自动将失败的任务重新分配

1.5 Hadoop的组成

Hadoop1.x：Common（辅助工具）、HDFS（数据存储）、MapReduce（计算+资源调度）
Hadoop2.x：Common、HDFS、MapReduce（计算）、Yarn（资源调度）
Hadoop3.x：（在组成上没有变化）

1.5.1 HDFS架构概述

Hadoop Distributed File System，Hadoop分布式文件系统

NameNode（nn）：记录每一个文件块存储的位置。存储文件的元数据（文件名、目录结构、属性）和每个文件的块列表和块所在的DataNode等
DataNode（dn）：具体存储数据（每个服务器都是一个DataNode）。在本地文件系统存储块数据，以及块数据的校验和
SecondaryNameNode（2nn）：辅助NameNode工作。每隔一段时间对NameNode元数据备份

1.5.2 Yarn架构概述

Yet Another Resource Negotiator，Hadoop的资源管理器

ResourceManager（RM）：管理整个集群资源（内存、CPU等）
NodeManager（NM）：管理单个节点的资源
ApplicationMaster（AM）：管理单个任务运行的资源
Container：容器，相当于一台独立的服务器，里面封装了任务运行所需要的资源（内存、CPU、磁盘、网络等）

客户端可以有多个；集群上可以运行多个ApplicationMaster；每个NodeManager上可以有多个Container

1.5.3 MapReduce架构概述

Map：并行处理输入的数据
Reduce：对Map结果进行汇总

1.5.4 HDFS、Yarn、MapReduce三者的关系

1.6 大数据技术生态体系

1.7 推荐系统案例

二、环境准备

2.1 模板虚拟机准备

2.1.1 硬件

自定义安装
Linux CentOS 7
50G硬盘

2.1.2 操作系统

设置时区
最小化安装（选择前三个附加选项）
安装位置：
- /boot：1G（文件系统改为ext4）
- swap：4G
- /：45G
KDUMP：取消
root密码：123456（方便）

2.1.3 IP和主机名

2.1.3.1 虚拟机VMnet8

子网IP：192.168.2.0
NAT网关IP：192.168.2.1

2.1.3.2 Win10主机VMnet8

IP地址：192.168.2.3
子网掩码：255.255.255.0

2.1.3.3 Linux配置

修改IP
- https://blog.csdn.net/Tiezhu_Wang/article/details/116109056
修改主机名称
- vim /etc/hostname
- 改为node100
修改主机名称映射
- vim /etc/hosts
- 增加：
  
  192.168.2.100 node100
  
  192.168.2.101 node101
  
  192.168.2.102 node102
  
  192.168.2.103 node103
  
  …
重启
- reboot
- ifconfig或ip addr查看IP
- hostname查看主机名
安装软件
- yum install -y epel-release
- yum install -y net-tools
- yum install -y vim
防火墙关闭
- systemctl stop firewalld
- systemctl disable firewalld.service
创建新用户并修改权限
- useradd hadoop
- passwd hadoop然后设置密码
- vim /etc/sudoers
- %wheel后增加：
  - hadoop ALL=(ALL) NOPASSWD:ALL
重启并使用hadoop用户登录后：

2.2 克隆

创建完整克隆
修改IP
修改主机名称

2.3 安装JDK

（这里在node102安装）

解压：sudo tar -zxvf jdk-8u271-linux-x64.tar.gz -C /opt/module
修改环境变量
- 增加.sh文件：sudo vim /etc/profile.d/my_env.sh
```
 #JAVA_HOME
 export JAVA_HOME=/opt/module/jdk1.8.0_271
 export PATH=$PATH:$JAVA_HOME/bin
```
- source /etc/profile使配置生效
- java -version查看java版本

2.4 安装Hadoop

（这里在node102安装）

解压：sudo tar -zxvf hadoop-3.2.1.tar.gz -C /opt/module/

修改环境变量

sudo vim /etc/profile.d/my_env.sh

 #HADOOP_HOME
 export HADOOP_HOME=/opt/module/hadoop-3.2.1
 export PATH=$PATH:$HADOOP_HOME/bin
 export PATH=$PATH:$HADOOP_HOME/sbin

source /etc/profile使配置生效
hadoop version查看hadoop版本

三、Hadoop生产集群搭建

存储模式
- 本地：数据存储在Linux本地
- 伪分布式：数据存储在HDFS
- 完全分布式：数据存储在HDFS，多台服务器工作

3.1 本地模式

新建文件vim /opt/module/hadoop-3.2.1/wcinput/word.txt，写入内容：
```
hadoop
flink
kafka
flink
flume
spark
hadoop
hadoop
```
运行官方示例hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount wcinput/ ./wcoutput
查看输出：

3.2 完全分布式集群

3.2.1 编写集群分发脚本xsync

3.2.1.1 scp 安全拷贝：

scp	-r	$p d i r /$ fname	$u s e r @$ host: $p d i r /$ fname
命令	递归	要拷贝的文件路径/名称	目的地用户@主机:目的地路径/名称

推：[hadoop@node102 module]$ scp -r jdk1.8.0_271/ hadoop@node103:/opt/module/
拉：[hadoop@node103 opt]$ scp -r hadoop@node102:/opt/module/hadoop-3.2.1 ./module/
转：[hadoop@node103 opt]$ scp -r hadoop@node102:/opt/module/* hadoop@node104:/opt/module/

3.2.1.2 rsync 远程同步

rsync	-av	$p d i r /$ fname	$u s e r @$ host: $p d i r /$ fname
命令	归档拷贝/显示赋值过程	要拷贝的文件路径/名称	目的地用户@主机:目的地路径/名称

同步：[hadoop@node102 ~]$ rsync -av /opt/module/hadoop-3.2.1/ hadoop@node103:/opt/module/hadoop-3.2.1/

3.2.1.3 xsync 集群分发脚本（放在了`~/bin`目录下）

#!/bin/bash

#1.判断参数个数
if [ $# -lt 1 ]
then 
        echo Not Enough Argument!
        exit;
fi

#2.遍历集群所有机器
for host in node100 node102 node103
do
        echo ==== $host ====
        #3.遍历所有目录，进行发送
        for file in $@
        do
                #4.判断文件是否存在
                if [ -e $file ]
                        then
                                #5.获取父目录
                                pdir=$(cd -P $(dirname $file) ; pwd)
                                #6.获取当前目录的名称
                                fname=$(basename $file)
                                ssh $host "mkdir -p $pdir"
                                rsync -av $pdir/$fname $host:$pdir
                        else
                                echo $file does not exists!
                fi
        done
done

写完后直接执行（同步bin目录）：xsync bin/
（同步环境变量，需要sudo）：sudo ~/bin/xsync /etc/profile.d/my_env.sh

切换到node103，同步成功：

同步后记得source：

3.2.2 SSH免密登录

https://blog.csdn.net/Tiezhu_Wang/article/details/113771406
或者（在node102中）：
- 使用ls -al查看隐藏文件（无需此步）
- ssh-keygen -t rsa生成秘钥
- ssh-copy-id node103复制node102的id到node103
完成后即可在node102中免密访问node103，在node103中同样执行此步，即可免密访问node102，同步时也无需输入密码。（node100同理）

3.2.3 集群配置

3.2.3.1 配置位置：

	node102	node103	node100
HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

3.2.3.2 配置核心文件

路径：/opt/module/hadoop-3.2.1/etc/hadoop

core-site.xml

<configuration>
        
        <property>
                <name>fs.defaultFSname>
                <value>hdfs://node102:8020value>
        property>
        
        <property>
                <name>hadoop.tmp.dirname>
                <value>/opt/module/hadoop-3.2.1/datavalue>
        property>
    	
    	<property>
    			<name>hadoop.http.staticuser.username>
            	<value>hadoopvalue>
    	property>
configuration>

hdfs-site.xml

<configuration>
        
        <property>
                <name>dfs.namenode.http-addressname>
                <value>node102:9870value>
        property>
        
        <property>
                <name>dfs.namenode.secondary.http-addressname>
                <value>node100:9868value>
        property>
configuration>

yarn-site.xml

<configuration>
        
        <property>
                <name>yarn.nodemanager.aux-servicesname>
                <value>mapreduce_shufflevalue>
        property>
        
        <property>
                <name>yarn.resourcemanager.hostnamename>
                <value>node103value>
        property>
configuration>

mapre-site.xml

<configuration>
        
        <property>
                <name>mapreduce.framework.namename>
                <value>yarnvalue>
        property>
configuration>

配置后分发

[hadoop@node102 etc]$ xsync /opt/module/hadoop-3.2.1/etc/hadoop/

3.2.4 启动集群并测试

配置workers：vim /opt/module/hadoop-3.2.1/etc/hadoop/workers
```
node102
node103
node100
```
配置后分发：xsync workers
启动集群
- 初始化（第一次启动）：hdfs namenode -format
- 启动集群：start-dfs.sh（需要配好环境变量）
  - node102:
  - node103:
  - node100:
- 浏览器访问192.168.2.102:9870（需要关闭节点的防火墙，hostname访问无效就试试IP访问）
启动Yarn：（在 ResoureManager 运行的机器上启动，这里是node103）start-yarn.sh
- 启动后node103运行了ResourceManager，其他节点运行NodeManager
- 访问192.168.2.103:8088

基本测试

[hadoop@node102 ~]$ hdfs dfs -mkdir /wcinput
[hadoop@node102 ~]$ hdfs dfs -ls /
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2021-04-26 21:18 /wcinput
[hadoop@node102 ~]$ hdfs dfs -put input/word.txt /wcinput
2021-04-26 21:20:47,395 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
[hadoop@node102 ~]$ hdfs dfs -cat /wcinput/*
2021-04-26 21:21:12,593 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
hadoop
spark
flink
hadoop
flink
hadoop
flume

集群崩溃的处理办法
- 关闭所有服务
- 删除每个集群的data和logs目录（删除历史数据）
- 格式化hdfs namenode -format
- 启动后即可正常使用

3.2.5 配置历史服务器

为了查看程序的历史运行情况

配置mapred-site.xml


<property>
	<name>mapreduce.jobhistory.addressname>
    <value>node102:10020value>
property>

<property>
	<name>mapreduce.jobhistory.webapp.addressname>
    <value>node102:19888value>
property>

配置完分发：xsync mapred-site.xml
启动hdfs（node102）、yarn（node103）后，启动历史服务器（node102）：
- mapred --daemon start historyserver

执行示例WC

 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount /wcinput /wcoutput

访问192.168.2.103:8088
- 可以在这个位置查看历史任务
- 点击history后跳转，可查看到历史任务详情

3.2.6 配置日志的聚集

应用运行完成之后，将程序运行日志信息上传到HDFS上

配置yarn-site.xml

 
 <property>
 	<name>yarn.log-aggregation-enablename>
     <value>truevalue>
 property>
 
 <property>
 	<name>yarn.log.server.urlname>
     <value>http://node102:19888/jobhistory/logsvalue>
 property>
 
 <property>
 	<name>yarn/log-aggregation.retain-secondsname>
     <value>604800value>
 property>

修改后分发
关闭historyserver：mapred --daemon stop historyserver
重启yarn：先stop再start
启动historyserver
重新运行一个任务，即可在node103:8088-history-logs查看到日志信息

日志信息：

3.2.7 各个服务组件的逐一启动和停止

HDFS组件

hdfs --daemon start(stop) namenode
hdfs --daemon start(stop) datanode
hdfs --daemon start(stop) secondarynamenode

YARN组件

yarn --daemon start(stop) resourcemanager
yarn --daemon start(stop) nodemanager

3.2.8 编写Hadoop集群常用脚本

3.2.8.1 Hadoop集群启停脚本（包括HDFS、YARN、HistoryServer）：myhadoop.sh

#!/bin/bash

if [ $# -lt 1 ]
then 
	echo "No Args Input..."
	exit;
fi

case $1 in
"start")
		echo "====== 启动Hadoop集群 ======"
		
		echo "------ 启动HDFS ------"
		ssh node102 "/opt/module/hadoop-3.2.1/sbin/start-dfs.sh"
		echo "------ 启动YARN ------"
		ssh node103 "/opt/module/hadoop-3.2.1/sbin/start-yarn.sh"
		echo "------ 启动HistoryServer ------"
		ssh node102 "/opt/module/hadoop-3.2.1/bin/mapred --daemon start historyserver"
;;
"stop")
		echo "====== 关闭Hadoop集群 ======"
		
		echo "------ 关闭HistoryServer ------"
		ssh node102 "/opt/module/hadoop-3.2.1/bin/mapred --daemon stop historyserver"
		echo "------ 关闭YARN ------"
		ssh node103 "/opt/module/hadoop-3.2.1/sbin/stop-yarn.sh"
		echo "------ 关闭HDFS ------"
		ssh node102 "/opt/module/hadoop-3.2.1/sbin/stop-dfs.sh"
;;
*)
	echo "Input Args Error..."
;;
esac

修改权限：chmod 777 myhadoop.sh
使用：

3.2.8.2 查看三台服务器的Java进程脚本：jpsall

#!/bin/bash

for host in node102 node103 node100
do
        echo ====== $host ======
        ssh $host jps
done

修改权限：chmod 777 jpsall
使用：

3.2.9 常用端口号

hadoop3.x

名称	端口
HDFS NameNode 内部通讯端口	8020/9000/9820
HDFS NameNode 对用户的查询端口	9870
YARN 查看任务运行情况的端口	8088
历史服务器	19888

hadoop2.x

名称	端口
HDFS NameNode 内部通讯端口	8020/9000
HDFS NameNode 对用户的查询端口	50070
YARN 查看任务运行情况的端口	8088
历史服务器	19888

3.2.10 常用配置文件

hadoop3.x
- core-site.xml
- hdfs-site.xml
- yarn-site.xml
- mapred-site.xml
- workers
hadoop2.x
- core-site.xml
- hdfs-site.xml
- yarn-site.xml
- mapred-site.xml
- slaves

3.2.11 集群时间同步

服务器能连接外网时，不需要时间同步

四、错误和解决方案

运行示例MR时，错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster

 [hadoop@node102 input]$ hadoop jar /opt/module/hadoop-3.2.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount /wcinput /wcoutput
 2021-04-27 10:05:19,761 INFO client.RMProxy: Connecting to ResourceManager at node103/192.168.2.103:8032
 2021-04-27 10:05:21,257 INFO mapreduce.JobResourceUploader: Disabling Erasure Coding for path: /tmp/hadoop-yarn/staging/hadoop/.staging/job_1619488633583_0003
 2021-04-27 10:05:21,388 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
 2021-04-27 10:05:22,103 INFO input.FileInputFormat: Total input files to process : 1
 2021-04-27 10:05:22,156 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
 2021-04-27 10:05:22,373 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
 2021-04-27 10:05:22,537 INFO mapreduce.JobSubmitter: number of splits:1
 2021-04-27 10:05:22,679 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false
 2021-04-27 10:05:22,789 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1619488633583_0003
 2021-04-27 10:05:22,789 INFO mapreduce.JobSubmitter: Executing with tokens: []
 2021-04-27 10:05:23,801 INFO conf.Configuration: resource-types.xml not found
 2021-04-27 10:05:23,801 INFO resource.ResourceUtils: Unable to find 'resource-types.xml'.
 2021-04-27 10:05:24,256 INFO impl.YarnClientImpl: Submitted application application_1619488633583_0003
 2021-04-27 10:05:25,482 INFO mapreduce.Job: The url to track the job: http://node103:8088/proxy/application_1619488633583_0003/
 2021-04-27 10:05:25,483 INFO mapreduce.Job: Running job: job_1619488633583_0003
 2021-04-27 10:05:48,327 INFO mapreduce.Job: Job job_1619488633583_0003 running in uber mode : false
 2021-04-27 10:05:48,328 INFO mapreduce.Job:  map 0% reduce 0%
 2021-04-27 10:05:51,838 INFO mapreduce.Job: Job job_1619488633583_0003 failed with state FAILED due to: Application application_1619488633583_0003 failed 2 times due to AM Container for appattempt_1619488633583_0003_000002 exited with  exitCode: 1
 Failing this attempt.Diagnostics: [2021-04-27 10:05:47.137]Exception from container-launch.
 Container id: container_1619488633583_0003_02_000001
 Exit code: 1
 
 [2021-04-27 10:05:47.189]Container exited with a non-zero exit code 1. Error file: prelaunch.err.
 Last 4096 bytes of prelaunch.err :
 Last 4096 bytes of stderr :
 错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster
 
 
 [2021-04-27 10:05:47.190]Container exited with a non-zero exit code 1. Error file: prelaunch.err.
 Last 4096 bytes of prelaunch.err :
 Last 4096 bytes of stderr :
 错误: 找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster
 
 
 For more detailed output, check the application tracking page: http://node103:8088/cluster/app/application_1619488633583_0003 Then click on links to logs of each attempt.
 . Failing the application.
 2021-04-27 10:06:26,946 INFO mapreduce.Job: Counters: 0

hadoop classpath

将输出的内容添加到yarn-site.xml中，name为yarn.application.classpath

 <property>
     <name>yarn.application.classpathname>
     <value>/opt/module/hadoop-3.2.1/etc/hadoop:/opt/module/hadoop-3.2.1/share/hadoop/common/lib/*:/opt/module/hadoop-3.2.1/share/hadoop/common/*:/opt/module/hadoop-3.2.1/share/hadoop/hdfs:/opt/module/hadoop-3.2.1/share/hadoop/hdfs/lib/*:/opt/module/hadoop-3.2.1/share/hadoop/hdfs/*:/opt/module/hadoop-3.2.1/share/hadoop/mapreduce/lib/*:/opt/module/hadoop-3.2.1/share/hadoop/mapreduce/*:/opt/module/hadoop-3.2.1/share/hadoop/yarn:/opt/module/hadoop-3.2.1/share/hadoop/yarn/lib/*:/opt/module/hadoop-3.2.1/share/hadoop/yarn/*value>
 property>

重启YARN，即可成功运行MR

Win10 IP映射失败
- 修改C:\Windows\System32\drivers\etc/hosts文件（管理员模式打开），增加如下内容：
```
192.168.2.100	node100
192.168.2.101	node101
192.168.2.102	node102
192.168.2.103	node103
192.168.2.104	node104
```

你可能感兴趣的:(Hadoop,hadoop,大数据)

为什么YashanDB数据库是大数据处理的理想选择？数据库
在当今大数据时代，如何高效管理和处理海量数据成为了许多企业的首要挑战。针对这一问题，选择合适的数据库系统至关重要。尤其是在大数据场景中，诸如数据存储、数据访问效率和并发控制等技术要求提高，给数据库的选择带来了更高的标准。YashanDB作为一款高性能数据库，以其独特的架构设计与一系列优秀的功能，成为大数据处理的理想选择。高度可扩展的部署架构YashanDB支持多种部署形态，包括单机部署、分布式集群
企业如何构建基于YashanDB的数据分析系统数据库
随着大数据时代的到来，企业面临的一个核心技术问题是如何有效、快速地进行数据分析以指导决策。一个重要的性能瓶颈在于数据库的查询速度和存储结构的设计。尤其在处理海量数据时，如何在保证数据查询性能的同时确保数据的准确性和完整性，这问题显得尤为重要。YashanDB作为一个高性能的数据库系统，通过其独特的体系架构和强大的数据存储及访问机制，为企业构建高效的数据分析系统提供了可靠的技术支持。YashanDB
AI+大数据：社交网络分析在金融风控中的完整流程 AI智能应用 AI大模型应用入门实战与进阶人工智能大数据 ai
AI+大数据：社交网络分析在金融风控中的完整流程关键词：AI、大数据、社交网络分析、金融风控、完整流程摘要：本文详细讲述了在金融风控领域运用AI和大数据进行社交网络分析的完整流程。通过通俗易懂的语言，从背景知识入手，解释核心概念，阐述算法原理，分享项目实战经验，探讨实际应用场景，推荐相关工具资源，展望未来发展趋势与挑战，旨在让读者全面了解这一复杂技术在金融风控中的应用。背景介绍目的和范围我们的目的
Spring AI ETL Pipeline使用指南超级小忍 SpringAI spring 人工智能
前言（Introduction）版本声明：本文基于SpringAI1.0.0版本编写。由于SpringAI目前仍处于活跃开发阶段，API和组件可能在后续版本中发生变化，请注意及时关注官方文档更新以保持兼容性。在当今大数据和人工智能快速发展的背景下，ETL（Extract,Transform,Load）系统已经不再只是简单的数据搬运工。ETL是数据仓库和数据分析流程中的核心环节，它负责将分散的数据从
MapReduce分布式计算框架：从原理到实战 AI妈妈手把手 mapreduce 前端大数据分布式计算 python 人工智能
大家好！今天我们来聊聊大数据处理领域的一个重要框架——MapReduce。作为Google提出的经典分布式计算模型，MapReduce极大地简化了海量数据的处理流程。无论你是大数据新手还是有一定经验的开发者，这篇文章都会让你对MapReduce有更深入的理解。我们还会通过实际代码示例来展示它的强大功能！一、MapReduce是什么？想象你有一个装满10亿本书的图书馆，现在需要统计所有书中"大数据"
大数据面试题之Hive(1) 小的~~ 大数据大数据 hive hadoop
说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?说下Hive是什么?跟数据仓库区别?Hive架构Hive内部表和外部表的区别?为什么内部表的删除，就会将数据全部删除，而外部表只删除表结构?为什么用外部表更好?Hive建表语句?创建表时使用什么分隔符?Hive删除语句外部表删除的是什么?Hive数据倾斜以及解决方案Hive如果不用参数调优，在map和reduce端应该做什么Hive
【字节跳动】数据挖掘面试题0003：有一个文件，每一行是一个数字，如何用 MapReduce 进行排序和求每个用户每个页面停留时间
MapReduce是一种适合处理大规模数据的分布式计算框架，其核心思想是将计算任务分解为Map（映射）和Reduce（归约）两个阶段。对文件中的数字进行排序，可以利用MapReduce的特性来实现。要使用MapReduce对文件中的数字进行排序，需要实现一个MapReduce作业，将数字作为键处理，利用Hadoop的默认排序机制对键进行排序。以下是实现步骤和示例代码：文章大纲题目一：有一个文件，每
Redis总结傲祥Ax redis 数据库 Redis重点总结
一、Redis是什么？key-value形式的非关系型数据库，基于内存（64位系统默认是物理内存的四分之三），单线程多路io复用，通常当缓存使用，提高查询效率。二、为什么使用Redis？2.1快（内单异高算）内存存储，单线程模型，异步操作，高效的网络通信，优化的算法和数据结构2.2作用2.2.1五大数据类型Redis存储，key-value形式，value的五种数据类型String，List，Se
2025年智能计算与人机交互国际会议（ICHCI 2025）
2025InternationalConferenceonIntelligentComputingandHumanComputerInteraction【一】、大会信息会议简称：ICHCI2025大会地点：中国·温州收录检索：提交EiCompendex,CPCI,CNKI,GoogleScholar等【二】、会议简介2025年智能计算与人机交互国际会议将在中国温州隆重召开。旨在为全球从事大数据、人
Spark on Docker：容器化大数据开发环境搭建指南 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶大数据 spark docker ai
SparkonDocker：容器化大数据开发环境搭建指南关键词：Spark、Docker、容器化、大数据开发、分布式计算、开发环境搭建、容器编排摘要：本文系统讲解如何通过Docker实现Spark开发环境的容器化部署，涵盖从基础概念到实战部署的完整流程。首先分析Spark分布式计算框架与Docker容器技术的核心原理及融合优势，接着详细演示单节点开发环境和多节点集群环境的搭建步骤，包括Docker
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
机器学习在智能制造业中的应用：质量检测与设备故障预测 Blossom.118 机器学习与人工智能机器学习人工智能深度学习神经网络机器人 sklearn tensorflow
随着工业4.0和智能制造的推进，制造业正经历着一场深刻的数字化转型。智能制造业通过整合物联网（IoT）、大数据和机器学习等先进技术，实现从生产计划到质量控制的全流程优化。机器学习技术在智能制造业中的应用尤为突出，尤其是在质量检测和设备故障预测方面。本文将探讨机器学习在智能制造业中的应用，并分析其带来的机遇和挑战。一、智能制造业中的质量检测（一）传统质量检测方法的局限性传统的质量检测主要依赖于人工检
基于 SASL/SCRAM 让 Kafka 实现动态授权认证 zlt2000 Java java springboot kafka
一、说明在大数据处理和分析中ApacheKafka已经成为了一个核心组件。然而在生产环境中部署Kafka时，安全性是一个必须要考虑的重要因素。SASL（简单认证与安全层）和SCRAM（基于密码的认证机制的盐化挑战响应认证机制）提供了一种方法来增强Kafka集群的安全性。本文将从零开始部署ZooKeeper和Kafka并通过配置SASL/SCRAM和ACL（访问控制列表）来增强Kafka的安全性。二
头歌当HBase遇上MapReduce 敲代码的苦13 头歌 hbase mapreduce 数据库
头歌当HBase遇上MapReduce第1关：HBase的MapReduce快速入门代码行：packagecom.processdata;importjava.io.IOException;importjava.util.List;importjava.util.Scanner;importorg.apache.hadoop.conf.Configuration;importorg.apache.
以智能楼宇自动化控制系统为基石，构筑绿色建筑节能增效新标杆 ctrlworks 楼宇自控康沃思物联楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家
在全球“双碳”目标加速推进与能源危机日益凸显的背景下，建筑行业作为能源消耗与碳排放的重点领域，正面临从传统建造向绿色智能化转型的迫切需求。数据显示，我国建筑运行阶段能耗占全社会总能耗超30%，碳排放占比达21.9%，而传统建筑管理模式下设备低效运行、能源浪费等问题普遍存在。智能楼宇自动化控制系统（BACS）凭借物联网、大数据、人工智能等技术，通过对建筑设备的精准监控、智能调度与协同管理，成为破解绿
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
知识积累----空转转录因子TF活性的计算框架追风少年ii 空间数据分析 hotspot 傅里叶变换机器学习
作者，EvilGenius关于我们外显子的分析课程，我们来一次预报名吧，课表如下第一节：外显子分析基础知识与框架（包括基础文件的格式等）第二节：fastq数据处理到callSNV+基础认知（简单判断谱系突变和体系突变、以及GT:AD:AF:DP等基础信息）第三节（可能需要拆分成2节课）：各大数据库如何注释突变信息（clinvar、cosmic、gnomad、HGMD、hotspot、oncoKB、
大数据项目-Django基于大数据技术实现的农产品销售系统 IT实战课堂-玲琳娜计算机毕业设计大数据 java spark 爬虫
《[含文档+PPT+源码等]Django基于大数据技术实现的农产品销售系统》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、包运行成功以及课程答疑与微信售后交流群、送查重系统不限次数免费查重等福利！数据库管理工具：phpstudy/Navicat或者phpstudy/sqlyog后台管理系统涉及技术：后台使用框架：Django前端使用技术：Vue,HTML5,CSS3、JavaScrip
JVM调优实战 Day 14 ：大数据处理中的JVM调优在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day14】大数据处理中的JVM调优文章标签jvm调优,大数据处理,Java性能优化,JVM参数配置,JVMGC调优,Java开发,大数据架构,Jvm实战文章简述在大数据处理场景中，Java应用通常面临内存占用高、GC频率频繁、堆内存不足等挑战。本文作为“JVM调优实战”系列的第14天，深入探讨了大数据处理中的JVM调优策略。文章从概念解析、技术原理、常见问题、诊断方法、调优策略到
鸿蒙开发必备技能：六种数据存储方式全解析+实战代码 harmonyos
摘要在当前多设备互联的时代，移动端应用不再局限于单一设备，而是需要在多个终端上保持状态一致、数据同步与持久管理。鸿蒙系统提供了多种数据存储机制，从轻量级状态存储到复杂的数据持久化方案，满足不同场景下的需求。本文将结合实战案例，深入讲解鸿蒙系统中的六大数据存储方式，并配有可运行的代码，帮助开发者快速掌握数据管理方法。引言随着鸿蒙系统的不断发展，越来越多的开发者开始构建面向多设备、多用户、多场景的智能
IT 行业深度洞察：从技术革命到产业重构的全景图谱 XQR.小白重构
摘要本文系统梳理IT行业的发展脉络，深入剖析云计算、人工智能、大数据、物联网等核心技术的演进逻辑与协同效应，揭示IT产业在数字化转型浪潮中的生态重构与价值创造。通过典型案例分析与数据支撑，探讨行业面临的技术挑战、伦理困境与全球化竞争格局，展望IT技术如何持续驱动社会变革与产业升级。全文结合2025年最新技术动态与市场趋势，为从业者、投资者与研究者提供兼具理论深度与实践指导的行业参考。目录摘要一、I
Python 爬虫实战：12306 订单记录爬取（登录态保持 + 订单数据可视化）西攻城狮北 python 爬虫信息可视化
引言在大数据驱动的今天，12306作为国内最重要的铁路出行平台，积累了海量的出行数据。对于广大用户而言，能够方便地查看和分析自己的出行订单记录，不仅有助于行程管理，还能为未来的出行规划提供有力参考。本文将详细讲解如何利用Python爬虫技术实现12306的模拟登录，爬取个人订单记录，并通过数据可视化技术直观展示出行情况。一、环境搭建与准备工作（一）Python环境配置确保本地已安装Python3.
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
Redis 集群与分布式实现：从原理到实战一切皆有迹可循 redis redis 分布式数据库后端缓存
前言在大数据与高并发场景下，单节点Redis的容量与可用性已无法满足需求。Redis通过集群与分布式技术，实现了数据的分片存储与高可用部署，成为分布式系统的核心组件。本文将深入解析Redis集群的底层原理、架构模式与实战经验，结合代码示例与最佳实践，帮助开发者构建高性能、高可用的分布式缓存系统。一、集群基础架构与核心原理1.数据分片机制Redis集群采用哈希槽（HashSlot）实现数据分片，共有
输入hadoop version时，解决Cannot execute /home/hadoop/libexec/hadoop-config.sh.的方法有奇妙能力吗 ubuntu hadoop hdfs linux 大数据分布式
在ubuntu用hadoopversion遇到了一个错误：Cannotexecute/home/hadoop/hadoop2.8/libexec/hadoop-config.sh.解决方法：在/etc/profile中找到了这个HADOOP_HOME全局变量，将其删除运行source/etc/profile输入vim.bashrc命令，在最后一行输入unsetHADOOP_HOMEsource.b
大数据未来发展的趋势与挑战倒霉男孩大数据
随着信息技术的飞速发展，大数据已经成为推动社会进步和产业变革的重要力量。从商业决策到医疗健康，从智慧城市到人工智能，大数据技术的应用无处不在。未来，随着5G、物联网（IoT）、人工智能（AI）等技术的深度融合，大数据的发展将迎来更广阔的空间，同时也面临诸多挑战。本文将探讨大数据未来的发展趋势、应用前景以及可能面临的问题。一、大数据未来的发展趋势数据量持续爆发式增长随着5G网络的普及和物联网设备的广
从0到1构建智能招聘数据引擎：基于 Python 的 BOSS直聘信息采集实战与反爬破解指南程序员威哥 python 开发语言
前言在大数据浪潮席卷的时代，招聘平台蕴藏着海量的岗位信息，揭示着行业走向、人才趋势、薪资结构等核心价值。BOSS直聘作为国内极具代表性的直招平台，其数据对职业分析、市场监测甚至智能推荐系统的构建都有着重要意义。本文将手把手带你打造一个高质量、抗封锁的Python爬虫系统，精准采集BOSS直聘网的岗位数据，并全面解析其中涉及的反爬机制识别、加密参数处理、数据提取与存储等高级技巧，助你在Web数据采集
大数据量下高并发同步的解决方案大师兄啊 sql 大数据量下高并发同步的解决方案
大数据量下高并发同步的讲解（不看，保证你后悔）对于我们开发的网站，如果网站的访问量非常大的话，那么我们就需要考虑相关的并发访问问题了。而并发问题是绝大部分的程序员头疼的问题，但话又说回来了，既然逃避不掉，那我们就坦然面对吧~今天就让我们一起来研究一下常见的并发和同步吧。为了更好的理解并发和同步，我们需要先明白两个重要的概念:同步和异步1、同步和异步的区别和联系所谓同步，可以理解为在执行完一个函数或
DolphinScheduler 6 个高频 SQL 操作技巧数据库
摘要：ApacheDolphinScheduler系列4-后台SQL经验分享关键词：大数据、数据质量、数据调度整体说明在调研了DolphinScheduler之后，在项目上实际使用了一段时间，有了一些后台SQL实际经验，分享如下。进入DolphinScheduler后台数据库，我这里使用的是MySQL数据库。以任务名称包含“ods_xf_act”的任务为例。一、修改任务组操作UPDATEt_ds_
微信小程序｜流浪动物救助小程序的设计与实现 qq_469603589 微信小程序小程序微信小程序
作者主页：编程指南针作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师主要内容：Java项目、Python项目、前端项目、人工智能与大数据、简历模板、学习资料、面试题库、技术互助收藏点赞不迷路关注作者有好处文末获取源码项目编号：L-BS-XZBS-30一，环境介绍语言环境：Java:jdk1
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默