是小先生

大数据笔记--Hadoop（第一篇）

一、大数据简介

1、简介

2、特点

3、应用场景

4、组织结构

二、Hadoop简介

1、概述

2、版本

3、模块

4、安装模式

5、web访问端口

三、Hadoop发展

1、创始人

2、发展历程

四、Hadoop伪分布式安装

五、hadoop完全分布式安装

一、大数据简介

1、简介

①、美国调研机构Gartner给出了定义：大数据是一种新的处理模式，针对海量数据能够提供更强的决策力、洞察发现力和流程优化能力

②、维基百科给出了定义：大数据是指无法在可承受的时间范围内用常规的软件或者法来对大量的数据进行捕捉、管理和处理

③、无论哪个机构对大数据进行定义，实际上都是围绕对海量数据进行快速有效的处理方案

2、特点

Volumn：数据体量大。很多中小型企业的入门数据量是从TB级别开始，很多大型企业的入门数据量是从PB级别开始，更有累计达到EB级别至ZB级别。

Variety：数据种类样式和来源多；

种类：文本（日志）、图片、音频、视频、flash等

样式：结构化数据（数据本身有结构并且数据解析之后能够用一张或者几张固定的表来存储）；半结构化数据（数据本身有结构但是解析之后无法用一张或者几张固定的表来存储，例如接json、xml等）；非结构化数据（数据本身没有结构并且解析之后无法用几张固定的表来进行存储，例如视频、音频等）

来源：日志、爬虫、网页埋点、手动录入、数据库等

Value：数据价值密度低。价值密度指的是想要的数据在总的数量中的占比。随着网络的发展，价值密度越来越低，但是不意味着获取到的数据越来越少，恰恰相反，获取到的数据是在变多的。只是想要的数据的增长速度比不上样本总量的增长速度。

Velocity：数据增长速度快。随着网络的发展，数据的产生速度以及增长数据越来越快

Veracity：真实性，数据的质量，即数据的准确性和可信赖度，信息的发展，信息来源广，但是真实度就不太行了

Valence：数据的连通性。随着大数据的发展，衍生出来了很多的技术、模块和产业，这个时候，就不得不考虑这些模块、技术和产业之间的关系

随着大数据的发展，产生了越来越多的特性：Vitality(动态性)、Visualization(可视化)、Validity(合法性，例如大数据杀熟、APP的过度索权)等

3、应用场景

i、物流仓储：利用大数据对配送路线、物流中转点进行设计

ii、电商零售：利用大数据技术对用户的消费行为进行分析，抓住用户的心理变化，做到精准营销

iii、旅游：利用大数据技术来为用户进行合理规划(经济能力、路线等)

iv、保险：利用大数据技术进行精准营销、风险预测

v、金融：利用大数据技术对用户进行抗压预测以及风险控制

vi、人工智能：利用大量数据对模型进行训练，提高模型的准确性

4、组织结构

二、Hadoop简介

1、概述

Hadoop是由Yahoo！开发的后来贡献给Apache的一套开源的、可靠的、可伸缩的分布式机制

Hadoop是大数据生态系统中的基础框架，在大数据中，有超过70%的技术或者产业是围绕Hadoop产生的

Hadoop提供了简单的编程模型来对大量数据进行分布式处理

Hadoop能够从一台服务器扩展到上千台服务器，每一台服务器都能够提供计算和存储的功能

Hadoop本身提供了探测和处理异常的机制

Hadoop之父：Doug Cutting（道格·卡丁）

Hadoop的发行版：

        Apache Hadoop：最基础、最原始的版本。相对而言，部署和维护比较复杂，但是适合于初学者，因为它没有将细节隐藏，更适合于理解底层机制

        CDH：Cloudera公司推出的商用版本的Hadoop。这版Hadoop更易于部署和维护，能够相对轻松的扩展集群规模。Cloudera的标价是每个节点每年4000美元(现在每一个节点的价钱飙升到了10000美元)

        HDP：Hortonworks提供的商用版本的Hadoop，更注重分布式存储，增强了分布式存储的功能。Hortonworks在售卖的时候，以打包的方式来售卖，每个包(包含不超过10个节点)每年收费12500美元。最近，Hortonworks已经被Cloudera公司收购

Apache Hadoop目前的版本比较混乱。目前市面上，Hadoop2.X和Hadoop3.X都在流行使用

2、版本

Hadoop1.X：包含了Common、HDFS和MapReduce模块。现在市面上已经停止使用

Hadoop2.X：包含了Common、HDFS、MapReduce以及YARN模块。从Hadoop2.7版本开始，还包含了Ozone模块。Hadoop2.X和Hadoop1.X全版本不兼容

Hadoop3.X：包含了Common、HDFS、MapReduce、YARN和Ozone模块。Hadoop3.X和Hadoop2.X部分版本兼容

3、模块

Hadoop Common：公共依赖模块

Hadoop Distributed File System (HDFS™)：分布式文件系统，解决存储问题

Hadoop YARN：负责任务调度和集群的资源管理

Hadoop MapReduce：基于YARN的分布式计算系统

Hadoop Ozone：一个可伸缩、冗余和分布式的对象存储

4、安装模式

单机模式：在一台服务器上安装Hadoop，只能启动Hadoop的MapReduce模块

伪分布式：在一台服务器上安装Hadoop，利用多个进程来模拟Hadoop集群环境，能够启动Hadoop的绝大部分主要服务

完全分布式：在集群中安装Hadoop，能够启动Hadoop中的所有的服务

5、web访问端口

Process	Hadoop2.X	Hadoop3.X
NameNode	50070	9870
SecondaryNameNode	50090	9868
DataNode	50075	9864
ResourceManager	8088	8088
NodeManager	X	X

三、Hadoop发展

1、创始人

Doug Cutting：创建了Lucene，与Mike Cafarella共同创建了搜索引擎Nutch

Mike Cafarella：是一位专攻数据库管理系统的科学家

2、发展历程

早在2002年的时候，Doug和Mike设计一个搜索引擎Nutch，爬取了全网10亿个网页的数据，爬取完成之后，在设计搜索引擎的过程中，遇到了存储的问题

在2003年的时候，Google发表了一篇论文(GFS)，阐述了分布式存储的思想和原理，但是并没有对外公开这个框架

在2004年的时候，Doug和Mike根绝GFS实现了Nutch中的存储系统 - NDFS(Nutch Distributed File System - Nutch分布式文件系统)

在2004年的时候，Google发表了一篇论文，阐述了分布式计算的思想和原理，但是同样没有对外公开使用这个框架

在2005年的时候，Doug根据这篇论文实现了Nutch中的MapReduce

在Nutch0.8的时候，Doug发现NDFS和MapReduce不只可以用于搜索引擎，也可以用于其他的分布式处理，所以就把NDFS和MapReduce以及其他的一些需要的基本以来分离出来，组成了一个新的框架Hadoop，同时NDFS改名为HDFS(Hadoop Distributed File System)，至此，Hadoop正式面世

在2007年11月的时候，Doug加入了Yahoo!，在Yahoo!工作期间，深度开发了Hadoop，后来还根据网友的建议，实现了HBase、Pig等框架

后来Yaoo!将Hadoop、HBase、Pig等框架贡献给了Apache

四、Hadoop伪分布式安装

1、关闭防火墙

systemctl stop firewalld
systemctl disable firewalld

2、修改主机名- Hadoop集群中，主机名中尽量不要出现-或者_

vim /etc/hostname
将原来的主机名删除，添加自己指定的主机名hadoop01

3、需要将主机名和IP进行映射

vim /etc/hosts
进入文件之后，除了127.0.0.1以及::1这开头的两行以外，其余的行全部删除
之后添加当前主机的IP 主机名，例如
192.168.186.128 hadoop01

4、关闭SELINUX

vim /etc/selinux/config
将SELINUX属性的值改为disabled

5、重启

reboot

6、配置免密登录

ssh-keygen
   ssh-copy-id
   输入主机的密码
   测试是否免密成功：ssh hadoop01
   如果不需要密码，那么说明免密成功，那么输入logout

7、进入/home/software目录，来上传或者下载Hadoop。

cd /home/software/
wget http://网络地址/hadoop-3.1.3.tar.gz

8、解压Hadoop安装包

tar -xvf hadoop-3.1.3.tar.gz

9、进入Hadoop的配置文件目录

cd hadoop-3.1.3/etc/hadoop/

10、编辑文件

vim hadoop-env.sh
在文件中添加JAVA_HOME，值是JDK的安装路径
export JAVA_HOME=/home/software/jdk1.8
保存退出，重新生效这个文件
source hadoop-env.sh

11、编辑文件

1、编辑文件

vim core-site.xml
添加内容

           fs.default.name
           hdfs://hadoop01:9000


           hadoop.tmp.dir
           /home/software/hadoop-3.1.3/tmp

2、编辑文件
   vim hdfs-site.xml
   添加内容

           dfs.replication
           1

3、编辑文件
   vim mapred-site.xml
添加内容

           mapreduce.framework.name
           yarn

4、编辑文件
   vim yarn-site.xml
添加内容

           yarn.resourcemanager.hostname
           hadoop01


           yarn.nodemanager.aux-services
           mapreduce_shuffle

5、编辑文件
   vim workers ------- 注意，如果是在Hadoop2.X，那么这个文件是slaves
   将原来的localhost删除掉，然后添加当前主机的主机名hadoop01

12、配置环境变量

vim /etc/profile
   在文件末尾添加
   export HADOOP_HOME=/home/software/hadoop-3.1.3
   export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
   保存退出，重新生效这个文件
   source /etc/profile
   通过hadoop version命令来确定配置是否有效

13、第一次启动Hadoop之前，需要先进行一次格式化

hadoop namenode -format
如果出现了Storage directory /home/software/hadoop-3.1.3/tmp/dfs/name has been successfully formatted.表示格式化成功

14、进入Hadoop安装目录的子目录sbin下

cd /home/software/hadoop-3.1.3/sbin/

15、编辑文件

vim start-dfs.sh
   在文件头部添加
   HDFS_DATANODE_USER=root
   HDFS_DATANODE_SERCURE_USER=hdfs
   HDFS_NAMENODE_USER=root
   HDFS_SECONDARYNAMENODE_USER=root

16、启动HDFS

start-dfs.sh

17、通过jps查看，会发现三个进程

NameNode
DataNode
SecondaryNameNode

18、编辑文件

vim start-yarn.sh
   在文件头部添加
   YARN_RESOURCEMANAGER_USER=root
   HDFS_DATANODE_SECURE_USER=hdfs
   YARN_NODEMANAGER_USER=root

19、启动YARN

start-yarn.sh

20、通过jps查看，会发现多出来两个进程

ResourceManager
NodeManager

21、可能出现的问题的解决方案

1、如果出现了Name or Service not known或者是UnknownHost之类的问题，那么检查hosts文件是否配置正确，或者是主机名是否写对
2、如果出现了commandc not found，那么检查环境变量是否正确，或者修改完环境变量之后是否进行了source
3、在第一次关闭Hadoop之前，同样修改stop-dfs.sh以及stop-yarn.sh
4、之后，再次启动Hadoop，那么可以使用start-all.sh。如果单独启动HDFS，那么使用start-dfs.sh；如果单独启动YAR，那么使用start-yarn.sh。如果要关闭，将start命令改成stop命令即可

五、hadoop完全分布式安装

1、三台主机关闭防火墙

systemctl stop firewalld
systemctl disable firewalld

2、修改三台主机的主机名

vim /etc/hostname
修改对应的主机名，最好是hadoop01~hadoop03

3、将主机名和IP进行映射

vim /etc/hosts
然后将三台主机的主机名和IP配置

4、关闭SELINUX

vim /etc/selinux/config 将SELINUX的值改为disabled

此处是关闭SELINUX安全策略

5、三台主机重启

reboot

6、三台主机之间需要相互免密

ssh-keygen
ssh-copy-id root@hadoop01
ssh hadoop01
如果不需要密码，那么输入logout
ssh-copy-id root@hadoop02
ssh hadoop02
如果不需要密码，那么输入logout
ssh-copy-id root@hadoop03
ssh hadoop03
如果不需要密码，那么输入logout

7、在第一台主机上进入software目录，下载或者上传Hadoop的安装包

cd /home/software/ 我们用的版本是hadoop-3.1.3.tar.gz

8、如果你安装了伪分布式，先将伪分布式保留下来，没安装跳过这一步

mv hadoop-3.1.3 hadoop-alone

9、解压

tar -xvf hadoop-3.1.3.tar.gz

10、进入Hadoop的配置目录

cd /home/software/hadoop-3.1.3/etc/hadoop/

11、编辑文件 hadoop-env.sh

vim hadoop-env.sh

添加JAVA_HOME，例如
export JAVA_HOME=/home/software/jdk1.8.0_131

此处要根据自己的java路径填写，可以使用 echo $JAVA_HOME来查询


保存退出，重新生效
source hadoop-env.sh

12、编辑文件 core-site.xml

vim core-site.xml

添加内容


    
        fs.defaultFS
        hdfs://ns
    
    
    
        hadoop.tmp.dir
        /home/software/hadoop-3.1.3/tmp
    
    
    
        ha.zookeeper.quorum
        hadoop01:2181,hadoop02:2181,hadoop03:2181

13、编辑文件 hdfs-site.xml

vim hdfs-site.xml

添加内容

  
    
        dfs.nameservices
        ns
    
    
    
        dfs.ha.namenodes.ns
        nn1,nn2, nn3
    
    
    
        dfs.namenode.rpc-address.ns.nn1
        hadoop01:9000
    
    
    
        dfs.namenode.rpc-address.ns.nn2
        hadoop02:9000
    
    
    
        dfs.namenode.rpc-address.ns.nn3
        hadoop03:9000
    
    
    
        dfs.namenode.http-address.ns.nn1
        hadoop01:9870
    
    
    
        dfs.namenode.http-address.ns.nn2
        hadoop02:9870
    
    
    
        dfs.namenode.http-address.ns.nn3
        hadoop03:9870
    
    
    
        dfs.namenode.shared.edits.dir
        qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns
    
    
    
        dfs.journalnode.edits.dir
        /home/software/hadoop-3.1.3/tmp/journal
    
    
    
        dfs.namenode.name.dir
        file:///home/software/hadoop-3.1.3/tmp/hdfs/name
    
    
    
        dfs.datanode.data.dir
        file:///home/software/hadoop-3.1.3/tmp/hdfs/data
    
    
    
        dfs.ha.automatic-failover.enabled
        true
    
    
    
        dfs.client.failover.proxy.provider.ns
        org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
    
    
    
        dfs.ha.fencing.methods
        sshfence
    
    
    
        dfs.ha.fencing.ssh.private-key-files
        /root/.ssh/id_rsa
    
    
    
        dfs.replication
        3
    
    
    
        dfs.permissions
        false

14、编辑文件 mapred-site.xml

vim mapred-site.xml

添加内容


        mapreduce.framework.name
        yarn

15、编辑文件 yarn-site.xml

vim yarn-site.xml

添加内容

  
    
        yarn.resourcemanager.ha.enabled
        true
    
    
    
        yarn.resourcemanager.cluster-id
        ns-yarn
    
    
    
        yarn.resourcemanager.ha.rm-ids
        rm1,rm2
    
    
    
        yarn.resourcemanager.hostname.rm1
        hadoop01
    
    
    
        yarn.resourcemanager.hostname.rm2
        hadoop03
    
    
    
        yarn.resourcemanager.recovery.enabled
        true
    
    
    
        yarn.resourcemanager.store.class
        org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore
    
    
    
        yarn.resourcemanager.zk-address
        hadoop01:2181,hadoop02:2181,hadoop03:2181
    
    
    
        yarn.nodemanager.aux-services
        mapreduce_shuffle
    
    
    
        yarn.resourcemanager.hostname
        hadoop03

16、编辑文件 workers

vim workers 删除掉localhost，将三台主机的主机名写上

17、进入Hadoop安装目录的子目录sbin下

cd /home/software/hadoop-3.1.3/sbin/

18、编辑文件 start-dfs.sh

vim start-dfs.sh

在文件头部添加

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HDFS_JOURNALNODE_USER=root
HDFS_ZKFC_USER=root

19、编辑文件 start-yarn.sh

vim start-yarn.sh
在文件头部添加

 YARN_RESOURCEMANAGER_USER=root
 YARN_NODEMANAGER_USER=root
 HDFS_DATANODE_SECURE_USER=yarn

20、远程拷贝给另外两台主机

cd /home/software/

注意：这里software文件夹是自己提前创建的，我们都安装在这个文件夹中
scp -r hadoop-3.1.3 hadoop02:/home/software/
scp -r hadoop-3.1.3 hadoop03:/home/software/

21、三台主机配置环境变量

vim /etc/profile
   在文件末尾添加
   export HADOOP_HOME=/home/software/hadoop-3.1.3
   export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
   保存退出，重新生效
   source /etc/profile

可以通过hadoop version来查看是否配置成功

22、三台主机需要启动Zookeepe

cd /home/software/zookeeper-3.5.7/bin/
sh zkServer.sh start
sh zkServer.sh status
如果出现了1个leader+2个follower表示启动成功

23、在第一台主机上格式化Zookeeper - 实际上就是在Zookeeper上注册节点

hdfs zkfc -formatZK
如果出现Successfully created /hadoop-ha/ns in ZK.表示格式化成功

24、在三台主机上启动JournalNode

hdfs --daemon start journalnode 注意三台都启动

25、在第一台主机上格式化NameNode

hadoop namenode -format
如果出现Storage directory /home/software/hadoop-3.1.3/tmp/hdfs/name has been successfully formatted.表示格式化成功

26、在第一台主机上启动NameNode

hdfs --daemon start namenode

27、在第二台和第三台主机上格式化NameNode

hdfs namenode -bootstrapStandby
如果出现Storage directory /home/software/hadoop-3.1.3/tmp/hdfs/name has been successfully formatted.表示格式化成功

28、在第二台和第三台主机上启动NameNode

hdfs --daemon start namenode

29、在三台节点上启动DataNode

hdfs --daemon start datanode

30、在三个节点上启动zkfc

hdfs --daemon start zkfc

31、在第三台主机上启动YARN

start-yarn.sh 注意如果你的yarn启动报错如下图，那可能是你的start-yarn.sh配置错误

位置应该在这：

通过jps查看，第一台主机上出现
NameNode
DataNode
JournalNode
ResourceManager
NodeManager
DFSZKFailoverController
QuorumPeerMain

第二台主机上出现
NameNode
DataNode
JournalNode
NodeManager
DFSZKFailoverController
QuorumPeerMain

第三台主机上出现
NameNode
DataNode
JournalNode
ResourceManager
NodeManager
DFSZKFailoverController
QuorumPeerMain

你可能感兴趣的:(大数据03-Hadoop,big,data,大数据,hadoop)

二叉树的类型定义与基本操作 S01d13r 笔记
二叉树的类型定义与基本操作树结构是一类重要的非线性数据结构，在客观世界中广泛存在。树在计算机领域中也得到了广泛的应用，尤以二叉树最为常用。本文重点讨论二叉树的基本操作。1.二叉树的类型定义二叉树通常由三个域组成：数据域、左孩子指针域和右孩子指针域。其类型定义为：typedefstructBiNode{chardata;//数据域structBiNode*lchild,*rchild;//左右孩子指
Spring Boot整合Redis快速入门实例 oscar999 Spring Boot实战开发大全 redis spring boot java
本篇演示环境本篇基于SpringBoot2.5.0,关于Redis的安装，可以参考：Redis介绍、安装与初体验和Windows下安装和使用Redis。整合步骤导入Redis相关的依赖项配置启动器spring-boot-starter-data-redisorg.springframework.bootspring-boot-starter-data-redis添加连接Redis服务器的相关配置在
【复杂网络建模】真实网络数据集的读取和操作钰云空间复杂网络 Python python
文章目录概要1.获取真实网络数据集的常用网址1.1NetworkRepository.1.2StanfordLargeNetworkDatasetCollection1.3KONCET1.4Netzschleuder2.网络分析2.1计算度中心性2.2绘制网络图小结概要在复杂网络建模中，使用真实的网络数据集是理解和分析现实世界网络结构的关键。接下来将介绍如何使用Python中的工具库（如Netwo
Vue 数据更新但页面没有更新的 7 种情况爱分享的程序员 vue使用
1.Vue无法检测实例被创建时不存在于data中的property原因：由于Vue会在初始化实例时对property执行getter/setter转化，所以property必须在data对象上存在才能让Vue将它转换为响应式的。场景：varvm=newVue({data:{},//页面不会变化template:'{{message}}'})vm.message='Hello!'//`vm.mess
小程序性能优化-预加载爱分享的程序员微信小程序小程序性能优化
在微信小程序中，数据预加载是提升用户体验的重要优化手段。以下是处理数据预加载的完整方案：一、预加载的适用场景跳转页面前的数据准备如从列表页进入详情页前，提前加载详情数据首屏加载后的空闲时间在首页加载完成后，预加载其他高频页面数据多步骤流程的后续步骤如电商下单流程中，提前加载支付页面所需数据二、核心实现方案1.全局预加载（App级别）//app.jsApp({globalData:{preloadD
Vue模板语法(插值语法，指令语法) 仰望天空的小小蜗牛 Vue.js vue.js javascript 前端
Vue模板语法有2大类：Vue官网链接1.插值语法：功能：用于解析标签体内容。写法：{{xxx}}，xxx是js表达式，且可以直接读取到data中的所有属性。2.指令语法：功能：用于解析标签（包括：标签属性、标签体内容、绑定事件…）。举例：v-bind:href=“xxx”或简写为:href=“xxx”，xxx同样要写js表达式，且可以直接读取到data中的所有属性。备注：Vue中有很多的指令，且
姓名案例_插值语法实现 JAVA代码搬运工 Vue 前端 vue.js 前端
姓名案例_插值语法实现姓：名：全名：{{firstName}}-{{lastName}}Vue.config.productionTip=false//阻止vue在启动时生成生产提示。newVue({el:'#root',data:{firstName:'张',lastName:'三'}})
vue2学习笔记4 - 深入学习模板语法：插值语法和指令语法我是飞鸟呀 Vue 学习笔记 vue.js
前言在vue2学习笔记2-老规矩，从HelloWorld开始，了解Vue实例和模板-CSDN博客我们提到过，容器中的代码叫做Vue模板，它们遵循HTML规范，只是混入了特殊的Vue语法。这些特殊的Vue语法除了上一次我们提到的插值语法外，还有指令语法。插值语法，可以使用js表达式，读取vue实例data中的数据。但是能实现的功能比较单一，而且，也仅限于标签体中的文本替换。如果想要与元素的属性绑定，
模板语法（插值语法、指令语法） JAVA代码搬运工 Vue 前端 vue.js
模板语法插值语法你好，{{name}}指令语法点我去{{school.name}}学习1点我去{{school.name}}学习2Vue.config.productionTip=false//阻止vue在启动时生成生产提示。newVue({el:'#root',data:{name:'jack',school:{name:'该去的地',url:'http://www.school.com',}}
自动化办公|xlwings与pandas交互游客520 自动化 python从入门到出家实用代码 pandas excel python 自动化
1.介绍在数据分析和Excel自动化中，pandas作为Python处理数据的强大库，而xlwings则可以高效操作Excel。将pandas与xlwings结合使用，可以实现从Excel读取数据到DataFrame、将DataFrame写入Excel以及Excel的自动化处理。2.从Excel读取数据到PandasDataFrame2.1读取整个表格importxlwingsasxwimport
myabtis入门案例 HPF_99 mybatis java mysql java mybatis
mybatis入门案例1.新建项目（Maven），搭建环境数据库（名：mybatis，表user）导出sql：/*NavicatMySQLDataTransferSourceServer:localhost_3306SourceServerVersion:50162SourceHost:localhost:3306SourceDatabase:mybatisTargetServerType:MYS
开源微服务配置中心数据源动态刷新SDK
项目简介本项目主要功能是为了实现在微服务架构下能够动态向配置中心添加新的数据源，并且应用程序能够感知并采用最新的数据源列表项目地址gitee：https://gitee.com/gs_work/dynamic-datasource-refresher/tree/v...github：https://github.com/guoshuai134/dynamic-datasource-refreshe
查询orace 表属性SQL 元气满满的码农数据库
工作中要写系统文档，需要导出字段的说明，用这个sql导成excel很方便SELECTa.column_nameAS字段,a.data_typeAS数据类型,a.data_lengthAS长度,a.nullableAS是否为空,a.data_defaultAS默认值,b.commentsAS注释FROMuser_tab_columnsaLEFTJOINuser_col_commentsbONb.co
IDEA修改recent project的路径胖毁青春，瘦解百病 #IDEA
有时候需要将某些项目统一放到另外一个工作区间，此时可以通过修改下面的文件来解决文件路径问题C:\Users%username%.IntelliJIdea2019.3\config\options\recentProjects.xml.IntelliJIdea2019.3为2019年IDEA的路径，2020年后面升级之后移动到了C:\Users%username%\AppData\Roaming\J
清空idea中Recent Projects记录神钟情的男人 IntelliJ IDEA intellij-idea
1.关闭idea2.进入C:\Users\fei97\AppData\Roaming\JetBrains\IntelliJIdea2024.1\options目录3.修改recentProjects.xml内容为注意：如果找不到recentProjects.xml文件，可以使用Everything软件搜一下4.重启idea
删除idea recent projects 记录元气满满的码农 intellij-idea java ide
1、退出idea（一定要全部退出idea，要不然删除后，idea一退出，又保存上了）2、进入C:\Users\Administrator\AppData\Roaming\JetBrains\IntelliJIdea2024.1\options目录根据不同的版本号IntelliJIdea2024.1这个地方不一样3、删除recentProjects.xml内容中的结点4、启动idea
DockerでOracle Database 23ai FreeをセットアップしMAX_STRING_SIZEを拡張する手順 engchina LINUX 数据库 docker oracle 23.7
DockerでOracleDatabase23cFreeをセットアップしMAX_STRING_SIZEを拡張する手順はじめに環境準備ディレクトリ作成Dockerコンテナ起動データベース設定変更コンテナ内でSQL*Plus起動PDB操作と文字列サイズ拡張設定検証管理者ユーザー作成注意事項まとめはじめにOracleDatabase23aiFreeをDocker環境でセットアップし、拡張文字列サイズ（M
单片机栈和堆、FALSH、区别古希腊掌握嵌入式的神单片机嵌入式硬件
1.Flash（闪存）（程序存储器）用途存储程序代码：编译后的机器指令（如.text段）、常量数据（如.rodata段）等。掉电不丢失：程序固化在Flash中，重启后仍存在。特点只读或需擦除写入：运行时不可直接修改（需特殊操作，如Flash编程）。访问速度较慢：比RAM慢，但容量较大（STM32的Flash通常为几十KB到几MB）。寿命有限：Flash有擦写次数限制（约1万~10万次）。示例STM
Slurm作业调度系统常见操作（使用超算运行深度学习）坐在云朵上的kiwi 工程项目 #deep learning 深度学习服务器
1.传输下载文件sftp远程命令cd,pwd等，本地命令lcd,lpwdget远程地址本地地址put本地地址远程地址上传文件夹1.在远程建立和本地一样名称的文件夹如data/2.put-rdata/2.建立虚拟环境moduleloadpython/3.8#加载modulevirtualenv--no-downloadENV#建立一个叫ENV的虚拟环境激活虚拟环境sourceENV/bin/acti
【update 更新数据语法合集】.NET开源ORM框架 SqlSugar 系列 m0_74823595 面试学习路线阿里巴巴 .net 开源
系列文章目录文章目录系列文章目录前言??一、实体对象更新1.1单条与批量1.2不更新某列1.3只更新某列1.4NULL列不更新1.5无主键/指定列1.6更新添加条件1.7大数据更新1.8重新赋值1：list中的值修改1.9重新赋值2:列中的值+1二、根据表达式更新（像SQL）2.1指定多个字段更新2.2一个字段更新2.3字段+1更新2.4Set语法是支持多个的2.5批量更新IN2.6表达式无实体更
2024年Python最新PyQt5 小工具：Excel数据分组汇总器 2401_84556783 程序员 python qt excel
importpandasaspd编写UI界面组件布局，UI布局函数init_ui()。init_ui()的函数整体内容都贴在下面这里，大佬们可以根据自己的需要随意发挥。definit_ui(self):标题、图标设置self.setWindowTitle(‘Excel数据汇总工具公众号：[Python集中营]’)self.setWindowIcon(QIcon(‘:/data_sum.ico’))
COCO2017 数据集的下载方法骆驼穿针眼 mmdet问题集计算机视觉与深度学习数据集下载人工智能 python
下载方法(一)COCO数据集下载地址：https://cocodataset.org/#home#imageswgethttp://images.cocodataset.org/zips/train2017.zip#traindatasetwgethttp://images.cocodataset.org/zips/val2017.zip#validationdatasetwgethttp://i
Spring学习01 nightelves11 spring Java spring java 后端
spring学习011.微服务*2.反应式框架3.云原生开发*4.web应用5.无服务器技术6.事件驱动7.批处理project（Java开发各个方面）frameworkbootdata处理数据cloud云原生security安全管理session共享会话integration集成Hateoas媒体服务restdocs文档Batch批处理CredHubStatemachine状态机-…IOC控制反
Linux挂载samba共享文件夹 linux运维samba
一：场景⼀台Linux服务器⼀台Windows服务器，且开启了samba共享\xx.xx.xx.xx\share需求：将Linux服务器上指定目录的的⽂件存储⾄samba共享上二：实现1：安装CIFS客户端yuminstallcifs-utils2：实现挂载samba共享文件夹#创建挂载目录mkdir-p/data/share#挂载samba服务器#mount.cifs-ousername=mou
IOS 图片绘制过程中的剪切之后没有原图清晰的问题解决方法 Cao_Shixin攻城狮 ios开发 iOS 图片剪切模糊问题
在开发的过程中，我们一般或多或少遇到对图片进行“压”和“缩”处理。“压”，一般我们就是使用UIImageJPEGRepresentationNSData*data=UIImageJPEGRepresentation(image,compression);UIImage*resultImage=[UIImageimageWithData:data];进行处理，无非内容稍微变一下，1.来一个for循环
python实现二分查找（对新手友好，内容通俗易懂） dlage python 列表 python 数据结构
python实现二分查找二分查找又名折半查找。优点：查询速度快，性能好。缺点：要求查询的表为有序表原理：将表中间位置（mid）的数字与待查数字（data）做比较，如果相等：返回true，结束。如果不相等：则使用中间位置的记录将表分为前后两个子表。若data>mid则进一步查找后一个表。若datadata:last=mid-1elifalist[mid]data:last=mid-1elifalis
Ubuntu从零创建Hadoop集群爱编程的王小美大数据专业知识系列 ubuntu hadoop linux
目录前言前提准备1.设置网关和网段2.查看虚拟机IP及检查网络3.Ubuntu相关配置镜像源配置下载vim编辑器4.设置静态IP和SSH免密(可选)设置静态IPSSH免密5.JDK环境部署6.Hadoop环境部署7.配置Hadoop配置文件HDFS集群规划HDFS集群配置1.配置works文件2.配置hadoop-env.sh文件3.配置core-site.xml文件4.配置hdfs-site.x
爬虫实战分享：高效爬取汽车官方销售排行榜的技术方案威哥说编程 python 网络爬虫
随着大数据技术的飞速发展，爬虫技术在各行各业中得到了广泛应用。汽车行业作为一个信息密集型行业，销售数据、排行榜和车型趋势等内容成为了汽车公司、市场研究者和消费者关注的重点。爬虫技术为这些数据的收集和分析提供了强有力的支持。本文将介绍如何通过爬虫技术高效爬取某汽车官方销售排行榜，并讨论常见的技术难点与解决方案。1.目标与需求分析我们的目标是从某汽车官方网站上高效地爬取官方销售排行榜。爬取内容包括：销
META-INF 文件夹用途杏花春雨江南 java基础 pycharm ide python
META-INF文件夹是Java应用程序和库中一个特殊的目录，通常用于存放元数据（Metadata）和配置文件。它是Java标准的一部分，Java虚拟机和相关工具会识别并处理该目录中的特定文件。以下是META-INF文件夹的常用使用场景：1.存放Manifest文件(MANIFEST.MF)作用：MANIFEST.MF是JavaJAR文件的元数据文件，用于描述JAR文件的内容和属性。常用场景：指定
C# dotnet core开发跨平台桌面应用程序(基于GTK+3.0) xingyun86 C++C#.netcore
1.Windows下开发环境VisualStudio20192.新建C#跨平台应用3.工程解决方案右键Nuget安装Gtk3依赖4.编写代码：5.编译运行（编译ok，会提示下载gtk-3.24.zip）自行下载gtk-3.24.zip:下载完成后解压在C:\Users\登陆用户\AppData\Local\Gtk\3.24\目录下6.运行截图7.发布到Linux下右键工程->publish(发布)
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: ken.wug@gmail.com 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多