weixin_34113237

小型大数据平台搭建

前言

一、搭建环境

1.1集群规划

二、集群的相关配置

2.1 新建用户hadoop

2.2 更改主机名

2.3 主机和IP做相关映射

2.4 SSH免密码登录

2.5 时间配置

2.6 整体安装目录安排

三、 Hadoop HA环境搭建

3.1 JDK配置

3.2 安装配置Zookeeper集群

3.3 安装配置hadoop HA集群

四、 Hive+MySQL 的安装与配置

4.1 Hive的安装部署

4.2 MySQL数据库安装配置

4.3 修改hive-site.xml

4.4 拷贝mysql驱动包到hive的lib目录下

五、 HBase完全分布式集群搭建

5.1 解压安装

5.2 修改hbase-site.xml

5.3 修改regionserver

5.4 将Hbase目录分发到其他节点

5.5 启动进程

六、 Flume安装部署

6.1 解压安装

6.2 修改flume-env.sh

6.3 配置文件拷贝

七、 Kafka安装部署

7.1 安装Scala

7.2 解压安装Kafka

7.3 修改配置文件

7.4 启动服务

八、 Sqoop安装部署

8.1 解压Sqoop

8.2 修改sqoop-env.sh

8.3 导入MySQL驱动包

8.4 测试连接数据库

前言

搭建基于CDH Hadoop高可用性的集群，主要框架有：HDFS HA、YARN HA、Zookeeper、HBase HA、Mysql、Hive、Sqoop、Flume-ng、kafka、安装，可用于批量数据的收集、转换、清洗、分析、存储、查询。

相关软件:

下载地址：http://archive-primary.cloudera.com/cdh5/cdh/5/

一搭建环境

1.1集群规划

主机名	IP	安装软件	运行的节点
hadoop01	192.168.60.121	JDK、Hadoop	NameNode、 DFSZKFailoverController、 JournalNode、
hadoop02	192.168.60.122	JDK、Hadoop、Flume	NameNode、 DFSZKFailoverController、 JournalNode、
hadoop03	192.168.60.123	JDK、Hadoop、Kafka、Flume	ResourceManager、 JournalNode、 Kafka
hadoop04	192.168.60.124	JDK、Hadoop、Kafka、Flume	ResourceManager、 DataNode Kafka
hadoop05	192.168.60.125	JDK、Hadoop、zookeeper、HBase、Kafka、Flume	DataNode、 NodeManager、 QuorumPeerMain、 HMaster、HRegionServer、 Kafka
hadoop06	192.168.60.126	JDK、Hadoop、zookeeper、HBase、Flume	DataNode、 NodeManager、 QuorumPeerMain、 HMaster、HRegionServer
hadoop07	192.168.60.127	JDK、Hadoop、zookeeper、HBase、Hive、MySQL、Sqoop	DataNode、 NodeManager 、 QuorumPeerMain、 HRegionServer、 Runjar

说明：

1、本次搭建，安排了两个NameNode节点，分别是1、2号机，两台NameNode，一台处于active状态，另一台处于standby状态。ActiveNameNode对外提供服务，Standby NameNode不对外提供服务，仅同步active namenode状态，以便能够在它失败时进行快速切换。

2、Hadoop 官方提供了两种 HDFSHA的解决方案，一种是NFS，另一种是QJM。在本次搭建中，使用QJK，主备NameNode通过JournalNode同步数据，只要成功写入多数JournalNode即认为写入成功，所以要配置奇数个JournalNode,我们配置了3个。

3、本次搭建上，配置了2个ResourceManager,一个是Active，一个是Standby,状态由zookeeper进行协调

二、集群的相关配置

2.1 新建用户hadoop

在7台机器都新建hadoop的用户名，都以这个普通用户的权限进行操作，设置同样的口令

adduser hadoop

给用户hadoop设置sudo权限

vi /etc/sudoers

hadoop ALL=(ALL) ALL

2.2 更改主机名

集群所有的机器都要做这个操作。

输入 vim /etc/sysconfig/network

修改localhost.localdomain主机名称，每台名称都不一样

例如: HOSTNAME=hadoop01/2/3/4/5/6/7/

注: 名称更改了之后输入reboot重启才会生效。

2.3 主机和IP做相关映射

在01机器上操作，设置好无密码登录后，scp到其它6台机器上

vim /etc/hosts

添加所有主机映射

192.168.60.121 hadoop01

192.168.60.122 hadoop02

192.168.60.123 hadoop03

192.168.60.124 hadoop04

192.168.60.125 hadoop05

192.168.60.126 hadoop06

192.168.60.127 hadoop07

2.4 SSH免密码登录

首先在每台机器上都执行一遍生成秘钥文件

输入:ssh-keygen -t rsa

然后分别将hadoop01、hadoop02、hadoop03、hadoop04、hadoop05、hadoop06、hadoop07的公匙发送到hadoop01上，在hadoop01上的实现免密码登陆。

hadoop01上操作：ssh-coyp-id hadoop01

hadoop02上操作：ssh-coyp-id hadoop01

hadoop03上操作：ssh-coyp-id hadoop01

hadoop04上操作：ssh-coyp-id hadoop01

hadoop05上操作：ssh-coyp-id hadoop01

hadoop06上操作：ssh-coyp-id hadoop01

hadoop07上操作：ssh-coyp-id hadoop01

然后将hadoop01目录./.ssh下的authorized_keys文件scp到其他机器的 /root/.ssh 目录下

scp authorized_keys Hadoop02:/home/hadoop/.ssh

scp authorized_keys Hadoop03:/home/hadoop/.ssh

scp authorized_keys Hadoop04:/home/hadoop/.ssh

scp authorized_keys Hadoop05:/home/hadoop/.ssh

scp authorized_keys Hadoop06:/home/hadoop/.ssh

scp authorized_keys Hadoop07:/home/hadoop/.ssh

2.5 时间配置

本次搭建以hadoop01主机的时钟为准,hadoop01主机开通ntpd服务

查看当前系统ntpd服务是否开启：$ sudo service ntpd status

开启服务：$ sudo service ntpd start

设置开机启动：$ sudo chkconfig ntpd on

修改系统配置文件

$ sudo vi /etc/ntp.conf

第一处修改：修改成自己的网段

Restrict 192.168.60.121 mask 255.255.255.0 nomodify notrap

第二次修改：模拟内网环境，不需要连外网，注释掉下面参数

第三次修改：将本地服务注释去掉

修改完保存退出，重启ntpd服务生效

$ sudo service ntpd restart

每台机器都编写一个crontab定时任务，每十分钟执行一次

0-59/10 * * * * /usr/sbin/ntpdate hadoop01

2.6 整体安装目录安排

所有配置框架都安装在~/opt/modules/目录下

三、Hadoop HA环境搭建

3.1 JDK配置

在01机解压JDK安装包

$ tar –zxvf home/hadoop/opt/software/jdk-7u80-linux-x64.tar.gz –C home/hadoop/opt/modules

配置JAVA_HOME

$ sudo vi /etc/profile

export JAVA_HOME=/home/hadoop/opt/modules/jdk1.7.0_80

$ sudo source /etc/profile

3.2 安装配置Zookeeper集群

先再hadoop05机器上操作

解压Zookeeper到目录/opt/modules/下

修改zoo.cfg文件

指定本地数据存储目录：dataDir=/home/hadoop/opt/modules/zookeeper-3.4.5/data/zkData

指定所有ZK节点服务端的实例

servier.5=hadoop05:2888:3888

servier.6=hadoop06:2888:3888

servier.7=hadoop07:2888:3888

在/opt/modules/zookeeper-3.4.5/data/zkData下vi myid文件，写1，保存退出

将配置文件分发到其他节点

$ scp –r zookeeper-3.4.5/ hadoop06:/opt/modules/

$ scp –r zookeeper-3.4.5/ hadoop07:/opt/modules/

在06和07机器上修改分发好的myid文件，改成对应的编号:06对应6，07对应7

启动： $ bin/zkServer.sh start

查看状态： $ bin/zkServier.sh status

3.3 安装配置hadoop HA集群（在1号机上操作）

3.3.1、解压hadoop安装包到目录/opt/modules/下（所机器全部统一这个目录）

3.3.2、指定JAVA_HOME目录

进入hadoop的配置目录/home/hadoop/hadoop-2.5.0/etc/hadoop

编辑hadoop-env.sh,指定JAVA_HOME目录

export JAVA_HOME=/home/hadoop/opt/modules/jdk1.7.0_80

3.3.3 编辑core-site.xml

fs.defaultFS

hdfs://ns1/

hadoop.tmp.dir

/home/hadoop/opt/modules/hadoop-2.5.0/tmp

ha.zookeeper.quorum

hadoop05:2181,hadoop06:2181,hadoop07:2181

3.3.4 编辑hdfs-site.xml

dfs.nameservices

ns1

dfs.ha.namenodes.ns1

nn1,nn2

dfs.namenode.rpc-address.ns1.nn1

hadoop01:9000

dfs.namenode.rpc-address.ns1.nn2

hadoop02:9000

dfs.namenode.http-address.ns1.nn1

hadoop01:50070

dfs.namenode.http-address.ns1.nn2

hadoop02:50070

dfs.namenode.shared.edits.dir

qjournal://hadoop01:8485;node02:8485;node03:8485/ns1

dfs.journalnode.edits.dir

/home/hadoop/opt/modules/hadoop-2.5.0/journaldata

dfs.ha.automatic-failover.enabled

true

dfs.client.failover.proxy.provider.ns1

org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

dfs.ha.fencing.methods

sshfence shell(/bin/true)

dfs.ha.fencing.ssh.private-key-files

/home/hadoop/.ssh/id_rsa

dfs.ha.fencing.ssh.connect-timeout

30000

3.3.5 编辑mapred-site.xml

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

hadoop01:10020

mapreduce.jobhistory.webapp.address

hadoop01:19888

mapred.map.tasks

mapred.reduce.tasks

3.3.6 编辑 yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.resourcemanager.hostname.rm1

hadoop03

yarn.resourcemanager.hostname.rm2

hadoop04

yarn.resourcemanager.ha.enabled

true

yarn.resourcemanager.cluster-id

yrc

yarn.resourcemanager.ha.rm-ids

rm1,rm2

yarn.resourcemanager.zk-address

hadoop05:2181,hadoop06:2181,hadoop07:2181

3.3.7 修改slaves

[hadoop01]$ cat slaves

node05

node06

node07

[hadoop03]$ cat slaves

node05

node06

node07

3.3.8、将配置好的hadoop拷贝到其它节点

scp -r opt/modules/hadoop hadoop02:opt/modules/hadoop

scp -r opt/modules/hadoop hadoop03:opt/modules/hadoop

其它几个节点类似

同时也要把 /etc/profile /etc/hosts 两个文件复制到所有节点机上

3.3.9、先启动05、06、07节点zookeeper

$ bin/zkServer.sh start

3.3.10、再启动01、02、03节点的JournalNode

$ sbin/hadoop-daemon.sh start journalnode

3.3.11 hadoop格式化

在01号上执行 bin/hdfs namenode –format

3.3.12 同步元数据

启动01机器的namenode

切换到02机器上执行元数据同步

$ bin/hdfs namenode –bootstrapStandby

3.3.13 初始化ZKFC

先停掉两台namenode服务进程，执行

$ bin/hdfs zkfc –formatZK

进入ZK客户端，检查是否生成了hadoop-ha的节点目录

3.3.13 启动ZKFC监听器

在两台namenode所在的机器上分别启动ZKFC监听器

$ sbin/hadoop-daemon.sh start zkfc

3.3.14 测试

UI页面查看

上传产品到HDFS测试

运行WordCount测试

四、 Hive + MySQL 的安装与配置

4.1 Hive的安装部署 (在07机器上)

4.1.1 解压安装Hive到/opt/modules/目录下

tart –zxvf hive-0.13.1-cdh5.3.6.tar.gz –C ~/opt/modules

4.1.2 配置Hive数据存储目录

bin/hdfs dfs –mkdir /tmp

bin/hdfs dfs –mkdir /uer/hive/warehouse

bin/hdfs dfs –chmod g+w /tmp

bin/hdfs dfs –chmod g+w /user/hive/warehouse

4.1.3 修改hive-env.sh

# Set HADOOP_HOME

HADOOP_HOME=/opt/modules/hadoop-2.5.0

# Hive Configuration Directory

export HIVE_CONF_DIR=/opt/modules/hive-0.13.1-bin/conf

4.1.4 启动Hive

$ bin/hive

4.2 MySQL数据库安装配置

4.2.1 安装mysql (在07机器上)

查询系统中是否存在MySQL

$ sudo rpm –qa|grep mysql

卸载自带MySQL

$ sudo rpem –e –nodeps ……

yum安装MySQL

$ sudo yum –y insall mysql-server

查看MySQL是否开启

$ sudo service mysqld status

启动服务

$ sudo service mysqld start

设置开机启动MySQL

$ sudo chkconfig mysqld on

4.2.2 设置MySQL管理员root的密码

mysqladmin –u root passward `123456`

进入mysql –uroot –p

4.2.3 设置MySQL链接的权限

在mysql数据库user表中插入一条数据

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 123456 WITH GRANT OPTION;

删除表中的信息

delect from user where host=`127.0.0.1`

delect from user where host=`hadoop07`

delect from user where host=`localhost`

刷新并退出MySQL

flush privileges;

quit

sudo service mysqld restart

4.3 修改hive-site.xml

javax.jdo.option.ConnectionURL

jdbc:mysql://beifeng07:3306/metastore?createDateIfNotExist=true

javax.jdo.option.ConnectionDriverName

con.mysql.jdbc.Driver

javax.jdo.option.ConnectionUserName

root

javax.jdo.option.ConnectionPassword

123456

4.4 拷贝mysql驱动包到hive的lib目录下

$ cp –r mysql-connector-java-5.1.27-bin.jar /opt/modules/hive-0.13.1-bin/lib/

五 HBase完全分布式集群搭建

5.1 解压安装（先在05机器上操作）

$ tar –zxvf hbase-0.98.6-cdh5.3.5.tar.gz –C ~/opt/modules/

5.2 修改hbase-site.xml

hbase.tmp.dir

/opt/modules/hbase-0.98.6-hadoop2/data/tmp

hbase.rootdir

hdfs://hadoop05:8020/hbase

hbase.cluster.distributed

true

hbase.zookeeper.quorum

hadoop05,hadoop06,hadoop07

5.3 修改regionserver，添加

hadoop05

hadoop06

hadoop07

5.4 将Hbase目录分发到其他节点

$ scp –r hbase-0.98.6-hadoop2/ hadoop06:/opt/modules/

$ scp –r hbase-0.98.6-hadoop2/ hadoop07:/opt/modules/

5.5 启动进程

5.5.1 分别启动hadoop各节点和zookeeper各节点

5.5.2 启动hadoop05和hadoop06机器Hmaseter

$ bin/hbase-daemon.sh start master

启动hadoop05、hadoop06、hadoop07机器HregionServer

$ bin/hbase-daemon.sh start regionserver

六 Flume安装部署

分别在hadoop02、hadoop03、hadoop04、hadoop05、hadoop06机器上操作

6.1 解压安装包到/opt/modules/目录下

$ tar –zxvf flume-ng-1.5.0-cdh5.3.6-src.tar.gz –C ~/opt/modules/

6.2 修改flume-env.sh

export JAVA_HOME=/home/hadoop/opt/modules/jdk1.7.0_80

6.3 配置文件拷贝

将hadoop的core-site.xml和hdfs-site.xml文件拷贝到flume/conf下

可通过5台机器部署扇出或扇入、高可用性操作

七 Kafka安装部署

在hadoop03、hadoop04、hadoop05机器上操作

7.1 安装Scala

7.2 解压安装Kafka

$ tar –zxf kafka_2.11-0.8.2.1.tgz –C ~/opt/modules/

7.3 修改配置文件

hadoop03上配置文件为 server3.properties,自定义配置如下

broker.id=3

port=9093

zookeeper.connect=hadoop03:2181,hadoop04:2181,hadoop05:2181/kafka

hadoop04上配置文件为 server4.properties,自定义配置如下

broker.id=4

port=9094

zookeeper.connect=hadoop03:2181,hadoop04:2181,hadoop05:2181/kafka

hadoop05上配置文件为 server5.properties,自定义配置如下

broker.id=5

port=9095

zookeeper.connect=hadoop03:2181,hadoop04:2181,hadoop05:2181/kafka

7.4 启动服务

先启动各zk服务

$ bin/zkServer.sh start

再启动kafka服务

$ bin/kafka-server-start.sh

八 Sqoop安装部署

8.1 解压Sqoop (在hadoop07主机上)

tar –zxf sqoop-1.4.5-cdh5.3.6.tar.gz –C ~/opt/modules/

8.2 修改sqoop-env.sh

指定各框架安装目录

export HADOOP_COMMON_HOME=

export HADOOP_MAPRED_HOME=

export HIVE_HOME=

export HBASE_HOME=

……

8.3 导入MySQL驱动包

将MySQL驱动包放到sqoop的lib目录下

8.4 测试连接数据库

bin/sqoop \

list-tables \

--connect jdbc:mysql://hadoop07:3306/metastore \

--username root \

--password 123456

转载于:https://www.cnblogs.com/perfectdata/p/10065028.html

你可能感兴趣的:(小型大数据平台搭建)

Python史上最强工具书——《Python编程从入门到实践》，允许白嫖编程咕咕gu- Python教程 python Python基础开发语言 Python书籍
今天给大家推荐一本超级适合自学的Python的工具书——《Python编程从入门到实践》。非常的适合零基础的小白来学习！备受业内人士推崇，豆瓣评分高达9.1！这本书分为两个部分：第一部分介绍了编程环境的搭建和Python编程所必须了解的基本概念；第二部分介绍了三个具体项目：分别是射击游戏、数据可视化、小型Web应用程序。部分内容截图：上面的学习教程资料已经是给大家整理打包完毕了，需要的可以直接带走
深入理解 GPU 渲染加速与合成层（Composite Layers）
一、前端视角下的GPU加速1.CPU与GPU的协作模式在前端渲染流程中，GPU加速通过硬件并行计算能力显著提升图形处理效率。传统浏览器渲染依赖CPU处理DOM解析、样式计算和布局，但CPU的串行处理模式在处理大规模图形数据（如复杂动画、3D变换、高清图像）时易成为性能瓶颈。GPU的介入解决了这一核心矛盾：流处理器核心并行计算：GPU拥有数千个小型核心，可同时处理大量像素数据，例如同时对元素的所有像
模型蒸馏：从复杂到精简，AI技术的“瘦身”秘籍 lmtealily 人工智能
引言在人工智能的浪潮中，大型模型如BERT、GPT系列等在自然语言处理（NLP）、计算机视觉（CV）等领域取得了显著的成果。然而，这些“庞然大物”通常拥有数十亿甚至数千亿个参数，计算和存储成本极高，难以部署到资源受限的设备上。为了解决这一问题，模型蒸馏技术应运而生。模型蒸馏是一种将大型复杂模型的知识迁移到小型简单模型的技术，旨在保持高性能的同时大幅减少模型的参数量和计算复杂度。本文将带你深入了解模
【Python】构建Web应用的首选：Flask框架基础与实战萧鼎 python基础到进阶教程 python 前端 flask
构建Web应用的首选：Flask框架基础与实战在Python的Web开发生态中，Flask框架以其轻量、灵活和易用的特性成为构建Web应用的首选之一。无论是快速搭建一个小型应用原型，还是构建复杂的后端服务，Flask都提供了便捷的接口和丰富的扩展支持。本博客将介绍Flask的基础知识和核心概念，并通过一个简单的实例展示如何用Flask构建Web应用。一、Flask框架简介Flask是由ArminR
flask--基础知识点--6--flask高并发处理 Raging__Fire #flask python flask
Flask是一个轻量级的PythonWeb框架，适合构建中小型应用。但是，对于高并发场景，Flask本身可能需要一些辅助工具和配置来提升性能。以下是一些优化Flask应用以处理高并发的方法：1.使用WSGI服务器Flask自带的开发服务器性能和稳定性不足以应对生产环境中的高并发请求，可以考虑使用更强大的WSGI服务器，如：Gunicorn:一个基于Python的WSGIHTTP服务器。uWSGI:
守护网站安全的隐形卫士——SSL证书全解析安全
在网络世界中，保护用户数据的安全至关重要。无论你是经营一家小型网店还是管理大型企业网站，确保客户信息的安全性都是不可忽视的任务。今天，我们就来揭开一个默默守护网站安全的重要角色——SSL证书的神秘面纱。什么是SSL证书？SSL（SecureSocketsLayer）证书是一种数字证书，用于加密客户端与服务器之间的通信，确保数据传输过程中的安全性。简单来说，当您访问一个启用SSL证书的网站时，您的浏
MySQL的基本使用咖啡の猫 mysql 数据库
MySQL作为最流行的关系型数据库管理系统之一，被广泛应用于各种规模的应用程序中。无论是构建小型个人项目还是大型企业级应用，掌握MySQL的基础使用对于开发者来说都是必不可少的技能。本文将带你从零开始，学习如何使用MySQL进行基本的数据操作。一、连接到MySQL服务器在开始任何操作之前，首先需要确保你已经安装并运行了MySQL服务器，并且能够通过客户端工具或命令行接口连接到它。使用命令行连接：打
Rust Web开发常用库 cci497 后端 rust 开发语言后端
本集合中所有库都是在开源项目中广泛使用且在2024年积极维护的库，排名靠前的库是当前使用比较广泛的，不全面但够用Rust异步运行时tokio：异步运行时async_std：与标准库兼容性较强的运行时monoio：字节开源smol：一个小型快速的运行时RustWeb框架&网络通信其他Web框架见https://juejin.cn/post/7406997325715554315axum：注重人体工程
响应式设计已死？流体布局才是未来！前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读在当今的Web设计领域，挑战从未如此巨大。各种屏幕尺寸和分辨率的智能设备层出不穷，要让网站在所有设备上保持一致的用户体验，难度可想而知。但别担心，流体布局（FluidLayout）正是为了解决这一问题而生。它不仅适用于超大屏幕，同样也能完美适配小型移动设备，真正做到自适应！接下来，我们深入了解流体布局的原理
SQLite Truncate Table lsx202406 开发语言
SQLiteTruncateTableSQLite是一种轻量级的数据库管理系统，常用于嵌入式系统和小型应用程序。在处理数据库时，有时需要删除表中的所有数据，但保留表结构。这时，TRUNCATETABLE语句就派上用场了。本文将详细介绍SQLite中的TRUNCATETABLE语句，包括其用法、性能影响以及与DELETE语句的区别。1.简介TRUNCATETABLE语句用于删除表中的所有数据，但保留
Linux---sqlite3数据库磨十三数据库 linux sqlite
一、数据库分类1.按数据关系分类类型特点代表产品关系型数据库-使用SQL（结构化查询语言）-数据以行列形式存储，支持事务和复杂查询MySQL、Oracle、SQLite非关系型数据库-无固定表结构（如键值对、文档、图）-高扩展性，适合非结构化数据MongoDB、Redis2.按功能规模分类类型特点代表产品大型数据库高并发、高可用性，支持企业级应用Oracle、DB2中型数据库适用于中小型企业，跨平
mysql、oracle、SQLserver之间的区别和优势噔噔噔噔@ mysql oracle sqlserver
MySQL、Oracle和SQLServer都是常见的关系型数据库管理系统（RDBMS），它们在某些方面有一些区别和优势。MySQL：MySQL是一种开源的RDBMS，由Oracle公司开发和维护。它具有快速、稳定和易于使用的特点。MySQL适用于中小型应用和网站，它在处理大量简单的查询时表现较好。MySQL对于开发者来说是免费的，但也有商业版提供更多高级功能。Oracle：Oracle是一种商业
vue面试题阡陌路人前端面试题 vue
一、mvc与mvvm的区别俩者都为开发架构，，后端用的比较多的是mvc，前端则是mvvm，移动端俩者都有。MVC是包括view视图层、controller控制层、model数据层。各部分之间的通信都是单向的。适合大型项目。MVVM包括view视图层、model数据层、viewmodel层。各部分通信都是双向的。适合小型项目。二、vue的事件修饰符.stop阻止冒泡，由内到外.prevent阻止默认
中小型企业如何利用远程控制方案来降低40%运维成本的 2501_90729959 RayLink 远程控制软件远程控制运维大数据数据库
在数字化转型的浪潮下，中小型企业普遍面临着运维成本高、技术响应慢、跨区域管理难等三大痛点。据IDC的调研数据显示，有43%的中小企业IT预算超支，而这些超支大多是由于线下运维产生的差旅、人力以及设备闲置成本。不过，远程控制技术的成熟应用，正在为企业打开降本增效的新思路。通过部署专业的远程控制方案，企业有望实现40%以上的运维成本缩减。那么，中小型企业该如何做到呢？一、为啥远程控制方案成了中小企业的
Kubernetes核心组件详解：从原理到实践 ivwdcwso 运维 kubernetes 容器云原生 k8s
引言在云原生时代，Kubernetes（简称k8s）已成为容器编排的事实标准。无论是小型创业公司还是全球性企业，都在使用它管理复杂的分布式系统。但你是否好奇过，这个强大的系统内部是如何运作的？本文将深入剖析Kubernetes的核心组件，揭示其设计哲学与协作机制，帮助开发者、运维人员及架构师真正理解其底层逻辑。©ivwdcwso(ID:u012172506)一、Kubernetes架构全景Kube
服务器搭建全流程 yzx991013 服务器运维
服务器搭建全流程指南（2025年最新版）一、硬件与服务器选择‌硬件类型‌‌云服务器‌：推荐阿里云、腾讯云等平台，支持按需付费，适合个人及中小型项目‌‌物理服务器‌：戴尔PowerEdge、惠普ProLiant等企业级设备，适合高并发或大存储需求‌‌个人电脑/NAS‌：通过内网穿透工具（如神卓互联）实现公网访问，适合测试或小型文件服务‌‌硬件配置建议‌‌CPU‌：至少4核（如Inteli5或AMDR
计算机软著项目推荐 yzx991013 python 数据库算法线性回归回归机器人
作为学生用户，软件技术专业一、‌选题方向建议‌‌非热门领域工具类软件‌避免人工智能、元宇宙等当前审核严格的热门方向‌。优先选择‌实用工具类软件‌，如数据处理工具、代码优化插件、校园管理系统（如考勤、选课、实验室预约系统）等‌。‌行业垂直应用‌针对‌教育、医疗、金融‌等细分领域开发软件，例如：学生成绩分析系统医疗数据管理工具小型金融计算器（如利息、汇率转换）‌。‌模块化拆分开发‌将复杂系统拆分为独立
微电网管理实现分布式能源的智能调度和管理小赖同学啊智能硬件分布式能源
微电网（Microgrid）是一种小型电力系统，能够独立运行或与主电网并网运行。它通常包含分布式能源（如太阳能、风能、储能系统）和负载，通过智能调度和管理实现高效、可靠的能源供应。物联网（IoT）技术在微电网管理中发挥着关键作用，能够实现分布式能源的智能调度和管理。以下是具体的解决方案和技术路径：1.实现目标能源优化调度：根据能源供需情况，智能调度分布式能源，提高能源利用效率。实时监控：实时监测微
【漏洞复现】用友NC-accept-任意文件上传 .Rain. 漏洞复现 web安全漏洞复现
目录0x01产品简介0x02漏洞概述0x03网络测绘0x04漏洞复现0x05Nuclei0x01产品简介用友NC是北京用友软件股份有限公司（简称“用友”）开发的一款企业管理软件，支持财务会计、人力资源、供应链、生产制造、客户关系管理等多个业务领域，涵盖了企业核心业务及管理流程。用友NC是基于B/S架构的软件系统，提供基于云计算、SaaS模式、本地部署等多种部署方式，广泛应用于国内外众多中小型企业和
JVM的垃圾回收器都有哪些？ yyueshen jvm 测试工具
在Java虚拟机（JVM）中，不同的垃圾回收器采用不同的算法和策略，以满足不同应用场景的性能需求。以下为你详细介绍常见的JVM垃圾回收器：新生代垃圾回收器1.Serial收集器特点：单线程的垃圾回收器，在进行垃圾回收时，必须暂停其他所有的工作线程（StopTheWorld，简称STW），直到垃圾回收完成。适用场景：适用于客户端模式下的小型应用程序，因为它的实现简单，没有线程交互的开销，在单CPU环
Phi-4-multimodal：图、文、音频统一的多模态大模型架构、训练方法、数据细节余俊晖大语言模型多模态 LLM 多模态
Phi-4-Multimodal是一种参数高效的多模态模型，通过LoRA适配器和模式特定路由器实现文本、视觉和语音/音频的无缝集成。训练过程包括多阶段优化，确保在不同模式和任务上的性能，数据来源多样，覆盖高质量网络和合成数据。它的设计体现了小型语言模型在多模态任务上的潜力模型架构Phi-4-Multimodal的基础是Phi-4-Mini语言模型，这是一个3.8亿参数的模型，设计为高效处理文本任务
【笔试面试】秒懂深度学习模型小型化：蒸馏法、剪枝… 聊北辰同学轻量级神经网络神经网络深度学习机器学习数据挖掘
蒸馏：主要思想是，通过大模型指导小模型学习。剪枝：网络剪枝的主要思想就是将权重矩阵中相对“不重要”的权值剔除，然后再重新finetune网络进行微调。紧凑模型设计：MobileNet的深度可分离卷积shufflenet的逐点群卷积(pointwisegroupconvolution)和通道混洗(channelshuffle)，前者通过分组卷积降低计算量，后者促进信息在不同组之间流转
计算机视觉深度学习入门（4） yyc_audio 计算机视觉人工智能计算机视觉深度学习神经网络
在小型数据集上从头开始训练一个卷积神经网络利用少量数据来训练图像分类模型，这是一种很常见的情况。如果你从事与计算机视觉相关的职业，那么很可能会在实践中遇到这种情况。“少量”样本既可能是几百张图片，也可能是上万张图片。我们来看一个实例——猫狗图片分类，数据集包含5000张猫和狗的图片（2500张猫的图片，2500张狗的图片）。我们将2000张图片用于训练，1000张用于验证，2000张用于测试。将介
【FFmpeg】AVpacket中解析出Nalu gma999 ffmpeg
概述项目中遇到的一个难题，即需要从RTSP流地址中解析出来Nalu，然后对Nalu进行封包发送到GB28181平台。本文仅仅总结如何利用FFmpeg库中的函数通过AVpacket解析出来Nalu的可行性以及方法。如果是非嵌入式设备，也可以自己搭建一个小型RTSP服务器来实现，其中各种功能也可以自行控制，后面文章再进行总结源码分析可行性分析FFmpeg库中没有找到直接解析出来的Nalu的方法，如果无
突破美业经营困境：数字化工具如何助力门店提升效 shboka920702 大数据人工智能科技生活
在美业行业中，门店经营者们每天都在面临各种各样的挑战。无论是小型美容院还是大型连锁机构，传统管理方式的弊端逐渐显现，效率低下、数据混乱、客户流失、员工管理困难等问题层出不穷。这些问题不仅影响了门店的日常运营，还直接压缩了利润空间。那么，如何在竞争激烈的市场中脱颖而出，实现高效管理和持续增长呢？行业现状与痛点分析1.传统管理方式效率低下，数据混乱许多美业门店仍然依赖手工记录或简单的电子表格来管理客户
美发店管理升级：数字化如何解决账务与提成的痛点 shboka920702 科技生活大数据人工智能
在美发行业，账务核对和员工业绩提成计算一直是经营者面临的两大难题。无论是小型美发店还是大型连锁美容院，每天都会面临大量的交易流水、会员卡充值、产品消费等复杂的财务数据。与此同时，员工的提成计算也因服务项目多样、提成比例不同而变得繁琐。这些问题不仅耗费大量时间，还容易出错，导致经营者难以专注于业务拓展和服务提升。传统账务核对的痛点在传统的美发店管理中，账务核对通常依赖于手工记录和Excel表格。每天
无人机热点共享无线连接技术概述云卓SKYDROID 无人机智能手机电脑人工智能云卓科技
一、技术优势便捷性与低成本无人机通过WLAN热点共享技术，无需额外硬件即可实现设备间的无线连接。用户只需通过手机、平板等支持Wi-Fi的设备扫描热点即可快速接入，操作门槛低。相比专用通信模块（如4G/5G或卫星通信），WLAN技术成本更低，适合消费级无人机和中小型商业应用。实时高清数据传输支持高清图像和视频的实时传输，适用于航拍直播、监控等场景。例如，2K/4K分辨率视频可通过Wi-Fi6技术实现
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
2025 年，微服务架构和大模型能 “玩出” 什么新花样？字节跳动开源架构微服务人工智能
2025年开年，DeepSeek开源模型以“低成本、高性能”成功掀起AI平价化浪潮，并以惊人的速度渗透至各个领域。在AI平价化浪潮的推动下，微服务架构正迎来前所未有的变革机遇。微服务架构通过将系统拆解为多个小型、独立的服务，每个服务运行在自己的进程中，负责特定的业务功能。与单体架构相比，微服务架构实现了更高的灵活性、可扩展性和可维护性，这些特性使其成为现代软件开发的首选。然而，随着企业应用规模和复
5、请简述公司的系统服务架构类型（单体架构、分布式架构、微服务架构、分层架构、集群架构、SOA 架构、中台架构）静静在思考面试经验架构分布式微服务
以下是对公司常见的系统服务架构类型的简述及架构图说明：单体架构简述：将所有功能集成在一个项目中，作为一个整体进行开发、部署和运行，所有业务逻辑、数据访问等都在一个进程内。适用于小型项目或业务简单的场景，开发、部署和维护相对简单。架构图用户界面业务逻辑数据访问数据库分布式架构简述：把系统拆分为多个子系统或服务，分布在不同节点上独立运行，通过网络通信协作完成业务功能，可扩展性和可靠性较高，能应对大规模
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb