johnhill_

阿里云环境部署k8s集群

网上讲述如何部署k8s集群的文章很多，特别是k8s中文社区里面，每个平台的部署方式都有详细说明。但就是看了中文社区的指导，发现一路是坑，第一个源访问的时候就404 NotFound，更别说那生涩的翻译和版本匹配问题。

如此一来还不如自己写一个。

1. 开虚机

系统环境CentOS 7.2 . 这方面不再赘述

2. 设置/etc/hosts

简单来说就是把master和minion主机都用域名在hosts文件中记录一下。

3. 集群主机都安装kubernetes和etcd

直接yum install . 安装kubernetes 时会顺带把docker等都安装上。此文章编写时，阿里云的kubernetes版本为1.5.2.

这里还需要注意：应该在etcdctl中配置flannel，否则flannel无法正常启动。

[root@k8s-master home]# etcdctl set /flannel/network/config '{ "Network": "172.16.0.0/16", "SubnetLen": 24, "Backend": { "Type": "vxlan" } }'

4. 配置apiserver

按照中文社区的指导配置（但最终并没有使用该配置，看下去就知道）

修改/etc/kubernetes/apiserver

修改/etc/kubernetes/config

由于这条路不通，具体修改内容就不贴了。

5. master配置启动脚本

#/bin/bash
for SERVICES in etcd kube-apiserver kube-controller-manager kube-scheduler; do
systemctl restart $SERVICES
systemctl enable $SERVICES
systemctl status $SERVICES
done

走到这里，按照中文社区的指导，应该就能直接起来了。但其实并不能！！！

收到以下错误：

Sep 29 17:06:15 debug010000002015 kube-apiserver: W0929 17:06:15.881473   21259 handlers.go:50] Authentication is disabled
Sep 29 17:06:15 debug010000002015 kube-apiserver: [restful] 2018/09/29 17:06:15 log.go:30: [restful/swagger] listing is available at https://172.16.7.93:6443/swaggerapi/
Sep 29 17:06:15 debug010000002015 kube-apiserver: [restful] 2018/09/29 17:06:15 log.go:30: [restful/swagger] https://172.16.7.93:6443/swaggerui/ is mapped to folder /swagger-ui/
Sep 29 17:06:15 debug010000002015 kube-apiserver: E0929 17:06:15.984071   21259 reflector.go:199] k8s.io/kubernetes/plugin/pkg/admission/resourcequota/resource_access.go:83: Failed to list *api.ResourceQuota: Get http://127.0.0.1:18080/api/v1/resourcequotas?resourceVersion=0: dial tcp 127.0.0.1:18080: getsockopt: connection refused
Sep 29 17:06:15 debug010000002015 kube-apiserver: E0929 17:06:15.984217   21259 reflector.go:199] pkg/controller/informers/factory.go:89: Failed to list *api.Namespace: Get http://127.0.0.1:18080/api/v1/namespaces?resourceVersion=0: dial tcp 127.0.0.1:18080: getsockopt: connection refused
Sep 29 17:06:15 debug010000002015 kube-apiserver: E0929 17:06:15.987986   21259 reflector.go:199] pkg/controller/informers/factory.go:89: Failed to list *api.LimitRange: Get http://127.0.0.1:18080/api/v1/limitranges?resourceVersion=0: dial tcp 127.0.0.1:18080: getsockopt: connection refused
Sep 29 17:06:16 debug010000002015 kube-apiserver: F0929 17:06:16.058072   21259 genericapiserver.go:189] unable to load server certificate: open /var/run/kubernetes/apiserver.key: permission denied
Sep 29 17:06:16 debug010000002015 systemd: kube-apiserver.service: main process exited, code=exited, status=255/n/a
Sep 29 17:06:16 debug010000002015 systemd: Failed to start Kubernetes API Server.
Sep 29 17:06:16 debug010000002015 systemd: Unit kube-apiserver.service entered failed state.
Sep 29 17:06:16 debug010000002015 systemd: kube-apiserver.service failed.
Sep 29 17:06:16 debug010000002015 systemd: kube-apiserver.service holdoff time over, scheduling restart.

查询了Google和Baidu都无果。

但是测试发现直接用命令行启动kube-api 是成功的。因此只好采取直接修改systemctl service文件的做法。

修改kube-apiserver.service的启动脚本，路径是 /lib/systemd/system/kube-apiserver.service

内容如下：

[root@k8s-master home]# vi /lib/systemd/system/kube-apiserver.service 

[Unit]
Description=Kubernetes API Service
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
After=network.target
After=etcd.service

[Service]
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/apiserver
#ExecStart=/usr/bin/kube-apiserver \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBE_ETCD_SERVERS \
#           $KUBE_API_ADDRESS \
#           $KUBE_API_PORT \
#           $KUBELET_PORT \
#           $KUBE_ALLOW_PRIV \
#           $KUBE_SERVICE_ADDRESSES \
#           $KUBE_ADMISSION_CONTROL \
#           $KUBE_API_ARGS

ExecStart=/usr/bin/kube-apiserver --allow_privileged=true --logtostderr=false --v=6 --log-dir=/var/log/k8s/kube-apiserver --insecure-bind-address=0.0.0.0 --insecure-port=8080 --admission_control=NamespaceLifecycle,NamespaceExists,LimitRanger,ResourceQuota,ServiceAccount,AlwaysPullImages,SecurityContextDeny --etcd_servers=http://x.x.x.x:2379 --master-service-namespace=master --secure-port=6443 --bind-address=0.0.0.0 --service-cluster-ip-range=10.0.0.0/16 --max-requests-inflight=1000 --storage-backend=etcd3 --tls-cert-file=/etc/kubernetes/pki/apiserver.pem \
            --tls-private-key-file=/etc/kubernetes/pki/apiserver-key.pem \
            --client-ca-file=/etc/kubernetes/pki/ca.pem \
            --service-account-key-file=/etc/kubernetes/pki/ca-key.pem
KillMode=control-group
Restart=on-failure
RestartSec=10

[Install]
WantedBy=multi-user.target

其中： --etcd_servers=http://xx.xx.xx.xx:2379 为本机eth0网卡IP,需要替换。

相关ssl文件需要用openssl自己生成。或者使用insecure模式。

将 etcd的配置文件，路径如下：/etc/etcd/etcd.conf ，其中下述内容由监听本地回环改为监听0.0.0.0

ETCD_LISTEN_CLIENT_URLS="http://0.0.0.0:2379"
ETCD_ADVERTISE_CLIENT_URLS="http://0.0.0.0:2379"

修改flannel.service文件

[root@k8s-master home]# vi /lib/systemd/system/flanneld.service 

[Unit]
Description=Flanneld overlay address etcd agent
After=network.target
After=network-online.target
Wants=network-online.target
After=etcd.service
Before=docker.service

[Service]
Type=notify
EnvironmentFile=/etc/sysconfig/flanneld
EnvironmentFile=-/etc/sysconfig/docker-network
ExecStart=/usr/bin/flanneld -etcd-endpoints=http://x.x.x.x:2379 -etcd-prefix=/flannel/network -iface=eth0
#ExecStart=/usr/bin/flanneld-start $FLANNEL_OPTIONS
#ExecStartPost=/usr/libexec/flannel/mk-docker-opts.sh -k DOCKER_NETWORK_OPTIONS -d /run/flannel/docker
Restart=on-failure

[Install]
WantedBy=multi-user.target
WantedBy=docker.service

其中： --etcd_servers=http://xx.xx.xx.xx:2379 为本机eth0网卡IP,需要替换。

修改kube-controller-manager.service文件

[root@k8s-master home]# vi /lib/systemd/system/kube-controller-manager.service 

Description=Kubernetes Controller Manager
Documentation=https://github.com/GoogleCloudPlatform/kubernetes

[Service]
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/controller-manager
#ExecStart=/usr/bin/kube-controller-manager \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBE_MASTER \
#           $KUBE_CONTROLLER_MANAGER_ARGS

ExecStart=/usr/bin/kube-controller-manager --logtostderr=false --v=6 --log-dir=/var/log/k8s/kube-controller-manager --namespace-sync-period=5m0s --node-monitor-grace-period=40s --node-monitor-period=5s --node-startup-grace-period=1m0s --node-sync-period=10s --pod-eviction-timeout=5m0s --pvclaimbinder-sync-period=10s --register-retry-count=20    --kubeconfig=/etc/kubernetes/controller-manager.conf \
            --cluster-name=kubernetes \
            --service-cluster-ip-range=10.0.0.0/16 \
            --cluster-signing-cert-file=/etc/kubernetes/pki/ca.pem \
            --cluster-signing-key-file=/etc/kubernetes/pki/ca-key.pem \
            --service-account-private-key-file=/etc/kubernetes/pki/ca-key.pem \
            --root-ca-file=/etc/kubernetes/pki/ca.pem

Restart=on-failure
LimitNOFILE=65536

[Install]
WantedBy=multi-user.target

修改kube-scheduler.service文件

[root@k8s-master home]# vi /lib/systemd/system/kube-scheduler.service 

[Unit]
Description=Kubernetes Scheduler Plugin
Documentation=https://github.com/GoogleCloudPlatform/kubernetes

[Service]
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/scheduler
#ExecStart=/usr/bin/kube-scheduler \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBE_MASTER \
#           $KUBE_SCHEDULER_ARGS

ExecStart=/usr/bin/kube-scheduler --logtostderr=false --v=6 --log-dir=/var/log/k8s/kube-scheduler --algorithm-provider=DefaultProvider --kubeconfig=/etc/kubernetes/scheduler.conf

Restart=on-failure
LimitNOFILE=65536

[Install]
WantedBy=multi-user.target

修改kube-proxy.service文件

[root@k8s-master home]# vi /lib/systemd/system/kube-proxy.service 

[Unit]
Description=Kubernetes Kube-Proxy Server
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
After=network.target

[Service]
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/proxy
#ExecStart=/usr/bin/kube-proxy \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBE_MASTER \
#           $KUBE_PROXY_ARGS

ExecStart=/usr/bin/kube-proxy --master=http://x.x.x.x:8080 --hostname-override=k8s-master --proxy-mode=iptables -v=6 --logtostderr=false --log-dir=/var/log/k8s/kube-proxy
Restart=on-failure
LimitNOFILE=65536

[Install]
WantedBy=multi-user.target

其中 xx.xx.xx.xx:8080 为本机eth0网卡IP,需要替换。

修改kubelet.service文件

[root@k8s-master home]# vi /lib/systemd/system/kubelet.service 

[Unit]
Description=Kubernetes Kubelet Server
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
After=docker.service
Requires=docker.service

[Service]
WorkingDirectory=/var/lib/kubelet
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/kubelet
#ExecStart=/usr/bin/kubelet \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBELET_API_SERVER \
#           $KUBELET_ADDRESS \
#           $KUBELET_PORT \
#           $KUBELET_HOSTNAME \
#           $KUBE_ALLOW_PRIV \
#           $KUBELET_POD_INFRA_CONTAINER \
#           $KUBELET_ARGS

ExecStart=/usr/bin/kubelet --allow-privileged=true \
        --logtostderr=false \
        --v=6 \
        --log-dir=/var/log/k8s/kubelet \
        --address=x.x.x.x \
        --cluster-dns=10.0.1.10 \
        --hostname-override=k8s-master \
        --cluster-domain=cluster.local \
        --kubeconfig=/etc/kubernetes/kubelet.conf \
        --pod-manifest-path=/etc/kubernetes/manifest \
        --allow-privileged=true \
        --authorization-mode=AlwaysAllow \
        --fail-swap-on=false \
        --cgroup-driver=systemd \
        --pod-infra-container-image=registry.aliyuncs.com/archon/pause-amd64:3.0

Restart=on-failure

[Install]
WantedBy=multi-user.target

其中 xx.xx.xx.xx 为本机eth0网卡IP,需要替换。

registry.aliyuncs.com/archon/pause-amd64:3.0 来源自https://segmentfault.com/q/1010000008763165/a-1020000008824481

完毕后，再运行启动脚本，此时所有组件都能够正常启动。

6. minion配置文件

路径为： /etc/kubernetes/kubelet 以及 /etc/kubernetes/config

config文件内容如下：

###
# kubernetes system config
#
# The following values are used to configure various aspects of all
# kubernetes services, including
#
#   kube-apiserver.service
#   kube-controller-manager.service
#   kube-scheduler.service
#   kubelet.service
#   kube-proxy.service
# logging to stderr means we get it in the systemd journal
KUBE_LOGTOSTDERR="--logtostderr=true"

# journal message level, 0 is debug
KUBE_LOG_LEVEL="--v=0"

# Should this cluster be allowed to run privileged docker containers
KUBE_ALLOW_PRIV="--allow-privileged=false"

# How the controller-manager, scheduler, and proxy find the apiserver
KUBE_MASTER="--master=http://k8s-master:8080"

# Comma separated list of nodes in the etcd cluster
KUBE_ETCD_SERVERS=”–etcd_servers=http://k8s-master:4001″

# logging to stderr means we get it in the systemd journal

kubelet文件如下：


###
# kubernetes kubelet (minion) config

# The address for the info server to serve on (set to 0.0.0.0 or "" for all interfaces)
KUBELET_ADDRESS="--address=0.0.0.0"

# The port for the info server to serve on
# KUBELET_PORT="--port=10250"

# You may leave this blank to use the actual hostname
KUBELET_HOSTNAME="--hostname-override=k8s-slave"

# location of the api-server
KUBELET_API_SERVER="--api-servers=http://k8s-master:8080"

# pod infrastructure container
KUBELET_POD_INFRA_CONTAINER="--pod-infra-container-image=registry.access.redhat.com/rhel7/pod-infrastructure:latest"

# Add your own!
KUBELET_ARGS=""

验证服务状态：

[root@k8s-slave home]# kubectl get cs
NAME                 STATUS    MESSAGE              ERROR
scheduler            Healthy   ok                   
controller-manager   Healthy   ok                   
etcd-0               Healthy   {"health": "true"}

6. minion配置启动脚本

修改kube-proxy.service文件

[root@k8s-slave home]# vi /lib/systemd/system/kube-proxy.service 

[Unit]
Description=Kubernetes Kube-Proxy Server
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
After=network.target

[Service]
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/proxy
#ExecStart=/usr/bin/kube-proxy \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBE_MASTER \
#           $KUBE_PROXY_ARGS

ExecStart=/usr/bin/kube-proxy --master=http://x.x.x.x:8080 --hostname-override=k8s-slave --proxy-mode=iptables -v=6 --logtostderr=false --log-dir=/var/log/k8s/kube-proxy

Restart=on-failure
LimitNOFILE=65536

[Install]
WantedBy=multi-user.target

其中 xx.xx.xx.xx 为master eth0网卡IP,需要替换。

修改kubelet配置文件

[root@k8s-slave home]# vi /lib/systemd/system/kubelet.service 

[Unit]
Description=Kubernetes Kubelet Server
Documentation=https://github.com/GoogleCloudPlatform/kubernetes
After=docker.service
Requires=docker.service

[Service]
WorkingDirectory=/var/lib/kubelet
EnvironmentFile=-/etc/kubernetes/config
EnvironmentFile=-/etc/kubernetes/kubelet
#ExecStart=/usr/bin/kubelet \
#           $KUBE_LOGTOSTDERR \
#           $KUBE_LOG_LEVEL \
#           $KUBELET_API_SERVER \
#           $KUBELET_ADDRESS \
#           $KUBELET_PORT \
#           $KUBELET_HOSTNAME \
#           $KUBE_ALLOW_PRIV \
#           $KUBELET_POD_INFRA_CONTAINER \
#           $KUBELET_ARGS

ExecStart=/usr/bin/kubelet --allow-privileged=true \
        --logtostderr=false \
        --v=6 \
        --log-dir=/var/log/k8s/kubelet \
        --address=0.0.0.0 \
        --cluster-dns=10.0.1.10 \
        --hostname-override=k8s-slave \
        --cluster-domain=cluster.local \
        --kubeconfig=/etc/kubernetes/kubelet.conf \
        --pod-manifest-path=/etc/kubernetes/manifest \
        --allow-privileged=true \
        --authorization-mode=AlwaysAllow \
        --fail-swap-on=false \
        --cgroup-driver=systemd \
        --pod-infra-container-image=registry.aliyuncs.com/archon/pause-amd64:3.0

Restart=on-failure

[Install]
WantedBy=multi-user.target

在etc/profile文件末尾添加以下内容：

export KUBERNETES_MASTER=http://x.x.x.x:8080

其中 xx.xx.xx.xx 为master eth0网卡IP,需要替换。

for SERVICES in kube-proxy kubelet docker; do
systemctl restart $SERVICES
systemctl enable $SERVICES
systemctl status $SERVICES
done

运行启动脚本，此时所有服务可以正常启动。

验证服务状态：

[root@k8s-slave home]# kubectl get nodes
NAME         STATUS    ROLES     AGE       VERSION
k8s-master   Ready         3h        v1.9.0
k8s-slave    Ready         2h        v1.9.0

至此集群部署完毕。

RHEL 安装 Hadoop 服务器 XhClojure hadoop 服务器大数据
在这篇文章中，我们将探讨如何在RedHatEnterpriseLinux(RHEL)上安装和配置Hadoop服务器。Hadoop是一个开源的分布式数据处理框架，用于处理大规模数据集。以下是在RHEL上安装Hadoop的详细步骤。步骤1：安装Java在安装Hadoop之前，我们需要确保系统上安装了JavaDevelopmentKit(JDK)。执行以下命令安装JDK：sudoyuminstallja
LLM的分布式部署：AI的云端革命 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《LLM的分布式部署：AI的云端革命》关键词分布式部署语言模型云端计算资源管理性能优化安全性摘要本文将深入探讨大型语言模型（LLM）的分布式部署，分析其技术背景、架构设计、资源管理、性能优化以及安全性等方面。通过对LLM分布式部署的关键技术进行详细介绍，我们旨在为读者提供一个全面、系统的理解，以及展望未来LLM分布式部署的发展趋势。目录大纲第一部分：分布式部署概述第1章：分布式系统基础第2章：LL
zookeeper从入门到精通小四的快乐生活 zookeeper 分布式云原生
一、入门基础1.1什么是ZooKeeperZooKeeper是一个开源的分布式协调服务，由雅虎创建，后成为Apache的顶级项目。它为分布式应用提供了高效、可靠的协调服务，例如统一命名服务、配置管理、分布式锁、集群管理等。ZooKeeper的数据模型类似文件系统，以树形结构存储数据，每个节点称为Znode，每个Znode可以存储数据和子节点。1.2安装与启动下载ZooKeeper：从ApacheZ
docker配置Redis主从复制原理及操作纪佰伦 docker redis 主从分布式
一、前言要配置Redis主从复制，我默认是了解过Redis的持久化功能的，也就是RDB和AOF，只需要简单了解过即可。持久化的一个作用就是可以定期将内存中的数据备份到硬盘，在系统发生故障的时候，也可以通过持久化文件回复数据，二、关于主从复制1、什么是主从复制主从复制是一种分布式系统数据同步技术，其中主服务器负责处理所有写操作并将变更同步到一个或多个从服务器。从服务器接收这些变更并复制主服务器的数据
消息队列MQ技术的原理和IBM MQ的基本操作 Chelseady python python
消息队列技术是分布式应用间交换信息的一种技术。消息队列可驻留在内存或磁盘上,队列存储消息直到它们被应用程序读走。通过消息队列，应用程序可独立地执行--它们不需要知道彼此的位置、或在继续执行前不需要等待接收程序接收此消息。消息中间件概述消息队列技术是分布式应用间交换信息的一种技术。消息队列可驻留在内存或磁盘上,队列存储消息直到它们被应用程序读走。通过消息队列，应用程序可独立地执行--它们不需要知道彼
如果MLlib 中没有所需要的模型，如何使用 Spark 进行分布式训练？是纯一呀 WSL Docker AI spark 分布式 mllib
如果MLlib中没有你所需要的模型，并且不打算结合更强大的框架（如TensorFlowOnSpark或Horovod），仍然可以使用Spark进行分布式训练，但需要手动处理训练任务的分配、数据准备、模型训练、结果合并和模型更新等过程。模型训练阶段将模型的训练任务分配到Spark集群的各个节点。数据并行：每个节点会处理数据的不同部分，并计算该部分的梯度或模型参数。自定义算法：如果使用的是自定义算法（
【分布式理论12】事务协调者高可用：分布式选举算法 roman_日积跬步-终至千里分布式架构分布式算法
文章目录一、分布式系统中事务协调的问题二、分布式选举算法1.Bully算法2.Raft算法3.ZAB算法三、小结与比较一、分布式系统中事务协调的问题在分布式系统中，常常有多个节点（应用）共同处理不同的事务和资源。前文【分布式理论9】分布式协同：分布式系统进程互斥与互斥算法【分布式理论10】分布式协同：分布式互斥算法最佳实现：分布式锁的原理与实现【分布式理论11】分布式协同之分布式事务中介绍了分布式
【分布式理论16】分布式调度2：资源划分和调度策略 roman_日积跬步-终至千里分布式架构分布式
文章目录一、资源划分：Linux容器的应用1.LXC的Namespace机制：资源隔离2.LXC的CGroup机制：资源管理二、任务与资源如何匹配1.任务队列与资源池2.资源调度策略在分布式系统中，资源的有效分配和调度是确保计算任务高效执行的关键。为了能够合理地利用系统资源并优化计算任务的执行，资源划分和调度策略显得尤为重要。本节将从Linux容器资源划分、资源池与任务队列的匹配，以及不同的调度策
探索Vearch：高效的深度学习向量相似度搜索系统 scaFHIO 深度学习人工智能 python
Vearch是一个可扩展的分布式系统，用于高效搜索深度学习向量的相似度。在本文中，我们将介绍Vearch的技术背景及其核心原理，演示如何使用VearchPythonSDK进行安装和设置，并分析一些实际应用场景，最后提供一些实战建议。技术背景介绍随着深度学习技术的发展，向量相似度搜索在各类应用中变得越来越重要。从图像识别、推荐系统到自然语言处理，向量搜索可以极大地提升系统的性能。然而，随着数据量的增
分布式理论与分布式算法红衣女妖仙 spring cloud 分布式分布式定理分布式算法
分布式定义、主要目标、优缺点、与集中式区别；分布式CAP定理、PACELC理论、BASE理论的核心观点、应用场景等；分布式算法如Paxos算法、Raft算法、Gossip算法、两阶段提交（2PC）、三阶段提交（3PC）、一致性哈希算法、Bully算法、Chord算法等算法的核心思想、角色、算法过程、特性、应用场景和变种等。——2025年2月3日甲辰年正月初六立春目录1分布式1.1分布式定义1.
华为的云端训练算力与迭代效率 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能（AI）技术近年来发展迅速，深度学习作为其核心驱动力，在图像识别、自然语言处理、语音识别等领域取得了突破性进展。然而，深度学习模型的训练需要海量数据和强大的计算资源，这成为AI技术发展面临的瓶颈之一。云计算作为一种新型的计算模式，为深度学习提供了强大的算力支持。华为云作为国内领先的云计算平台，在
JAVA EE初阶 - 预备知识（三） 2025年一定要上岸 java-ee java
一、中间件中间件是一种处于操作系统和应用程序之间的软件，它能够为分布式应用提供交互、资源共享、数据处理等功能，是现代软件架构中不可或缺的一部分。下面从多个方面为你详细介绍中间件：定义与作用定义：中间件是连接两个或多个软件组件或应用程序的软件层，它屏蔽了底层操作系统和网络的复杂性，为开发者提供了统一的编程接口和开发环境，使得不同的应用程序可以方便地进行通信和协作。作用简化开发：开发者无需关注底层的通
C#的序列化[Serializable()] CoderIsArt C#c#开发语言
[Serializable]是.NET框架中的一个特性（Attribute），用于标记一个类、结构体、枚举或委托可以被序列化。序列化是将对象的状态转换为可以存储或传输的格式（如二进制、XML或JSON）的过程，以便在需要时可以重新创建该对象。主要用途：持久化存储：将对象的状态保存到文件或数据库中，以便后续恢复。跨进程或跨机器传输：在分布式系统中，将对象通过网络传输到其他进程或机器。深拷贝对象：通过
Git入门与进阶：详细使用指南向着开发进攻 git git
Git入门与进阶：详细使用指南Git是一款强大的分布式版本控制工具，广泛用于软件开发中的源代码管理。无论你是一个刚刚开始学习编程的新手，还是一个已经有经验的开发者，Git都是你日常工作中的必备工具。在这篇文章中，我将详细介绍Git的使用方法，帮助你从基础到进阶掌握Git。什么是Git？Git是一种分布式版本控制系统（VCS），它让多个开发者能够高效地协同开发，跟踪代码的历史版本，并且管理项目的不同
20250218 隨筆垂直分库分表（Vertical Sharding）和水平分库分表（Horizontal Sharding）靈臺清明 XdClass 网络数据库垂直分库分表和水平分库分表
垂直分库分表（VerticalSharding）和水平分库分表（HorizontalSharding）是数据库拆分的两种策略。它们在大规模数据库优化、分布式架构设计中至关重要，主要用于降低单库压力、提高查询效率、支持高并发。1.垂直分库分表（VerticalSharding）概念垂直分库和垂直分表的核心思想是按业务模块或功能拆分数据库，即：垂直分库（VerticalDatabasePartitio
Redis安全机制与数据备份：保障数据安全与高可用性一碗黄焖鸡三碗米饭 Redis技术全景解析 redis 安全数据库缓存架构开发语言
Redis安全机制与数据备份：保障数据安全与高可用性作为一个高效的内存数据库，Redis因其卓越的性能和灵活的应用场景，成为了分布式缓存、消息队列、实时分析等领域的核心组件。然而，在大规模的生产环境中，Redis不仅需要关注性能，还需要具备高安全性和高可用性，以保障数据的完整性和持续服务。为此，Redis提供了一些安全机制和数据备份方案，帮助用户应对各种潜在的风险。本文将深入探讨Redis的安全机
python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？大懒猫软件 python 深度学习 tensorflow pytorch
TensorFlow和PyTorch是目前最流行的两个深度学习框架，它们在设计理念、使用方式和社区支持等方面存在一些显著的区别。以下是它们的主要区别：1.设计理念TensorFlow：静态计算图：TensorFlow使用静态计算图，即在运行模型之前需要先定义整个计算图。这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提
延迟任务的11种实现方式（下）！！架构文摘JGWZ 学习后端 Java 编程语言
接上文：Redisson的RDelayedQueueRedisson他是Redis的儿子（Redisson），基于Redis实现了非常多的功能，其中最常使用的就是Redis分布式锁的实现，但是除了实现Redis分布式锁之外，它还实现了延迟队列的功能。先来个demo引入pom org.redisson redisson 3.13.1封装了一个RedissonDelayQueue类@
Kubernetes & 容器自动伸缩失败：解决方案及阿里云如何帮助 Anna_Tong kubernetes 阿里云容器负载均衡云原生弹性计算自动伸缩
随着容器技术的普及，Kubernetes（K8s）已成为构建现代云原生应用的核心平台。自动伸缩（AutoScaling）功能可以帮助应用在流量波动时动态调整资源，提高效率并节约成本。然而，很多企业在配置水平自动伸缩（HorizontalPodAutoscaler，HPA）或ECS扩容策略时，常常遇到配置错误或无法触发扩容的问题，导致资源无法及时扩展或收缩，影响系统的稳定性和用户体验。本文将为您分享
DeepSeek专利：分布式系统的“去重神器”，如何让数据传输效率飙升？ CodePatentMaster php 网络安全
“DeepSeek的这项专利（CN111064587A），通过创新的冗余数据消除机制，让分布式系统的数据传输效率提升50%，网络延迟降低30%！”一、技术分析：DeepSeek专利的核心价值1.技术背景：解决分布式系统中的冗余数据与网络拥塞问题在分布式系统中，数据通过广播式传输时，往往会经过多个路径转发，导致大量冗余数据的产生。这些冗余数据不仅占用存储空间，还会增加网络传输负担，导致网络拥塞和延迟
Hadoop01-入门&集群环境搭建--非原创（test） xl.liu 大数据 Test
Hadoop01-入门&集群环境搭建今日内容Hadoop的介绍集群环境搭建准备工作Linux命令和Shell脚本增强集群环境搭建来来来大数据概述大数据:就是对海量数据进行分析处理，得到一些有价值的信息，然后帮助企业做出判断和决策.处理流程:1:获取数据2:处理数据3:展示结果1：Hadoop介绍Hadoop是一个分布式系基础框架,它允许使用简单的编程模型跨大型计算机的大型数据集进行分布式处理.它主
python分布式爬虫去重_Python分布式爬虫(三) - 爬虫基础知识 weixin_39997311 python分布式爬虫去重
0相关源码1技术选型爬虫能做什么1.1scrapyVSrequests+beautifulsoup做爬虫的时候，经常都会听到scrapyVSrequests+beautifulsoup的组合在本次分布式爬虫实现中只用scrapy而不用后者的原因是：requests和beautifulsoup都是库，scrapy是一个框架框架中可以应用requests等，可以集合很多第三方库基于twisted(异步
Scrapy分布式爬虫系统 ivwdcwso 开发运维 scrapy 分布式爬虫 python 开发
一、概述在这篇博文中,我们将介绍如何使用Docker来部署Scrapy分布式爬虫系统,包括Scrapyd、Logparser和Scrapyweb三个核心组件。这种部署方式适用于Scrapy项目和Scrapy-Redis分布式爬虫项目。需要安装的组件:Scrapyd-服务端,用于运行打包后的爬虫代码,所有爬虫机器都需要安装。Logparser-服务端,用于解析爬虫日志,配合Scrapyweb进行实时
ColD Fusion，分布式多任务微调的协同 “密码” 人工智能
ColDFusion，分布式多任务微调的协同“密码”发布时间：2025-02-19近日热文：1.全网最全的神经网络数学原理（代码和公式）直观解释2.大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体：全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预训练模型的基础上进行改进，有望提升所有基于它微调的模型性能。然而，
Nacos 何避免并发读写冲突问题?
Nacos作为一个分布式服务注册和配置管理平台，为了避免并发读写冲突，采用了多种技术和策略来保证系统的数据一致性、可靠性和性能。以下是Nacos避免并发读写冲突的几种关键机制：1.强一致性协议(Raft协议)Nacos使用了Raft协议来确保集群中多个节点的数据一致性。Raft协议是一种分布式共识协议，它通过保证集群中多数节点的一致性，避免了因为网络分区或节点故障而导致的数据不一致。Raft协议的
Hadoop管理工具dfsadmin和fsck的使用脚本无敌 Hadoop hadoop npm 大数据
Hadoop提供了多个管理工具，其中dfsadmin和fsck是用于管理HDFS（Hadoop分布式文件系统）的重要工具。以下是它们的使用方法和常见命令。1.dfsadmin工具dfsadmin是用于管理HDFS集群的命令行工具，主要用于监控和管理HDFS的状态。常用命令查看HDFS状态hdfsdfsadmin-report显示HDFS集群的总体状态，包括数据节点（DataNode）的状态、存储容
（一）大数据---Hadoop整体介绍（架构层）----（组件(3) 2401_84166965 程序员大数据 hadoop 架构
复杂性:体现在数据的管理和操作上。如何抽取，转换，加载，连接，关联以把握数据内蕴的有用信息已经变得越来越有挑战性二、大数据技术有哪些（重点）===================================================================================基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计
Houdini：Houdini光照与渲染基础_2024-07-16_02-34-24.Tex chenjj4003 游戏开发 houdini android cinema4d blender 游戏 3dsmax
Houdini：Houdini光照与渲染基础Houdini渲染引擎简介Mantra渲染器概述Mantra是Houdini自带的渲染引擎，它是一个基于物理的渲染器，能够处理复杂的光线追踪和全局光照效果。Mantra的设计理念是灵活性和可扩展性，它支持多种渲染模式，包括CPU渲染和GPU渲染，以及分布式渲染。Mantra的渲染质量高，特别适合于处理大规模的场景和复杂的视觉效果。Mantra渲染器的特点
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列一碗黄焖鸡三碗米饭 Redis技术全景解析 redis java 后端架构微服务
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列Redis作为一个高性能的内存数据库，凭借其高吞吐量、低延迟的特性，已成为开发者在构建现代应用时的首选技术之一。无论是在缓存加速、分布式锁，还是消息队列等多个应用场景中，Redis都展现出了卓越的性能。本文将围绕这三个核心场景，深入探讨Redis的最佳实践，帮助开发者更好地理解和应用Redis，在生产环境中提高系统的响应速度、稳定性与可
【系列专栏】银行IT的云原生架构-云单元架构 12 呱牛do it 金融科技云原生架构金融
银行IT的云原生架构-云单元架构一、引言在银行数字化转型进程中，云原生架构已成为提升竞争力、实现高效创新的关键支撑。其中，云单元架构作为一种先进的架构模式，正逐渐受到银行的关注与应用。云单元架构通过将复杂的系统拆分为多个相对独立、自治的单元，为银行带来了更高的灵活性、扩展性与可靠性。从目标、特征、单元化流量路由、应用与数据单元化、分布式中间件等多个关键角度深入剖析云单元架构，对于银行更好地理解和应
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

阿里云环境部署k8s集群

你可能感兴趣的:(分布式容器技术)