Li_barroco

kubernetes集群实战——Pod调度、亲和性与反亲和性、Node属性Taints、Pod属性Tolerations

1.调度器作用

调度器通过 kubernetes 的 watch 机制来发现集群中新创建且尚未被调度到 Node 上的 Pod。调度器会将发现的每一个未调度的 Pod 调度到一个合适的 Node 上来运行。
kube-scheduler 是 Kubernetes 集群的默认调度器，并且是集群控制面的一部分。如果你真的希望或者有这方面的需求，kube-scheduler 在设计上是允许你自己写一个调度组件并替换原有的 kube-scheduler。
在做调度决定时需要考虑的因素包括：单独和整体的资源请求、硬件/软件/策略限制、亲和以及反亲和要求、数据局域性、负载间的干扰等等。

默认策略可以参考：https://kubernetes.io/zh/docs/concepts/scheduling/kube-scheduler/
调度框架：https://kubernetes.io/zh/docs/concepts/configuration/scheduling-framework/

2. nodeName

nodeName 是节点选择约束的最简单方法，但一般不推荐。
如果 nodeName 在 PodSpec 中指定了，则它优先于其他的节点选择方法。
使用 nodeName 来选择节点的一些限制：
如果指定的节点不存在。
如果指定的节点没有资源来容纳 pod，则pod 调度失败。
云环境中的节点名称并非总是可预测或稳定的。
示例

[root@server2 ~]# cd sduler/
[root@server2 sduler]# vim pod.yml 
[root@server2 sduler]# cat pod.yml 
apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx
  nodeName: server3	##指定pod调度到server3节点
[root@server2 sduler]# kubectl apply -f pod.yml 
pod/nginx created
[root@server2 sduler]# kubectl get pod -o wide
NAME    READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
nginx   1/1     Running   0          13s   10.244.1.30   server3              
[root@server2 sduler]#

测试：指定节点没有资源来容纳 pod，则pod 调度失败

3. nodeSelector

nodeSelector 是节点选择约束的最简单推荐形式。

给选择的节点添加标签：
kubectl label nodes server2 disktype=ssd

添加 nodeSelector 字段到 pod 配置中：

[root@server2 sduler]# kubectl label nodes server3 disktype=ssd	##添加标签到节点server3
node/server3 labeled
[root@server2 sduler]# kubectl get node --show-labels
NAME      STATUS   ROLES    AGE     VERSION   LABELS
server2   Ready    master   5d15h   v1.18.5   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,disktype=ssd,kubernetes.io/arch=amd64,kubernetes.io/hostname=server2,kubernetes.io/os=linux,node-role.kubernetes.io/master=
server3   Ready       5d15h   v1.18.5   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,disktype=ssd,kubernetes.io/arch=amd64,kubernetes.io/hostname=server3,kubernetes.io/os=linux
server4   Ready       5d15h   v1.18.5   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/arch=amd64,kubernetes.io/hostname=server4,kubernetes.io/os=linux
[root@server2 sduler]# vim pod.yml 
[root@server2 sduler]# cat pod.yml 
apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx
  nodeSelector: 	##按照所添加的标签选择节点
    disktype: ssd
[root@server2 sduler]# kubectl apply -f pod.yml
pod/nginx created
[root@server2 sduler]# kubectl get pod -o wide
NAME    READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
nginx   1/1     Running   0          19s   10.244.1.31   server3              
[root@server2 sduler]#

未匹配到标签时，pod将一直处于pending状态

4. 亲和和与反亲和

nodeSelector 提供了一种非常简单的方法来将 pod 约束到具有特定标签的节点上。
亲和/反亲和功能极大地扩展了你可以表达约束的类型。
你可以发现规则是“软”/“偏好”，而不是硬性要求，因此，如果调度器无法满足该要求，仍然调度该 pod
你可以使用节点上的 pod 的标签来约束，而不是使用节点本身的标签，来允许哪些 pod 可以或者不可以被放置在一起。
参考：https://kubernetes.io/zh/docs/concepts/configuration/assign-pod-node/

4.1 节点亲和

requiredDuringSchedulingIgnoredDuringExecution 必须满足
preferredDuringSchedulingIgnoredDuringExecution 倾向满足
IgnoreDuringExecution 表示如果在Pod运行期间Node的标签发生变化，导致亲和性策略不能满足，则继续运行当前的Pod。

nodeaffinity还支持多种规则匹配条件的配置如
In：label 的值在列表内
NotIn：label 的值不在列表内
Gt：label 的值大于设置的值，不支持Pod亲和性
Lt：label 的值小于设置的值，不支持pod亲和性
Exists：设置的label 存在
DoesNotExist：设置的 label 不存在
节点亲和性pod示例一：

[root@server2 sduler]# vim pod.yml 
[root@server2 sduler]# cat pod.yml 
apiVersion: v1
kind: Pod
metadata:
  name: node-affinity
spec:
  containers:
  - name: nginx
    image: nginx
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
           nodeSelectorTerms:
           - matchExpressions:
             - key: disktype
               operator: In
               values:
                 - ssd
[root@server2 sduler]# kubectl apply -f pod.yml 
pod/node-affinity created
[root@server2 sduler]# kubectl get pod -o wide
NAME            READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
node-affinity   1/1     Running   0          10s   10.244.1.32   server3              
[root@server2 sduler]#

示例二：

[root@server2 sduler]# vim pod.yml 
[root@server2 sduler]# cat pod.yml 
apiVersion: v1
kind: Pod
metadata:
  name: node-affinity
spec:
  containers:
  - name: nginx
    image: nginx
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:	##必须满足
           nodeSelectorTerms:
           - matchExpressions:
             - key: kubernetes.io/hostname
               operator: NotIn
               values:
               - server1
      preferredDuringSchedulingIgnoredDuringExecution:	##倾向满足
      - weight: 1
        preference:
          matchExpressions:
          - key: disktype
            operator: In
            values:
            - ssd     
[root@server2 sduler]# kubectl apply -f pod.yml 
pod/node-affinity created
[root@server2 sduler]# kubectl get pod -o wide
NAME            READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
node-affinity   1/1     Running   0          5s    10.244.1.33   server3              
[root@server2 sduler]#

4.2 pod 亲和性和反亲和性

podAffinity 主要解决POD可以和哪些POD部署在同一个拓扑域中的问题（拓扑域用主机标签实现，可以是单个主机，也可以是多个主机组成的cluster、zone等。）
podAntiAffinity主要解决POD不能和哪些POD部署在同一个拓扑域中的问题。它们处理的是Kubernetes集群内部POD和POD之间的关系。
Pod 间亲和与反亲和在与更高级别的集合（例如 ReplicaSets，StatefulSets，Deployments 等）一起使用时，它们可能更加有用。可以轻松配置一组应位于相同定义拓扑（例如，节点）中的工作负载。

pod亲和性示例:

apiVersion: v1
kind: Pod
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  containers:
  - name: nginx
    image: nginx

---
apiVersion: v1
kind: Pod
metadata:
  name: mysql
  labels:
    app: mysql
spec:
  containers:
  - name: mysql
    image: mysql
    env:
     - name: "MYSQL_ROOT_PASSWORD"
       value: "westos"
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
      - labelSelector:
          matchExpressions:
          - key: app
            operator: In
            values:
            - nginx
        topologyKey: kubernetes.io/hostname
[root@server2 sduler]# vim pod.yml
[root@server2 sduler]# kubectl apply -f pod.yml 
pod/nginx created
pod/mysql created
[root@server2 sduler]# kubectl get pod -o wide
NAME    READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
mysql   1/1     Running   0          25s   10.244.1.36   server3              
nginx   1/1     Running   0          25s   10.244.1.35   server3              
[root@server2 sduler]#

设置调度，mysql跟随nginx的pod建立，建立pod到相应的标签

pod反亲和性示例:

[root@server2 sduler]# vim pod.yml 
[root@server2 sduler]# cat pod.yml 
apiVersion: v1
kind: Pod
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  containers:
  - name: nginx
    image: nginx
  nodeName: server3
---
apiVersion: v1
kind: Pod
metadata:
  name: mysql
  labels:
    app: mysql
spec:
  containers:
  - name: mysql
    image: mysql:5.7
    env:
     - name: "MYSQL_ROOT_PASSWORD"
       value: "westos"
  affinity:
    podAntiAffinity:		##反亲和性
      requiredDuringSchedulingIgnoredDuringExecution:
      - labelSelector:
          matchExpressions:
          - key: app
            operator: In
            values:
            - nginx
        topologyKey: "kubernetes.io/hostname"
[root@server2 sduler]# kubectl apply -f pod.yml 
pod/nginx created
pod/mysql created
[root@server2 sduler]# kubectl get pod -o wide	##mysql和nginx不在同一节点
NAME    READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
mysql   1/1     Running   0          14s   10.244.2.32   server4              
nginx   1/1     Running   0          14s   10.244.1.37   server3              
[root@server2 sduler]#

5. Node属性Taints污点、Pod属性Tolerations容忍

5.1污点、容忍概述

NodeAffinity节点亲和性，是Pod上定义的一种属性，使Pod能够按我们的要求调度到某个Node上，而Taints则恰恰相反，它可以让Node拒绝运行Pod，甚至驱逐Pod。

Taints(污点)是Node的一个属性，设置了Taints后，所以Kubernetes是不会将Pod调度到这个Node上的，于是Kubernetes就给Pod设置了个属性Tolerations(容忍)，只要Pod能够容忍Node上的污点，那么Kubernetes就会忽略Node上的污点，就能够(不是必须)把Pod调度过去。

可以使用命令 kubectl taint 给节点增加一个 taint：

kubectl taint nodes node1 key=value:NoSchedule	//创建
kubectl describe nodes  server1 |grep Taints		//查询
kubectl taint nodes node1 key:NoSchedule-		//删除

其中[effect] 可取值： [ NoSchedule | PreferNoSchedule | NoExecute ]
NoSchedule：POD 不会被调度到标记为 taints 节点。
PreferNoSchedule：NoSchedule 的软策略版本。
NoExecute：该选项意味着一旦 Taint 生效，如该节点内正在运行的 POD 没有对应 Tolerate 设置，会直接被逐出

[root@server2 sduler]# kubectl describe nodes server2 | grep Taints
Taints:             node-role.kubernetes.io/master:NoSchedule
[root@server2 sduler]# kubectl describe nodes server3 | grep Taints
Taints:             
[root@server2 sduler]# kubectl describe nodes server4 | grep Taints
Taints:             
[root@server2 sduler]#

部署myapp deployment示例

apiVersion: apps/v1
kind: Deployment
metadata:
  name: deployment-v1
spec:
  replicas: 2
  selector:
    matchLabels:
      app: myapp
  template:
    metadata:
      labels:
        app: myapp
    spec:
      containers:
      - name: myapp
        image: myapp:v1
      affinity:
        podAntiAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: app
                operator: In
                values:
                - myapp
            topologyKey: kubernetes.io/hostname
[root@server2 sduler]# vim deployment.yml 
[root@server2 sduler]# kubectl apply -f deployment.yml 
deployment.apps/deployment-v1 created
[root@server2 sduler]# kubectl get pod -o wide
NAME                             READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
deployment-v1-6498765b4b-59ncg   1/1     Running   0          22s   10.244.1.39   server3              
deployment-v1-6498765b4b-rkpc5   1/1     Running   0          22s   10.244.2.34   server4              
mysql                            1/1     Running   0          82m   10.244.2.32   server4              
nginx                            1/1     Running   0          82m   10.244.1.37   server3              
[root@server2 sduler]#

5.2 污点的添加与容忍设定

tolerations中定义的key、value、effect，要与node上设置的taint保持一直：
如果 operator 是 Exists ，value可以省略。
如果 operator 是 Equal ，则key与value之间的关系必须相等。
如果不指定operator属性，则默认值为Equal。
还有两个特殊值：
当不指定key，再配合Exists 就能匹配所有的key与value ，可以容忍所有污点。
当不指定effect ，则匹配所有的effect。
添加污点

[root@server2 sduler]# kubectl taint node server3 node-role.kubernetes.io/master:NoSchedule	##给Server3节点打上taint
node/server3 tainted
[root@server2 sduler]# kubectl describe nodes server3 |grep Taints
Taints:             node-role.kubernetes.io/master:NoSchedule
[root@server2 sduler]# kubectl apply -f deployment.yml 
deployment.apps/deployment-v1 created
[root@server2 sduler]# kubectl get pod -o wide	##可以看到server3上的Pod被驱离：
NAME                             READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
deployment-v1-6498765b4b-ds7s7   1/1     Running   0          8s    10.244.2.36   server4              
deployment-v1-6498765b4b-vqcld   0/1     Pending   0          8s

可以看到server3上的Pod被驱离

在PodSpec中为容器设定容忍标签：

tolerations:
      - operator: "Exists"
        effect: "NoSchedule"

为Pod设置容忍后，server3又可以运行Pod了

6. 影响pod调度的指令

影响Pod调度的指令还有：cordon、drain、delete，后期创建的pod都不会被调度到该节点上，但操作的暴力程度不一样。
cordon 停止调度：
影响最小，只会将node调为SchedulingDisabled，新创建pod，不会被调度到该节点，节点原有pod不受影响，仍正常对外提供服务。

[root@server2 sduler]# kubectl cordon server3
node/server3 cordoned
[root@server2 sduler]# kubectl get no
NAME      STATUS                     ROLES    AGE     VERSION
server2   Ready                      master   5d18h   v1.18.5
server3   Ready,SchedulingDisabled      5d18h   v1.18.5
server4   Ready                         5d18h   v1.18.5
[root@server2 sduler]#

apiVersion: apps/v1
kind: Deployment
metadata:
  name: deployment-v1
spec:
  replicas: 3
  selector:
    matchLabels:
      app: myapp
  template:
    metadata:
      labels:
        app: myapp
    spec:
      containers:
      - name: myapp
        image: myapp:v1
[root@server2 sduler]# vim deployment.yml 
[root@server2 sduler]# kubectl apply -f deployment.yml 
deployment.apps/deployment-v1 created
[root@server2 sduler]# kubectl get pod -o wide	##server3没有被调度
NAME                             READY   STATUS    RESTARTS   AGE   IP            NODE      NOMINATED NODE   READINESS GATES
deployment-v1-7449b5b68f-5zvj6   1/1     Running   0          12s   10.244.2.38   server4              
deployment-v1-7449b5b68f-89bn5   1/1     Running   0          12s   10.244.2.40   server4              
deployment-v1-7449b5b68f-rpqb4   1/1     Running   0          12s   10.244.2.39   server4              
[root@server2 sduler]#

应用yaml文件后，集群中server3节点没有被调度

恢复server3节点的工作状态

[root@server2 sduler]# kubectl uncordon server3
node/server3 uncordoned
[root@server2 sduler]# kubectl get no
NAME      STATUS   ROLES    AGE     VERSION
server2   Ready    master   5d18h   v1.18.5
server3   Ready       5d18h   v1.18.5
server4   Ready       5d18h   v1.18.5
[root@server2 sduler]#

drain 驱逐节点：
首先驱逐node上的pod，在其他节点重新创建，然后将节点调为SchedulingDisabled。

[root@server2 sduler]# kubectl  drain server3 --ignore-daemonsets
node/server3 cordoned
WARNING: ignoring DaemonSet-managed Pods: kube-system/kube-flannel-ds-amd64-zx97k, kube-system/kube-proxy-l2cz5
evicting pod kube-system/coredns-bd97f9cd9-vzw6w
pod/coredns-bd97f9cd9-vzw6w evicted
node/server3 evicted
[root@server2 sduler]# kubectl get nodes 
NAME      STATUS                     ROLES    AGE     VERSION
server2   Ready                      master   5d18h   v1.18.5
server3   Ready,SchedulingDisabled      5d18h   v1.18.5
server4   Ready                         5d18h   v1.18.5
[root@server2 sduler]# kubectl get pod -o wide
NAME                             READY   STATUS    RESTARTS   AGE     IP            NODE      NOMINATED NODE   READINESS GATES
deployment-v1-7449b5b68f-5zvj6   1/1     Running   0          7m31s   10.244.2.38   server4              
deployment-v1-7449b5b68f-89bn5   1/1     Running   0          7m31s   10.244.2.40   server4              
deployment-v1-7449b5b68f-rpqb4   1/1     Running   0          7m31s   10.244.2.39   server4              
[root@server2 sduler]#

恢复server3节点的工作状态

delete 删除节点：
最暴力的一个，首先驱逐node上的pod，在其他节点重新创建，然后，从master节点删除该node，master失去对其控制，如要恢复调度，需进入node节点，重启kubelet服务

【MQ】如何保证消息队列的高可用？ Forest 森林消息队列 MQ kafka
RocketMQNameServer集群部署Broker做了集群部署主从模式类型：同步复制、异步复制主节点返回消息给客户端的时候是否需要同步从节点Dledger：要求至少消息复制到半数以上的节点之后，才给客户端返回写入成功slave定时从master同步数据（同步刷盘、异步刷盘），master一旦挂了，slave提供消费服务，不能写入消息KafkaKafka从0.8版本开始提供了高可用机制，可保障
Junit和Eclemma介绍--java白盒测试工具 myy_2018 JAVA
Junit一般进行单元测试时候使用，以前写好了模块，然后写一个main函数，写几个通用的测试用例去测试代码的逻辑结果是否正确，现在Eclipse中Junit插件使得不必须手动编写main函数，可以借助Junit编写测试函数，自动生成与模块相匹配的测试模块。我们只需要添加测试用例即可，并且结果显示是否与预期符合。Eclemma是Junit配合使用的插件，是测试覆盖率的工具，对于含有条件判断的代码，对
pymoo：Python中的多目标优化框架葛梓熙
pymoo：Python中的多目标优化框架pymoo项目地址:https://gitcode.com/gh_mirrors/pym/pymoo项目介绍pymoo是一个开源的多目标优化框架，专为Python开发者设计。它提供了最先进的单目标和多目标优化算法，以及与多目标优化相关的多种功能，如可视化和决策支持。无论你是学术研究者还是工业应用开发者，pymoo都能帮助你轻松实现复杂的多目标优化任务。项目
leetcode_链表 203.移除链表元素 MiyamiKK57 leetcode 链表算法
203.移除链表元素给你一个链表的头节点head和一个整数val，请你删除链表中所有满足Node.val==val的节点，并返回新的头节点。#Definitionforsingly-linkedlist.#classListNode(object):#def__init__(self,val=0,next=None):#self.val=val#self.next=nextclassSolutio
leetcode_链表 83.删除排序链表中的重复元素 MiyamiKK57 leetcode 链表算法
83.删除排序链表中的重复元素给定一个已排序的链表的头head，删除所有重复的元素，使每个元素只出现一次。返回已排序的链表。#Definitionforsingly-linkedlist.#classListNode(object):#def__init__(self,val=0,next=None):#self.val=val#self.next=nextclassSolution(object
python-leetcode-翻转二叉树 Joyner2018 leetcode 算法职场和发展
226.翻转二叉树-力扣（LeetCode）#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definvertTree(self,root:Opti
深入剖析移动通信系统的架构与关键技术大苏牙
本文还有配套的精品资源，点击获取简介：移动通信系统是现代通信技术的重要组成部分，支持移动设备上的多种通信活动。本讲深入探讨了移动通信系统的基本原理、架构以及关键技术，如无线接口设计、核心网络功能和频谱效率优化。此外，分析了覆盖与容量平衡的策略，以及4G向5G演进所面临的挑战与机遇。通过本讲，学生将获得对移动通信系统全面而深入的认识。1.移动通信系统原理与架构移动通信系统是现代无线通讯的核心，它支持
OpenCV实现Python视频播放控制详解夏勇兴
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何使用OpenCV库在Python环境中播放视频，并展示了实现视频快进、后退控制的方法。首先通过cv2.VideoCapture()函数实现基础播放，然后利用set(cv2.CAP_PROP_FPS)函数控制播放速度实现快进和慢速播放，最后结合cv2.CAP_PROP_POS_MSEC属性实现精确的快进和后退。开发者可以根据实际需求选择合适的方
nginx日志收集、拆分、分析 . . . . . Nginx nginx 运维
Nginx的核心价值：高性能的静态服务反向代理负载均衡nginx的access_log与error_logaccess_log：指的是访问日志，我们通过访问日志可以获取用户的IP、请求处理的时间、浏览器信息等设置access_log语法：access_logpath[format[buffer=size][gzip[=level]][flush=time][if=condition]];设置访问日
最小二乘法-线性回归和梯度下降法梦回楼~ 最小二乘法算法机器学习人工智能
最小二乘法一、最小二乘法概念以及应用最小二乘法（LeastSquaresMethod,LSE）是一种数学优化技术，主要用于寻找最佳拟合给定数据点的函数。它通过最小化观测值与模型预测值之间的差的平方和来估计模型参数。换成听得懂的话说就是，我们有一组数据(x1,y1),(x2,y2)…(xn,yn)，我们也知道他的数学表达式的形式例如y=kx+b(但是不知道k、b的具体值)，但是(xn,yn)
容器化检索增强框架（R2R） deepdata_cn RAG RAG
R2RbySciPhi-AI是一个专门的RAG框架，专注于通过迭代细化来改进检索过程。主要特点包括实现新颖的检索算法，支持多步检索过程，与各种嵌入模型和向量存储集成，以及用于分析和可视化检索性能的工具。适合有兴趣突破检索技术界限的开发人员和研究人员，特别是在需要创新检索方法的场景。具有RESTfulAPI的容器化检索增强一代（RAG）。具有生产就绪型功能，包括多模式内容摄取、混合搜索功能、可配置的
高效向量搜索RAG解决方案（Canopy） deepdata_cn RAG RAG
Canopy利用Pinecone在高效向量搜索方面的专业知识，提供强大且可扩展的RAG（Retrieval-AugmentedGeneration）解决方案。包括与Pinecone向量数据库的紧密集成，支持流处理和实时更新，先进的查询处理和重新排序功能，以及管理知识库和版本控制的工具。一、基本原理1.向量嵌入：Canopy首先会将文本数据转换为向量表示，通常使用预训练的语言模型等技术，将文本映射到
遥感深度学习过程中图像分割的尺寸对模型训练结果的影响司南锤深度学习遥感深度学习人工智能
1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。解决方案：通常将大图裁剪为小尺寸的补丁（patches），例如256x256或512x512。小尺寸图像：显存占用低，但可能丢失全局上下文信息（如大面积地物分布），影响模型对复杂场景的理解。2.模型感受野与上下文信息小尺寸输入：模型感受野受限，可能无法捕捉大范围地物（如河流、
06-机器学习-数据预处理不会打代码呜呜呜呜机器学习机器学习人工智能
数据清洗数据清洗是数据预处理的核心步骤，旨在修正或移除数据集中的错误、不完整、重复或不一致的部分，为后续分析和建模提供可靠基础。以下是数据清洗的详细流程、方法和实战示例：一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空（NaN）模型无法处理缺失值，导致训练中断或偏差异常值年龄=200岁，房价=-100万扭曲统计指标（如均值），降低模型泛化性重复数据两行记录完全相同导致模型过拟合，降低
日志收集Day008 ccnnlxc java 开发语言
1.zk集群优化修改zookeeper的堆内存大小，一般情况下，生产环境给到2G足以，如果规模较大可以适当调大到4G。(1)配置ZK的堆内存vim/app/softwares/zk/conf/java.envexportJAVA_HOME=/sortwares/jdk1.8.0_291exportJVMFLAGS="-Xms256m-Xmx256m$JVMFLAGS"EOF(2)同步文件到其他节点
git命令将本地项目上传到gitlab csdn_780 git gitlab
进入本地项目文件夹下，打开git的bash客户端，执行命令先在gitlab上创建好项目名称，最好和本地的项目名称一致1、初始化仓库，将文件夹设置为本地仓库gitinit2、建立本地与github新项目的连接(http连接为gitlab的项目连接)gitremoteaddoriginhttp://IP:端口/xxxx.git3、同步项目到本地(master为gitlab上创建的项目指定的分支名称，通
Flutter架构概览，挑战大厂重燃激情 2401_83627805 2024年程序员学习 flutter 架构前端
这样的实现有几个优势：提供了诬陷的扩展性。Flutter可以直接合成所有的场景，而无需在Flutter与原生平台之间来回的切换，从而避免了明显的性能瓶颈。将应用的行为与操作系统的依赖解耦。组成Widget通常由更小的且用途单一的widgets组合而成，提供更强大的功能。在设计的时候，相关的概念设计已尽可能地少量存在，而通过大量的内容进行填充。eg，Flutter在widgets层中使用了相同的概念
从零推导线性回归：最小二乘法与梯度下降的数学原理 Echo-Nie 机器学习机器学习线性回归人工智能梯度下降数学推导
欢迎来到我的主页：【Echo-Nie】本篇文章收录于专栏【机器学习】本文所有内容相关代码都可在以下仓库中找到：Github-MachineLearning1线性回归1.1什么是线性回归线性回归是一种用来预测和分析数据之间关系的工具。它的核心思想是找到一条直线（或者一个平面），让这条直线尽可能地“拟合”已有的数据点，通过这条直线，我们可以预测新的数据。eg：假设你想预测房价，你知道房子的大小（面积）
在计算机上本地运行 Deepseek R1 itmanll linux
DownloadOllamaonLinuxDownloadOllamaonWindowsDownloadOllamaonmacOSDeepseekR1是一个强大的人工智能模型，在科技界掀起了波澜。它是一个开源语言模型，可以与GPT-4等大玩家展开竞争。但更重要的是，与其他一些模型不同，您可以在自己的计算机上本地运行DeepseekR1。linux步骤第1步：下载Ollama并安装curl-fsSL
大数据小白系列——YARN(1) weixin_44386638 大数据大数据人工智能机器学习数据挖掘数据分析
这是大数据小白系列，YARN的第一篇，准确的说是介绍YARN的“前身”，即MapReduce第一版(下称MRv1)中的资源管理系统。之前准备忽略这部分的内容，毕竟MRv1已经过时了，但为方便后续介绍YARN，这里还是(并不深入地)讲一讲。Q:为什么需要一个资源管理系统？A:在一个具有成百上千节点的集群上(这很常见)，资源管理十分重要，一个好的资源管理系统可以充分发挥各节点的能力，避免一些节点忙碌，
redis分布式锁与redsync库源码分析阿鹏哥哥01 golang学习专题 redis分布式锁 redis 分布式
redsync是redis官方推荐的go版本分布式锁实现，标准的官方redlock算法实现，阅读了下源码并顺便复习一下redis分布式锁原理。一.redlock算法单点场景首先来看单redis实例的场景，这是集群模式的基础。这种场景下实现分布式锁比较简单加锁各节点通过setkeyvaluenxex即可，如果set执行成功，则表明加锁成功，否则失败，其中value为随机串，用来判断是否是当前应用实例
MAC与ARP star9595 Linux
MAC全球范围内唯一，标识一个网络设备，MAC地址是物理地址，不可以改变的的，相当于建筑物地址；在网络世界中必须同时借助IP地址和对应的MAC地址，才可以唯一的确定一个通信设备，为了能够获得一个IP地址所对应的MAC地址需要ARP（addressresolutionprotocol）地址解析协议，基于一个ip地址解析出其对应的MAC地址，实现数据的完整封装。网络传输中的表：1.MAC地址表：说到M
Hadoop学习笔记 --- YARN执行流程与工作原理杨鑫newlfe 数据仓库大数据挖掘与大数据应用案例 YARN Hadoop 大数据资源调度数据仓库
一、YARN简述首先介绍一下YARN在Hadoop2.0版本引进的资源管理系统，直接从MapReduceV1演化而来(由于引擎的功能缺陷)；原因是将MapReduce1中的JobTracker的资源管理和作业调度两个功能分开，分别由ResourceManager和ApplicationMaster进行实现；ResourceManager：负责整个集群的资源管理和调度ApplicationMaste
使用 rasterstats 库进行栅格与矢量数据的空间分析 xyt556_CUMT 人工智能
在地理信息系统（GIS）领域，栅格数据和矢量数据是两类常见的数据类型。栅格数据通常代表像素网格，如遥感影像或土地利用图，而矢量数据则通常表示具体的地理实体，如行政区划或土地边界。如何有效地结合这两类数据进行空间分析是许多地理研究中的关键问题。rasterstats是一个用于处理栅格和矢量数据的Python库，提供了便捷的工具来实现栅格统计、空间叠加分析等。本文将介绍如何使用rasterstats库
【深入浅出 Yarn 架构与实现】1-1 设计理念与基本架构大数据王小皮深入浅出Yarn架构与实现架构 hadoop 大数据 yarn java
一、Yarn产生的背景Hadoop2之前是由HDFS和MR组成的，HDFS负责存储，MR负责计算。一）MRv1的问题耦合度高：MR中的jobTracker同时负责资源管理和作业控制两个功能，互相制约。可靠性差：管理节点是单机的，有单点故障的问题。资源利用率低：基于slot的资源分配模型。机器会将资源划分成若干相同大小的slot，并划定哪些是mapslot、哪些是reduceslot。无法支持多种计
手机APP软件测试与开发——夜神模拟器的安装与下载 AE—Darren洋 APP测试 app测试测试工具夜神模拟器模拟器
一、下载夜神模拟器夜神模拟器官网下载地址：https://www.yeshen.com二、安装夜神模拟器（1）双击安装包后进入安装界面，点击自定义安装进行安装路径选择（路径建议不要选择C盘）。（2）安装完成打开夜深模拟器后，点击右上角设置按钮进行设置，点击性能设置，再看分辨率那一栏，改为手机版即可。
页高速缓存与缓冲区缓存的应用差异最后一个bug linux内核设计与实现 linux 嵌入式硬件单片机 arm开发 c语言
页高速缓存（PageCache）与缓冲区缓存（BufferCache）是计算机系统中用于提高数据访问性能的两种不同类型的缓存机制，它们的差异主要体现在以下几个方面：缓存目的页高速缓存：主要用于加速对磁盘上文件数据的访问，将磁盘中的数据页缓存到内存，下次访问相同数据时可直接从内存读取，减少磁盘I/O操作。缓冲区缓存：主要用于临时存储磁盘块设备的I/O数据，在内存中为磁盘块设置缓冲区，协调内存与磁盘间
【Yarn】Yarn 架构体系、通讯协议、yarn交互流程九师兄大数据-hadoop 架构 java 运维
文章目录1.概述2.ResourceManager3.NodeManager4.ApplicationMaster5.Container容器6.通讯协议7.yarn交互流程7.1YARN上应用类型7.2整体流程大年初二，凑够3400篇文章，神秘代码：5Lmd5biI5YWE5ZSv5LiA5Y6f5Yib5paH56ug77yM56aB5q2i6L2s6L291.概述yarn有3大组件，想明白组件
VUE之参数传递三日沐水 vue vue.js 前端 javascript
1、嵌套路由路由嵌套children里面的path属性不加/杠，可以参考如下代码：>>router/index.ts//创建一个路由器，并暴露出去//第一步：引入createRouterimport{createRouter,createWebHistory,createWebHashHistory}from'vue-router'//引入一个个可能呈现组件importHomefrom'@/pag
高级Qt信号槽编程技巧 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
高级Qt信号槽编程技巧补天云火鸟博客创作软件补天云网站1Qt高级信号槽编程基础1.1Qt核心概念和机制介绍1.1.1Qt核心概念和机制介绍Qt核心概念和机制介绍高级Qt信号槽编程技巧,Qt核心概念与机制详解引言,在深入探讨Qt中高级信号槽编程技巧之前，我们先对Qt的核心概念及其工作机制进行一番了解。Qt是一个跨平台的应用程序开发框架，广泛应用于桌面、移动和嵌入式设备上。其设计思想强调了组件化、模块
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$