kobeshow

Spark0.9.0机器学习包MLlib-Classification代码阅读

本章主要讲述MLlib包里面的分类算法实现，目前实现的有LogisticRegression、SVM、NaiveBayes ，前两种算法针对各自的目标优化函数跟正则项，调用了Optimization模块下的随机梯度的优化，并行实现的策略主要在随机梯度的计算，而贝叶斯的的并行策略主要是计算类别的先验概率跟特征的条件概率上面，详细情况如下

LogisticRegression.scala文件

第一部分 LogisticRegressionModel 类

 1 /**
 2 
 3  * Classification model trained using Logistic Regression.
 4 
 5  *
 6 
 7  * @param weights Weights computed for every feature.
 8 
 9  * @param intercept Intercept computed for this model.
10 
11  */
12 
13 class LogisticRegressionModel(
14 
15     override val weights: Array[Double],
16 
17     override val intercept: Double)
18 
19   extends GeneralizedLinearModel(weights, intercept)
20 
21   with ClassificationModel with Serializable {
22 
23   override def predictPoint(dataMatrix: DoubleMatrix, weightMatrix: DoubleMatrix,
24 
25       intercept: Double) = {
26 
27     val margin = dataMatrix.mmul(weightMatrix).get(0) + intercept
28 
29     round(1.0/ (1.0 + math.exp(margin * -1)))
30 
31   }
32 
33 }

逻辑回归的predictPoint函数，函数输入：待预测的数据样本，回归系数weights，intercept截距项，由于逻辑回归的判别函数f=1/(1+exp(-wx))，在代码中margin=-wx，最后返回1/(1+exp(-wx))值的四舍五入，也就是预测标签。

第二部分 LogisticRegressionWithSGD 类

 1 class LogisticRegressionWithSGD private (
 2 
 3     var stepSize: Double,
 4 
 5     var numIterations: Int,
 6 
 7     var regParam: Double,
 8 
 9     var miniBatchFraction: Double)
10 
11   extends GeneralizedLinearAlgorithm[LogisticRegressionModel]
12 
13   with Serializable {
14 
15   val gradient = new LogisticGradient()
16 
17   val updater = new SimpleUpdater()
18 
19   override val optimizer = new GradientDescent(gradient, updater)
20 
21       .setStepSize(stepSize)
22 
23       .setNumIterations(numIterations)
24 
25       .setRegParam(regParam)
26 
27       .setMiniBatchFraction(miniBatchFraction)
28 
29   override val validators = List(DataValidators.classificationLabels)
30 
31   /**
32 
33    * Construct a LogisticRegression object with default parameters
34 
35    */
36 
37   def this() = this(1.0, 100, 0.0, 1.0)
38 
39   def createModel(weights: Array[Double], intercept: Double) = {
40 
41     new LogisticRegressionModel(weights, intercept)
42 
43   }
44 
45 }

源代码先定义了gradient,updater实例(在optimization文件下下面)，其中损失函数用了log-loss，没有用正则项参数，接着重写optimizer 优化算子，最后对该类成员变量stepSize，numIterations，regParam，miniBatchFraction设置默认数值。

第三部分 LogisticRegressionWithSGD上层接口

  1 object LogisticRegressionWithSGD {
  2 
  3  def train(
  4 
  5       input: RDD[LabeledPoint],
  6 
  7       numIterations: Int,
  8 
  9       stepSize: Double,
 10 
 11       miniBatchFraction: Double,
 12 
 13       initialWeights: Array[Double])
 14 
 15     : LogisticRegressionModel =
 16 
 17   {
 18 
 19     new LogisticRegressionWithSGD(stepSize, numIterations, 0.0, miniBatchFraction).run(
 20 
 21       input, initialWeights)
 22 
 23   }
 24 
 25   def train(
 26 
 27       input: RDD[LabeledPoint],
 28 
 29       numIterations: Int,
 30 
 31       stepSize: Double,
 32 
 33       miniBatchFraction: Double)
 34 
 35     : LogisticRegressionModel =
 36 
 37   {
 38 
 39     new LogisticRegressionWithSGD(stepSize, numIterations, 0.0, miniBatchFraction).run(
 40 
 41       input)
 42 
 43   }
 44 
 45   def train(
 46 
 47       input: RDD[LabeledPoint],
 48 
 49       numIterations: Int,
 50 
 51       stepSize: Double)
 52 
 53     : LogisticRegressionModel =
 54 
 55   {
 56 
 57     train(input, numIterations, stepSize, 1.0)
 58 
 59   }
 60 

 61   def train(
 62 
 63       input: RDD[LabeledPoint],
 64 
 65       numIterations: Int)
 66 
 67     : LogisticRegressionModel =
 68 
 69   {
 70 
 71     train(input, numIterations, 1.0, 1.0)
 72 
 73   }
 74 
 75   def main(args: Array[String]) {
 76 
 77     if (args.length != 4) {
 78 
 79       println("Usage: LogisticRegression    " +
 80 
 81         "")
 82 
 83       System.exit(1)
 84 
 85     }
 86 
 87     val sc = new SparkContext(args(0), "LogisticRegression")
 88 
 89     val data = MLUtils.loadLabeledData(sc, args(1))
 90 
 91     val model = LogisticRegressionWithSGD.train(data, args(3).toInt, args(2).toDouble)
 92 
 93     println("Weights: " + model.weights.mkString("[", ", ", "]"))
 94 
 95     println("Intercept: " + model.intercept)
 96 
 97     sc.stop()
 98 
 99   }
100 
101 }

代码中，根据不同的输入定义了4种train的方式，在main函数里面，用到了MLUtils.loadLabeledData(sc，args(1))，该函数把文件输入<标签>，<特征1>，<特征2>...转换成定义的RDD[LabeledPoint]形式。接着调用LR进行训练，最后打印回归系数跟截距项

SVM.scala文件

第一部分 SVMModel 类

 1 class SVMModel(
 2 
 3     override val weights: Array[Double],
 4 
 5     override val intercept: Double)
 6 
 7   extends GeneralizedLinearModel(weights, intercept)
 8 
 9   with ClassificationModel with Serializable {
10 
11  
12 
13   override def predictPoint(dataMatrix: DoubleMatrix, weightMatrix: DoubleMatrix,
14 
15       intercept: Double) = {
16 
17     val margin = dataMatrix.dot(weightMatrix) + intercept
18 
19     if (margin < 0) 0.0 else 1.0
20 
21   }
22 
23 }

跟LR类似，只不过这里面的margin换成了：WX+b的形式

第二部分 SVMWithSGD 类

 1 class SVMWithSGD private (
 2 
 3     var stepSize: Double,
 4 
 5     var numIterations: Int,
 6 
 7     var regParam: Double,
 8 
 9     var miniBatchFraction: Double)
10 
11   extends GeneralizedLinearAlgorithm[SVMModel] with Serializable {
12 
13  
14 
15   val gradient = new HingeGradient()
16 
17   val updater = new SquaredL2Updater()
18 
19   override val optimizer = new GradientDescent(gradient, updater)
20 
21     .setStepSize(stepSize)
22 
23     .setNumIterations(numIterations)
24 
25     .setRegParam(regParam)
26 
27     .setMiniBatchFraction(miniBatchFraction)
28 
29   override val validators = List(DataValidators.classificationLabels)
30 
31   def this() = this(1.0, 100, 1.0, 1.0)
32 
33   def createModel(weights: Array[Double], intercept: Double) = {
34 
35     new SVMModel(weights, intercept)
36 
37   }
38 
39 }

跟LR类似，gradient 换成了对hinge-loss的求梯度，updater换成了对L2正则

第三部分 SVMWithSGD 上层接口

  1 object SVMWithSGD {
  2 
  3   def train(
  4 
  5       input: RDD[LabeledPoint],
  6 
  7       numIterations: Int,
  8 
  9       stepSize: Double,
 10 
 11       regParam: Double,
 12 
 13       miniBatchFraction: Double,
 14 
 15       initialWeights: Array[Double])
 16 
 17     : SVMModel =
 18 
 19   {
 20 
 21     new SVMWithSGD(stepSize, numIterations, regParam, miniBatchFraction).run(input,
 22 
 23       initialWeights)
 24 
 25   }
 26 
 27   def train(
 28 
 29       input: RDD[LabeledPoint],
 30 
 31       numIterations: Int,
 32 
 33       stepSize: Double,
 34 
 35       regParam: Double,
 36 
 37       miniBatchFraction: Double)
 38 
 39     : SVMModel =
 40 
 41   {
 42 
 43     new SVMWithSGD(stepSize, numIterations, regParam, miniBatchFraction).run(input)
 44 
 45   }
 46 
 47  
 48 
 49   def train(
 50 
 51       input: RDD[LabeledPoint],
 52 
 53       numIterations: Int,
 54 
 55       stepSize: Double,
 56 
 57       regParam: Double)
 58 
 59     : SVMModel =
 60 
 61   {
 62 
 63     train(input, numIterations, stepSize, regParam, 1.0)
 64 
 65   }
 66 
 67  
 68 
 69   def train(
 70 
 71       input: RDD[LabeledPoint],
 72 
 73       numIterations: Int)
 74 
 75     : SVMModel =
 76 
 77   {
 78 
 79     train(input, numIterations, 1.0, 1.0, 1.0)
 80 
 81   }
 82 
 83  
 84 
 85   def main(args: Array[String]) {
 86 
 87     if (args.length != 5) {
 88 
 89       println("Usage: SVM     ")
 90 
 91       System.exit(1)
 92 
 93     }
 94 
 95     val sc = new SparkContext(args(0), "SVM")
 96 
 97     val data = MLUtils.loadLabeledData(sc, args(1))
 98 
 99     val model = SVMWithSGD.train(data, args(4).toInt, args(2).toDouble, args(3).toDouble)
100 
101     println("Weights: " + model.weights.mkString("[", ", ", "]"))
102 
103     println("Intercept: " + model.intercept)
104 
105  
106 
107     sc.stop()
108 
109   }
110 
111 }

跟LR类似

NaiveBayes.scala文件

第一部分 NaiveBayesModel 类

 1 class NaiveBayesModel(val pi: Array[Double], val theta: Array[Array[Double]])
 2 
 3   extends ClassificationModel with Serializable {
 4 
 5  
 6 
 7   // Create a column vector that can be used for predictions
 8 
 9   private val _pi = new DoubleMatrix(pi.length, 1, pi: _*)
10 
11   private val _theta = new DoubleMatrix(theta)
12 
13  
14 
15   def predict(testData: RDD[Array[Double]]): RDD[Double] = testData.map(predict)
16 
17  
18 
19   def predict(testData: Array[Double]): Double = {
20 
21     val dataMatrix = new DoubleMatrix(testData.length, 1, testData: _*)
22 
23     val result = _pi.add(_theta.mmul(dataMatrix))
24 
25     result.argmax()
26 
27   }
28 
29 }

朴素贝叶斯分类器，NaiveBayesModel的输入是：训练后得到的，标签类别先验概率pi （P(y=0)，P(y=1)，...，P(y=K)），特征属性在指定类别下出现的条件概率theta（P(x=1 / y)）,对于特征转化为TF-IDF形式可以用来文本分类，当特征转化为0-1编码的时候，基于伯努利模型可以用来分类，第一个predict函数的输入是测试数据集，第二个predict函数的输入是单个测试样本。原本的贝叶斯定理是根据P（y|x）~ P（x|y）P（y），这里实现的时候，是对两边取了对数，加法的计算效率比乘法更高，最后，返回result.argmax() 也就是后验概率最大的那个类别

第二部分 NaiveBayes 类

 1 class NaiveBayes private (var lambda: Double)
 2 
 3   extends Serializable with Logging
 4 
 5 {
 6 
 7   def this() = this(1.0)
 8 
 9   /** Set the smoothing parameter. Default: 1.0. */
10 
11   def setLambda(lambda: Double): NaiveBayes = {
12 
13     this.lambda = lambda
14 
15     this
16 
17   }
18 
19  
20 
21   def run(data: RDD[LabeledPoint]) = {
22 
23     val zeroCombiner = mutable.Map.empty[Int, (Int, DoubleMatrix)]
24 
25     val aggregated = data.aggregate(zeroCombiner)({(combiner, point) =>
26 
27       point match {
28 
29         case LabeledPoint(label, features) =>
30 
31           val (count, featuresSum) = combiner.getOrElse(label.toInt, (0, DoubleMatrix.zeros(1)))
32 
33           val fs = new DoubleMatrix(features.length, 1, features: _*)
34 
35           combiner += label.toInt -> (count + 1, featuresSum.addi(fs))
36 
37       }
38 
39     }, { (lhs, rhs) =>
40 
41       for ((label, (c, fs)) <- rhs) {
42 
43         val (count, featuresSum) = lhs.getOrElse(label, (0, DoubleMatrix.zeros(1)))
44 
45         lhs(label) = (count + c, featuresSum.addi(fs))
46 
47       }
48 
49       lhs
50 
51     })
52 
53     // Kinds of label
54 
55     val C = aggregated.size
56 
57     // Total sample count
58 
59     val N = aggregated.values.map(_._1).sum
60 
61  
62 
63     val pi = new Array[Double](C)
64 
65     val theta = new Array[Array[Double]](C)
66 
67     val piLogDenom = math.log(N + C * lambda)
68 
69  
70 
71     for ((label, (count, fs)) <- aggregated) {
72 
73       val thetaLogDenom = math.log(fs.sum() + fs.length * lambda)
74 
75       pi(label) = math.log(count + lambda) - piLogDenom
76 
77       theta(label) = fs.toArray.map(f => math.log(f + lambda) - thetaLogDenom)
78 
79     }
80 
81     new NaiveBayesModel(pi, theta)
82 
83   }
84 
85 }

这个类是实现贝叶斯算法，lambda参数是用来避免P（X|Y）=0的尴尬（学术界叫法：拉普拉斯平滑），核心代码在data.aggregate，首先定义了zeroCombiner这个map类型数据结构，key表示类别，value是(Int, DoubleMatrix)元组类型，Int表示该类别在训练集中的个数(以便求先验概率)，DoubleMatrix表示各个特征在该类别下的条件概率

第三部分 NaiveBayes 调用接口

 1 object NaiveBayes {
 2 
 3   def train(input: RDD[LabeledPoint]): NaiveBayesModel = {
 4 
 5     new NaiveBayes().run(input)
 6 
 7   }
 8 
 9   def train(input: RDD[LabeledPoint], lambda: Double): NaiveBayesModel = {
10 
11     new NaiveBayes(lambda).run(input)
12 
13   }
14 
15  
16 
17   def main(args: Array[String]) {
18 
19     if (args.length != 2 && args.length != 3) {
20 
21       println("Usage: NaiveBayes   []")
22 
23       System.exit(1)
24 
25     }
26 
27     val sc = new SparkContext(args(0), "NaiveBayes")
28 
29     val data = MLUtils.loadLabeledData(sc, args(1))
30 
31     val model = if (args.length == 2) {
32 
33       NaiveBayes.train(data)
34 
35     } else {
36 
37       NaiveBayes.train(data, args(2).toDouble)
38 
39     }
40 
41     println("Pi: " + model.pi.mkString("[", ", ", "]"))
42 
43     println("Theta:\n" + model.theta.map(_.mkString("[", ", ", "]")).mkString("[", "\n ", "]"))
44 
45  
46 
47     sc.stop()
48 
49   }
50 
51 }

贝叶斯训练方式分有无lambda参数，main函数先定义SparkContext，然后把数据集转化成RDD[LabelPoint]类型，经过训练，打印pi跟theta，最后八卦一下，这个算法是在Intel工作，微博名叫灵魂机器大神写的，可以follow他的github网址https://github.com/soulmachine

Prompt工程：大模型沟通指南（人工智能到大模型） Harry技术 AI prompt 人工智能
文章目录人工智能到大模型机器学习深度学习大模型Prompt工程：大模型沟通的桥梁在人工智能的广袤领域中，大模型无疑是最为璀璨的明珠之一。它仿佛是一座连接人类与人工智能的桥梁，让我们能够更加深入地探索和利用人工智能的强大能力。而要实现与大模型的高效沟通，Prompt工程扮演着至关重要的角色。让我们一起走进Prompt工程的奇妙世界，探寻大模型沟通的奥秘。人工智能到大模型“人工智能是一种模拟人类智能的
无网络entos7报错ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found更新glibc 夏离网络
最近在尝试使用sklearn的升级版cuml，因为是一台没有连接互联网的gpu机器，所以构建cuml环境过程很坎坷，需要各种将各种whl包在线下载后上传到服务器中。当我终于解决完包的互相依赖问题后，在importcuml时候遇到一个错误：ImportError:/lib64/libm.so.6:version`GLIBC_2.27’notfound(requiredby/anaconda3/env
大语言模型（LLMs）全面学习指南（非常详细）零基础入门到精通，收藏这一篇就够了网络安全大白科技程序员人工智能语言模型人工智能自然语言处理
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
Centos安装GPU驱动,使用100元显卡玩转deepseek white.tie centos linux 运维
步骤1:安装NVIDIA驱动程序1.1安装显卡驱动编译工具yuminstallgccmakekernel-devel1.2安装显卡驱动依赖包yuminstallvulkan-loader1.3下载驱动安装https://www.nvidia.cn/drivers/details/220730/chmodu+xNVIDIA-Linux-x86_64-550.54.15.run./NVIDIA-Lin
输入URL到页面展示的核心逻辑链賢843 软件测试理论基础 python
浏览器输入url到页面展示过程（https请求过程）DNS解析域名得到服务器ip地址TCP三次握手TCP三次握手-CSDN博客客户端发送http请求服务器响应请求客户端渲染页面TCP四次挥手两个核心概念FIN包：FIN=1，表示请求终止连接（相当于说“我要挂电话了！”）。ACK包：ACK=1，表示确认收到数据（相当于说“我收到了！”）。四次挥手流程第一次挥手：客户端发送FIN=1的包给
Python的模块使用稍微认真一点 python 经验分享笔记
1.模块和包1.1.模块简而言之，在python中，一个文件（以“.py”为后缀名的文件）就叫做一个模块，每一个模块在python里都被看做是一个独立的文件。模块可以被项目中的其他模块、一些脚本甚至是交互式的解析器所使用，它可以被其他程序引用，从而使用该模块里的函数等功能，使用Python中的标准库也是采用这种方法。导入模块的三种方式：方式一：import模块名#导入整个demo模块importd
Python的界面案例稍微认真一点 python 开发语言笔记经验分享
1.Tk图形用户界面(GUI)Tkinter是使用python进行窗口视窗设计的模块。Tkinter模块(“Tk接口”)是Python的标准TkGUI工具包的接口。作为python特定的GUI界面，是一个图像的窗口，tkinter是python自带的，可以编辑的GUI界面，用来入门，熟悉窗口视窗的使用，非常有必要。提供tk支持的模块包括：模块说明tkinterTK主模块tkinter.colorc
基于扩展方法实现C#安全集合操作工具包（含完整源码） WangMing_X C#实现各种功能工具集 c#安全集合
一、安全集合操作的价值在日常开发中，集合操作引发的NullReferenceException、IndexOutOfRangeException等异常占比高达35%。本工具包通过扩展方法实现以下核心场景的安全防护：安全索引访问防止数据绑定、列表遍历时的越界崩溃空集合防御处理避免foreach空集合导致的逻辑异常批量操作增强简化集合合并、筛选等批量操作深拷贝支持解决引用类型集合修改时的副作用问题二、
VSCode安装及配置Go开发环境 weixin_42764969 Tools
全篇目录---我们不生产知识，我们只做知识的搬运工。1、VSCode的安装下载安装简单使用2、Go开发环境下载安装下载Go安装包配置GOPATH环境变量GOPATH目录介绍3、配置VSCode的Go开发环境3.1、安装Go开发扩展3.2、安装Go开发工具包解决方法一：有梯子就不怕墙高解决方法二：将package下载到本地解决方法三：设置镜像一劳永逸3.3第一个Go程序HelloWorld.本文参考
运行go mod tidy报错 Amber_37 golang 开发语言后端
golang项目运行一些网上的项目或者陈旧的项目经常遇到gomodtidy执行失败分析1.包升级了,路径改了找到对应包进行升级,有的改版本号有的改路径2.gosum校验失败报错信息verifyingmodule:missingGOSUMDB使用国内镜像,gosumdb依然设置为空,是完全兼容的go国内镜像goenv-wGO111MODULE=ongoenv-wGOPROXY=https://gop
大模型生成人物关系思维导图的实战教程 herosunly 大模型生成人物关系生成思维导图实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了大模型生成人物关系思维导图的实战教程，希望对使用大语言模型的同学们有所帮
如何安装dotenv，避坑指南，安装包的包名有误？兰若姐姐 AI大模型 python 开发语言 chatgpt
嗨，大家好，我是蓝若姐姐。最近在研究AI大模型，想写一个调用openai接口的demo，结果发现在装一个三方库的时候一直报错，mac电脑安装dotenv报错，具体情况是执行这个命令：pipinstalldotenv遇到报错：error:subprocess-exited-with-error，pipsubprocesstoinstallbackenddependenciesdidnotrunsuc
轻松掌握：Milvus向量数据库部署与RAG使用技巧威研威语人工智能数据库 milvus 数据库人工智能 RAG
Milvus简介Milvus是一款开源的向量数据库，由Zilliz开发并维护，适合用于机器学习和人工智能领域。是一款专为处理向量查询而设计的数据库，Milvus能够对万亿级向量进行索引。Milvus官网：https://milvus.io/Milvus中文文档：https://www.milvus-io.com/Milvus部署环境准备Linux操作系统Docker19.03或更高版本Docker
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
Maven的安装配置 2301_82243979 作者\/maven java
（注：文章是前段时间写的忘记发了，防止丢失在此记录一下）Maven是Apache下的纯Java开发的开源项目,是一个项目管理工具,使用Maven对项目进行构建,依赖管理。依赖管理就是一个项目中要使用第三方jar包才可以运行。Maven正是对这些jar包进行规范化管理，所以在Maven的项目中只需要在pom.xml中添加jar包的坐标,自动从Maven仓库中下载jar包,运行即可。Maven项目对比
征程 6 基于 Linux 和 Node-Locked License 配置 DSP 开发环境自动驾驶算法
说明：该文档以征程6上使用的Q8DSP安装为例，同样的步骤在征程5上使用方法类似只是征程6使用的DSP为VP61.获取所需文件在配置征程6的DSP开发环境前，您需要获取以下文件：标准工具链发布包部分（请联系地平线项目对接人获取）OpenExplorer算法工具链Docker镜像OpenExplorer算法工具链交付包（OE包中提供了大量示例，包括DSP示例）OpenExplorer算法工具链中文文
吴恩达出手，开源最新Python包，一个接口调用OpenAI等模型 Bryan Ding python
用相同的代码方式调用OpenAI、Anthropic、Google等发布的大模型，还能实现便捷的模型切换和对比测试。刚刚，AI著名学者、斯坦福大学教授吴恩达最新开源项目实现了。吴恩达在推文中宣布了这一好消息开源新的Python包：aisuite！这个工具可以让开发者轻松使用来自多个提供商的大型语言模型。在谈到为何构建这个项目时，吴恩达表示构建应用时，发现与多个提供商集成非常麻烦。aisuite正是
Perl包相关 weixin_30500473
名称冲突问题假如在sum2.pm中使用require导入了一个代码文件sum1.pm：#!/usr/bin/envperlusestrict;usewarnings;use5.010;require'/perlapp/sum1.pm';subsum{say"sum2:sum()";}1;如果在sum1.pm中也有一个sum子程序：#!/usr/bin/envperlusestrict;usewar
kubernetes-helm详细介绍及使用冷漠程序员小哥哥 kubernetes kubernetes kuberctl docker
致读者完整入门示例请参考：Helm完整入门实战Helm本指南介绍了使用Helm来管理Kubernetes集群上的软件包的基础知识。在这之前，假定您已经安装了Helm客户端。如果您仅对运行一些快速命令感兴趣，则不妨从快速入门指南开始。本章包含了Helm命令的详细说明，并解释如何使用Helm。三大概念Chart代表着Helm包。它包含在Kubernetes集群内部运行应用程序，工具或服务所需的所有资源
python常用的第三方库下载方法 ZJ_star_1220 pycharm ide python
方法一：在windows系统中使用pip命令下载打开dos窗口输入命令“pipinstallselenium“后按回车键，看到successfully既安装成功。其他常用的命令：【pipinstallselenium==4.4.3】安装指定版本的库/包【pipinstallselenium】安装最新版本的库/包【pipshowselenium】查看库/包的安装路径、版本号【pipuninstall
HTML星球大冒险之路线图我自纵横2023 HTML教程 html 前端
第一章：欢迎来到HTML星球！1.1宇宙的基石：HTML是什么？比喻：HTML是网页世界的「乐高积木」，用标签搭建一切可见内容目标：理解HTML的作用，掌握第一个声明1.2认识HTML文档的「骨骼结构」趣味比喻：HTML文档像汉堡包是包装盒（根标签）是配料表（元信息）是汉堡本体（可见内容）示例：打印「Hello,HTML星球！」第二章：标签大狂欢：从基础到变形2.1文本标签的魔法咒语✨幽默教学：：
ollama官方安装包哈拉少12 人工智能
一、官方安装包基本信息最新版本‌Windows版：v0.6.0.0（国内镜像版，大小999.8M）‌Linux版：v0.6.0（官方版，大小1.59G）‌macOS版：支持通过官网直接下载（版本号与Windows/Linux同步）‌支持平台‌桌面端：Windows（Win7及以上）、Linux（x86_64/ARM64）、macOS‌容器化部署：支持Docker（需配合DockerDesktop）
手动部署？NONONO，动态上传热部署才是王道！！架构文摘JGWZ 接口学习后端 spring
近期开发系统过程中遇到的一个需求，系统给定一个接口，用户可以自定义开发该接口的实现，并将实现打成jar包，上传到系统中。系统完成热部署，并切换该接口的实现。定义简单的接口这里以一个简单的计算器功能为例，接口定义比较简单，直接上代码。public interface Calculator { int calculate(int a, int b); int add(int a, int
apt/yum/dnf/dkg命令详细：软件安装黑子哥呢？运维 linux 运维
apt命令apt（AdvancedPackageTool）是Debian及其衍生版（如Ubuntu）中广泛使用的软件包管理工具。它提供了一系列简洁且易于记忆的命令，用于查找、安装、升级、删除和管理软件包。下面将对apt命令进行详细解析。1.apt命令的基本用法apt命令的基本语法如下：apt[options][command][package...]options：可选参数，用于指定命令的行为，如
PINN物理信息网络 | 基于物理信息神经网络PINN求解Burger方程算法如诗物理信息网络（PINN）神经网络人工智能深度学习物理信息网络
基于物理信息神经网络（PINN）求解Burger方程的研究背景源于对非线性偏微分方程（PDE）求解方法的不断探索和改进。传统的数值方法，如有限差分法和有限元法，通常需要进行网格离散化和迭代求解，对于复杂的非线性问题计算成本较高。因此，研究人员开始探索基于机器学习和神经网络的新方法来求解PDEs。神经网络在近年来取得了显著的发展，能够通过学习大量数据来建立输入和输出之间的复杂映射关系。然而，将神经网
python实现KNN算法的手写数字识别：深入解析与完整项目流程快撑死的鱼 Python算法精解算法
随着人工智能和机器学习的快速发展，图像识别技术在多个领域得到广泛应用。而手写数字识别作为图像识别的典型场景之一，已经成为研究者和开发者学习、应用机器学习算法的经典项目。本文将深入解析如何使用Python编程语言，结合KNN（K-最近邻）算法实现手写数字识别系统。文章不仅介绍了算法的核心原理，还从用户交互、图像处理、数据预处理等多个角度对整个项目进行了全方位的讲解。读者通过本文，可以全面掌握手写数字
如何进行OceanBase 运维工具的部署和表性能优化 oceanbase
随着OceanBase数据库应用的日益深入，数据量不断攀升，单个表中存储数百万乃至数千万条数据的情况变得愈发普遍。因此，部署专门的运维工具、实施针对性的表性能优化策略，以及加强指标监测工作，都变得更为重要。以下为基于我们的使用场景，所采取的一些部署和优化措施分享。一、OCP部署升级1．OCP升级（1）4.2.1BP1升级到4.2.2，本来以为毫无波澜但是下载完毕一键包并完成前期准备工作启动后发现无
云原生周刊：基于 KubeSphere LuBan 架构打造DeepSeek 插件云计算
开源项目推荐KubeAIKubeAI是一个K8s上的AI推理操作器，旨在简化在生产环境中部署和管理大型语言模型（LLM）、向量嵌入和语音处理等机器学习模型。它提供与OpenAI兼容的API，支持在CPU和GPU上运行，并具备按需自动扩缩容的能力。KubeAI无需依赖Istio、Knative等其他系统，能够在几乎任何K8s集群中开箱即用。此外，它内置了模型代理，优化了键值缓存利用率，从而显著提升系
【Python安装】2024年最新下载安装教程！详细步骤，有这一篇就够了！！！「已注销」 python 开发语言
（点击领取Python安装包+学习资料）Python安装说明1.访问Python官网首先，访问Python的官方网站：WelcometoPython.org。2.下载Python安装程序在官网首页，找到“Downloads”部分。根据你的操作系统（Windows,macOS,Linux等）选择合适的版本下载。对于大多数用户，推荐下载最新版本的Python3.x（例如Python3.9或更高版本）。
用户数据报协议（User Datagram Protocol，UDP） Dream Algorithm 网络
用户数据报协议（UserDatagramProtocol，UDP）是一种简单的、无连接的传输层协议，位于TCP/IP协议栈中，与TCP（传输控制协议）并列。UDP提供了一种低开销、低延迟的数据传输方式，适用于对实时性要求较高、但对可靠性要求相对较低的应用场景。UDP的主要特点无连接：UDP不需要在通信前建立连接（如TCP的三次握手），直接发送数据包。发送方和接收方之间没有固定的连接状态。不可靠传输
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

Spark0.9.0机器学习包MLlib-Classification代码阅读

你可能感兴趣的:(Spark0.9.0机器学习包MLlib-Classification代码阅读)