那伊抹微笑

【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习 | ApacheCN

中文文档: http://sklearn.apachecn.org/cn/0.19.0/tutorial/basic/tutorial.html

英文文档: http://sklearn.apachecn.org/en/0.19.0/tutorial/basic/tutorial.html

GitHub: https://github.com/apachecn/scikit-learn-doc-zh（觉得不错麻烦给个 Star，我们一直在努力）

贡献者: https://github.com/apachecn/scikit-learn-doc-zh#贡献者

使用 scikit-learn 介绍机器学习 | ApacheCN

内容提要

在本节中，我们介绍一些在使用 scikit-learn 过程中用到的机器学习词汇，并且给出一些例子阐释它们。

机器学习：问题设置

一般来说，一个学习问题通常会考虑一系列 n 个样本数据，然后尝试预测未知数据的属性。如果每个样本是多个属性的数据（比如说是一个多维记录），就说它有许多“属性”，或称 features(特征) 。

我们可以将学习问题分为几大类:

监督学习 , 其中数据带有一个附加属性，即我们想要预测的结果值（点击此处转到 scikit-learn 监督学习页面）。这个问题可以是:

分类 : 样本属于两个或更多个类，我们想从已经标记的数据中学习如何预测未标记数据的类别。分类问题的一个例子是手写数字识别，其目的是将每个输入向量分配给有限数目的离散类别之一。我们通常把分类视作监督学习的一个离散形式（区别于连续形式），从有限的类别中，给每个样本贴上正确的标签。

回归: 如果期望的输出由一个或多个连续变量组成，则该任务称为回归. 回归问题的一个例子是预测鲑鱼的长度是其年龄和体重的函数。

无监督学习, 其中训练数据由没有任何相应目标值的一组输入向量x组成。这种问题的目标可能是在数据中发现彼此类似的示例所聚成的组，这种问题称为聚类 , 或者，确定输入空间内的数据分布，称为密度估计，又或从高维数据投影数据空间缩小到二维或三维以进行 可视化 （点击此处转到 scikit-learn 无监督学习页面）。

训练集和测试集

机器学习是从数据的属性中学习，并将它们应用到新数据的过程。这就是为什么机器学习中评估算法的普遍实践是把数据分割成 训练集 （我们从中学习数据的属性）和 测试集 （我们测试这些性质）。

加载示例数据集

scikit-learn 提供了一些标准数据集，例如用于分类的 iris 和 digits 数据集和波士顿房价回归数据集 .

在下文中，我们从我们的 shell 启动一个 Python 解释器，然后加载 iris 和 digits 数据集。我们的符号约定是 $ 表示 shell 提示符，而 >>> 表示 Python 解释器提示符:

 
     $ python
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()

数据集是一个类似字典的对象，它保存有关数据的所有数据和一些元数据。该数据存储在 .data 成员中，它是 n_samples, n_features 数组。在监督问题的情况下，一个或多个响应变量存储在 .target 成员中。有关不同数据集的更多详细信息，请参见专用数据集部分 .

例如，在数字数据集的情况下，digits.data 使我们能够得到一些用于分类的样本特征:

 
     >>> 
     >>> print(digits.data)  
[[  0.   0.   5. ...,   0.   0.   0.]
 [  0.   0.   0. ...,  10.   0.   0.]
 [  0.   0.   0. ...,  16.   9.   0.]
 ...,
 [  0.   0.   1. ...,   6.   0.   0.]
 [  0.   0.   2. ...,  12.   0.   0.]
 [  0.   0.  10. ...,  12.   1.   0.]]
 
    

并且 digits.target 表示了数据集内每个数字的真实类别，也就是我们期望从每个手写数字图像中学得的相应的数字标记:

 
     >>> 
     >>> digits.target
array([0, 1, 2, ..., 8, 9, 8])

数据数组的形状

数据总是 2D 数组，形状 (n_samples, n_features) ，尽管原始数据可能具有不同的形状。在数字的情况下，每个原始样本是形状 (8, 8) 的图像，可以使用以下方式访问:

 
      >>> 
      >>> digits.images[0]
array([[  0.,   0.,   5.,  13.,   9.,   1.,   0.,   0.],
       [  0.,   0.,  13.,  15.,  10.,  15.,   5.,   0.],
       [  0.,   3.,  15.,   2.,   0.,  11.,   8.,   0.],
       [  0.,   4.,  12.,   0.,   0.,   8.,   8.,   0.],
       [  0.,   5.,   8.,   0.,   0.,   9.,   8.,   0.],
       [  0.,   4.,  11.,   0.,   1.,  12.,   7.,   0.],
       [  0.,   2.,  14.,   5.,  10.,  12.,   0.,   0.],
       [  0.,   0.,   6.,  13.,  10.,   0.,   0.,   0.]])
 
     

该数据集上的简单示例说明了如何从原始数据开始调整，形成可以在 scikit-learn 中使用的数据。

从外部数据集加载

要从外部数据集加载，请参阅加载外部数据集.

学习和预测

在数字数据集的情况下，任务是给出图像来预测其表示的数字。我们给出了 10 个可能类（数字 0 到 9）中的每一个的样本，我们在这些类上拟合一个估计器，以便能够预测未知的样本所属的类。

在 scikit-learn 中，分类的估计器是一个 Python 对象，它实现了 fit(X, y) 和 predict(T) 等方法。

估计器的一个例子类 sklearn.svm.SVC ，实现了支持向量分类。估计器的构造函数以相应模型的参数为参数，但目前我们将把估计器视为即可:

 
     >>> 
     >>> from sklearn import svm
>>> clf = svm.SVC(gamma=0.001, C=100.)

选择模型的参数

在这个例子中，我们手动设置 gamma 值。不过，通过使用网格搜索及交叉验证等工具，可以自动找到参数的良好值。

我们把我们的估计器实例命名为 clf ，因为它是一个分类器(classifier)。我们需要它适应模型，也就是说，要它从模型中*学习*。这是通过将我们的训练集传递给 fit 方法来完成的。作为一个训练集，让我们使用数据集中除最后一张以外的所有图像。我们用 [:-1] Python 语法选择这个训练集，它产生一个包含 digits.data 中除最后一个条目(entry)之外的所有条目的新数组

 
     >>> 
     >>> clf.fit(digits.data[:-1], digits.target[:-1])  
SVC(C=100.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma=0.001, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
 
    

现在你可以预测新的值，特别是我们可以向分类器询问 digits 数据集中最后一个图像（没有用来训练的一条实例)的数字是什么:

 
     >>> 
     >>> clf.predict(digits.data[-1:])
array([8])

相应的图像如下:

正如你所看到的，这是一项具有挑战性的任务：图像分辨率差。你是否认同这个分类？

这个分类问题的一个完整例子可以作为一个例子来运行和学习：识别手写数字。 Recognizing hand-written digits.

模型持久化

可以通过使用 Python 的内置持久化模块（即 pickle ）将模型保存:

 
     >>> 
     >>> from sklearn import svm
>>> from sklearn import datasets
>>> clf = svm.SVC()
>>> iris = datasets.load_iris()
>>> X, y = iris.data, iris.target
>>> clf.fit(X, y)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

>>> import pickle
>>> s = pickle.dumps(clf)
>>> clf2 = pickle.loads(s)
>>> clf2.predict(X[0:1])
array([0])
>>> y[0]
0
 
    

在scikit的具体情况下，使用 joblib 替换 pickle（ joblib.dump & joblib.load ）可能会更有趣，这对大数据更有效，但只能序列化 (pickle) 到磁盘而不是字符串:

 
     >>> 
     >>> from sklearn.externals import joblib
>>> joblib.dump(clf, 'filename.pkl')

之后，您可以加载已保存的模型（可能在另一个 Python 进程中）:

 
     >>> 
     >>> clf = joblib.load('filename.pkl')

Warning

joblib.dump 以及 joblib.load 函数也接受 file-like（类文件）对象而不是文件名。有关 Joblib 的数据持久化的更多信息，请点击此处。

请注意，pickle 有一些安全性和维护性问题。有关使用 scikit-learn 的模型持久化的更多详细信息，请参阅模型持久化部分。

规定

scikit-learn 估计器遵循某些规则，使其行为更可预测。

类型转换

除非特别指定，输入将被转换为 float64

 
      >>> 
      >>> import numpy as np
>>> from sklearn import random_projection

>>> rng = np.random.RandomState(0)
>>> X = rng.rand(10, 2000)
>>> X = np.array(X, dtype='float32')
>>> X.dtype
dtype('float32')

>>> transformer = random_projection.GaussianRandomProjection()
>>> X_new = transformer.fit_transform(X)
>>> X_new.dtype
dtype('float64')
 
     

在这个例子中，X 原本是 float32 ，被 fit_transform(X) 被转换成 float64 。

回归目标被转换为 float64 ，但分类目标维持不变:

 
      >>> 
      >>> from sklearn import datasets
>>> from sklearn.svm import SVC
>>> iris = datasets.load_iris()
>>> clf = SVC()
>>> clf.fit(iris.data, iris.target)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

>>> list(clf.predict(iris.data[:3]))
[0, 0, 0]

>>> clf.fit(iris.data, iris.target_names[iris.target])  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

>>> list(clf.predict(iris.data[:3]))  
['setosa', 'setosa', 'setosa']
 
     

这里，第一个 predict() 返回一个整数数组，因为在 fit 中使用了 iris.target （一个整数数组）。第二个 predict() 返回一个字符串数组，因为 iris.target_names 是一个字符串数组。

再次训练和更新参数

估计器的超参数可以通过 sklearn.pipeline.Pipeline.set_params 方法在实例化之后进行更新。调用 fit() 多次将覆盖以前的 fit() 所学到的参数:

 
      >>> 
      >>> import numpy as np
>>> from sklearn.svm import SVC

>>> rng = np.random.RandomState(0)
>>> X = rng.rand(100, 10)
>>> y = rng.binomial(1, 0.5, 100)
>>> X_test = rng.rand(5, 10)

>>> clf = SVC()
>>> clf.set_params(kernel='linear').fit(X, y)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='linear',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
>>> clf.predict(X_test)
array([1, 0, 1, 1, 0])

>>> clf.set_params(kernel='rbf').fit(X, y)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
>>> clf.predict(X_test)
array([0, 0, 0, 1, 0])
 
     

在这里，估计器被 SVC() 构造之后，默认内核 rbf 首先被改变到 linear ，然后改回到 rbf 重新训练估计器并进行第二次预测。

多分类与多标签拟合

当使用 多类分类器 时，执行的学习和预测任务取决于参与训练的目标数据的格式:

 
      >>> 
      >>> from sklearn.svm import SVC
>>> from sklearn.multiclass import OneVsRestClassifier
>>> from sklearn.preprocessing import LabelBinarizer

>>> X = [[1, 2], [2, 4], [4, 5], [3, 2], [3, 1]]
>>> y = [0, 0, 1, 1, 2]

>>> classif = OneVsRestClassifier(estimator=SVC(random_state=0))
>>> classif.fit(X, y).predict(X)
array([0, 0, 1, 1, 2])
 
     

在上述情况下，分类器被使用一个含有多个标签的一维数组训练，因此 predict() 方法提供相应的多类别预测。分类器也可以通过二进制表示的的标签的二维数组来训练:

 
      >>> 
      >>> y = LabelBinarizer().fit_transform(y)
>>> classif.fit(X, y).predict(X)
array([[1, 0, 0],
       [1, 0, 0],
       [0, 1, 0],
       [0, 0, 0],
       [0, 0, 0]])
 
     

这里，使用 LabelBinarizer 使目标向量 y 被转化成二维数组的标签表示。在这种情况下， predict() 返回一个表示相应多重标签预测的 2d 矩阵。

请注意，第四个和第五个实例返回全零向量，表明它们不能匹配用来训练中的目标标签中的任意一个。使用多分类输出，类似地可以为一个实例分配多个标签:

 
      >> from sklearn.preprocessing import MultiLabelBinarizer
>> y = [[0, 1], [0, 2], [1, 3], [0, 2, 3], [2, 4]]
>> y = MultiLabelBinarizer().fit_transform(y)
>> classif.fit(X, y).predict(X)
array([[1, 1, 0, 0, 0],
       [1, 0, 1, 0, 0],
       [0, 1, 0, 1, 0],
       [1, 0, 1, 1, 0],
       [0, 0, 1, 0, 1]])
 
     

在这种情况下，用来训练分类器的多个向量被赋予多个标记， MultiLabelBinarizer 被用来二进制化多个标签的二维数组，使之用来训练。 predict() 函数返回带有多个标记的二维数组作为每个实例的结果。

中文文档: http://sklearn.apachecn.org/cn/0.19.0/tutorial/basic/tutorial.html

英文文档: http://sklearn.apachecn.org/en/0.19.0/tutorial/basic/tutorial.html

GitHub: https://github.com/apachecn/scikit-learn-doc-zh（觉得不错麻烦给个 Star，我们一直在努力）

贡献者: https://github.com/apachecn/scikit-learn-doc-zh#贡献者

有兴趣的大佬们也可以和我们一起来维护，持续更新中。。。

机器学习交流群: 629470233

sklearn.ConfusionMatrixDisplay可视化混淆矩阵 Cachel wood python机器学习和数据挖掘 sklearn 矩阵人工智能 python 机器学习 vue.js java
文章目录ConfusionMatrixDisplay详细解释更多定制化ConfusionMatrixDisplayConfusionMatrixDisplay是scikit-learn库中用于可视化混淆矩阵的一个实用工具。混淆矩阵是一种常用的评估分类模型性能的工具，它可以直观地展示模型在各个类别上的预测结果与真实标签之间的关系。下面详细介绍如何使用ConfusionMatrixDisplay进行混
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：YaoWang,EddieYan本文介绍如何为x86CPU调优卷积神经网络。注意，本教程不会在Windows或最新版本的macOS上运行。如需运行，请将本教程的主体放在if__name__=="__main__":代码块中。impor
吴恩达-机器学习-多元线性回归模型代码 StrawBerryTreea 机器学习机器学习线性回归 python 吴恩达
吴恩达《机器学习》2022版第一节第二周多元线性回归房价预测简单实现以下以下共两个实验，都是通过调用sklearn函数，分别实现了一元线性回归和多元线性回归的房价预测。一、一元线性回归importnumpyasnpnp.set_printoptions(precision=2)fromsklearn.linear_modelimportLinearRegression#输入数据X_train=np
Spring Boot 开发入门圣心 spring boot
文章来源：开发您的第一个SpringBoot应用程序(DevelopingYourFirstSpringBootApplication)_SpringBoot3.4.0中文文档(官方文档中文翻译)|Spring教程——CADN开发者文档中心本节介绍如何开发一个小型的“HelloWorld！”Web应用程序，其中重点介绍了SpringBoot的一些关键功能。您可以选择Maven或Gradle作为构建
PyTorch中文/英文官方文档&教程资源三千の世界 Python DataAnalysis Computer Science pytorch
PyTorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/PyTorch英文文档https://pytorch.org/docs/stable/index.htmlPyTorch官方教程-PyTorch教程1.1.0文档https://pytorch.org/tutorials/
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
【机器学习】多元线性回归 T0uken Python全栈开发 1024程序员节机器学习算法线性回归
在实际应用中，许多问题都包含多个特征（输入变量），而不仅仅是单个输入变量。多元线性回归是线性回归的扩展，它能够处理多个输入特征并建立它们与目标变量的线性关系。本教程将系统性推演多元线性回归，包括向量化处理、特征放缩、梯度下降的收敛性和学习率选择等，并使用numpy实现。最后，我们会通过sklearn快速实现多元线性回归模型。多元线性回归模型简介多元线性回归的模型公式为：y=X⋅w+by=X\cdo
Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
【vLLM 学习】安装
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM是一个Python库，包含预编译的C++和CUDA(12.1)二进制文件。依赖环境操作系统：LinuxPython：3.8-3.12GPU：计算能力7.0或更高（例如V100、T4、RTX20xx、A100、L
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
Hutool工具库使用记录 namelessmyth Java java
Hutool简介和ApacheCommons，Googleguava类似的工具包。但是国产的，有着完善的中文文档和代码中文注释。对于英文不好的程序猿，这点特别有吸引力。还有就是本人的一贯原则就是只要国产的和国外的水平相差不大的情况下，优先支持国产。本人的使用体验是：hutool集合了Apache和guava的优点，而且不依赖第三方jar包。举个例子来说，Hutool-log会自动按下面的顺序自动识
字节跳动实习生和校招生内推飞300 python javascript php 业界资讯算法
机器学习算法实习生-平台治理1、2026届硕士及以上学位在读，计算机等相关专业优先；2、有扎实的代码能力，熟悉深度学习/图神经网络/机器学习框架，如Pytorch、Tensorflow、DGL、Pyg、Sklearn等；3、熟悉机器学习/图学习/序列学习算法中的一项或者多项，如图建模、时序信号建模、节点/子图分类、社区挖掘、表征学习、自监督/半监督学习等，有一定深度和广度；4、熟悉相关算法在数据挖
第三章回归训练实战（以预测新冠感染人数为例）不吃香菜（扣1复活版）深度学习入门笔记深度学习人工智能
完整项目代码（预测第三天的新冠感染人数）fromsklearn.feature_selectionimportSelectKBestfromsklearn.feature_selectionimportchi2importcsv#读CSVimportnumpyasnpimporttimeimportmatplotlib.pyplotaspltimportpandasaspdfromtorchimp
消息队列随笔 3-抽象配置(spring-cloud-stream-rabbit) 肯尼思布赖恩埃德蒙中间件 spring java-rabbitmq rabbitmq
0.慢慢的做梦…十五.SpringCloud极简入门-SpringCloudStream消息驱动(版本有些过时了)SpringCloudStream进阶配置——高可用（二）——死信队列rabbitmq-client中文文档借助bindingRoutingKey属性配置exchange使用的路由键spring-cloud-stream整合rabbitmq消息分区rabbitmq消息补偿方案Rabbi
Golang 基础库之Strconv 家了叭叭 Golang golang c语言开发语言
Strconv参考资料：http://c.biancheng.net/view/vip_7305.htmlhttps://vimsky.com/examples/list/code-usage-page-1.html标准库中文文档：https://studygolang.com/pkgdocstrconv包实现了基本数据类型和其字符串表示的相互转换。实现了基本数据类型与其字符串表示的转换，主要有以
Svelte 最新中文文档翻译（9）—— bind: 模板语法
前言Svelte，一个非常“有趣”、用起来“很爽”的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目，也是我做个人项目的首选技术栈。目前Svelte基于Svelte5发布了最新的官方文档，但却缺少对应的中文
Python编程笔记我真不会起名字啊 python 开发语言
关于python在安装第三方库时遇到的问题（numpy、matplotlib、scipy、scikit-learn）软件设计模式课程设计---Python实现学生信息管理系统（MySQL数据库+前端可视化）Python实现图形的几何变换(平移、旋转、错切、反射、缩放)Python实现三次参数样条曲线、三次Bezier曲线、三次B样条曲线（tkinter实现输入框，matplotlib绘制曲线）
Mongodb快速上手是小V呀中间件 mongodb 数据库文档型数据库中间件
1.1Mongodb介绍官网：https://www.mongodb.com/中文官网：https://www.mongodb.com/zh-cn中文文档：https://www.mongodb.com/zh-cn/docs/MongoDB是一个开源的NoSQL数据库，采用文档导向（Document-Oriented）的存储方式，基于分布式架构，适合存储大量结构化或半结构化数据。通过灵活的sche
Python中的决策树算法探索 Soft_Leader 算法 python 决策树
在Python中，决策树算法是一种常用的机器学习技术，用于分类和回归问题。下面我们将探索如何使用Python中的scikit-learn库来实现决策树算法，并简要介绍其基本概念和用法。1.安装必要的库如果你还没有安装scikit-learn库，你可以使用pip来安装它：bash复制代码pipinstall-Uscikit-learn2.导入必要的库和模块python复制代码fromsklearn.
Svelte 最新中文文档翻译（8）—— @html、@const、@debug 模板语法
前言Svelte，一个非常“有趣”、用起来“很爽”的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目，也是我做个人项目的首选技术栈。目前Svelte基于Svelte5发布了最新的官方文档，但却缺少对应的中文
sklearn_pandas.DataFrameMapper的用法 zoujiahui_2018 #Pytorch sklearn pandas 人工智能
文章目录介绍主要作用基本用法示例对不同列应用不同的转换器对多列应用相同的转换器输出为PandasDataFrame注意事项转换器的适用性：输出格式：与scikit-learn的兼容性：介绍DataFrameMapper是sklearn-pandas库中的一个工具，主要用于将PandasDataFrame与scikit-learn的预处理工具无缝结合。它的作用是将DataFrame的列映射到特定的特
Svelte 最新中文文档翻译（7）—— snippet 与 @render
前言Svelte，一个非常“有趣”、用起来“很爽”的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目，也是我做个人项目的首选技术栈。目前Svelte基于Svelte5发布了最新的官方文档，但却缺少对应的中文
7. React Hooks 草木红 #React react.js 前端前端框架
官方文档：https://zh-hans.react.dev/reference/react/hooks官方文档：https://zh-hans.legacy.reactjs.org/docs/hooks-intro.htmlRouter6的一个中文文档：https://baimingxuan.github.io/react-router6-doc/react：版本18.2.0node：版本18.
在macOS上构建Flutter iOS应用 ClaNNEd@ Flutter iOS 应用构建 macos flutter ios
本文是基于安装和环境配置|Flutter中文文档-Flutter中文开发者网站-Flutter的实践在macOS上构建FlutteriOS应用在安装和运行Flutter前，你的macOS环境必须满足以下要求：硬件要求你的macOSFlutter开发环境必须满足以下最低硬件要求。要求最低推荐CPU核心数48内存(GB)816显示器分辨率（像素）WXGA(1366x768)FHD(1920x1080)
【python 机器学习】sklearn转换器与预估器人才程序员杂谈 python 机器学习 sklearn 人工智能目标检测深度学习神经网络
文章目录sklearn转换器与预估器1.什么是转换器（Transformer）？通俗介绍：学术解释：2.什么是预估器（Estimator）？通俗介绍：学术解释：3.转换器与预估器的共同点4.转换器与预估器的区别5.使用`sklearn`中的转换器与预估器5.1示例：数据标准化（转换器）5.2示例：模型训练与预测（预估器）6.使用`Pipeline`结合转换器与预估器7.总结sklearn转换器与预
自主学习ai 版本0.01 pps-key 人工智能 AI写作 python 算法大数据机器学习
以下是一个简单的自主学习AI示例代码框架，使用Python和在线学习机制实现。这个示例包含基础的数据处理、模型更新和知识存储功能：pythonimportnumpyasnpfromsklearn.linear_modelimportSGDClassifierfromsklearn.feature_extraction.textimportTfidfVectorizerimportpickleimp
Python与R机器学习（1）支持向量机宠物与不尤编程左手python右手R 支持向量机机器学习 python r语言
以下是对Python与R在支持向量机（SVM）实现上的核心区别分析及完整示例代码：一、核心差异对比特征Python(scikit-learn)R(e1071/kernlab)核心库sklearn.svm.SVC/SVRe1071::svm()或kernlab::ksvm()语法范式面向对象（先初始化模型后拟合）函数式+公式接口（y~x1+x2）核函数支持linear,poly,rbf,sigmoi
vue3+vite使用Monaco-editor 小杨爱编程实用技巧 vue.js 前端 javascript
安装Monaco-editornpminstallmonaco-editor安装VitePluginMonacoEditorvdesjs/vite-plugin-monaco-editor-Vite中文文档npminstall--save-devvite-plugin-monaco-editorvite.config.ts:import{defineConfig}from'vite';import
牛掰的算法系列：K折交叉验证（KFold）常见使用方法羽蒙等风来机器学习算法机器学习 python
讲解了交叉验证的基本思想之后，接下来将学习几个常用的交叉迭代器及其使用方法。1.K折交叉验证K折交叉验证（KFold）会将数据集划分为k个分组，成为折叠（fold）。如果k的值等于数据集实例的个数，那么每次的测试集就只有一个，这种处理方式称为“留一”。Scikit中提供了KFold方法进行分组。#导入相关模块In[1]:fromsklearn.model_selectionimportKFold#
KMeans聚类实战2 浊酒南街 #kmeans 聚类 python
目录NBA球员聚类--未知k值的情况NBA球员聚类–未知k值的情况#导入第三方模块importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearnimportmetricsimportseabornassnsfromsklearnimportpreprocess
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

【Scikit-Learn 中文文档】使用 scikit-learn 介绍机器学习 | ApacheCN

使用 scikit-learn 介绍机器学习 | ApacheCN

机器学习：问题设置

加载示例数据集

学习和预测

模型持久化

规定

类型转换

再次训练和更新参数

多分类与多标签拟合

你可能感兴趣的:(Scikit-Learn,中文文档,Sklearn,中文文档)