weixin_39526546

aidlearning开发python使用教程_[译]使用scikit-learn进行机器学习(scikit-learn教程1)

概要：

该章节，我们将介绍贯穿scikit-learn使用中的“机器学习（Machine Learning）”这个词汇，并给出一些简单的学习示例。

前言

scikit-learn (Python机器学习库)

进行数据挖掘和数据分析的简单而高效的工具

任何人都可使用,可在多种场景/上下文复用

基于NumPy,SciPy和matplotlib构建

开放源代码,可用于商业用途_BSD协议

分类

识别一个对象属于那一种类别

应用:垃圾邮件检测,图像识别

算法:SVM(支持向量机),KNN(K近邻),随机森林

回归

预测与某个对象相关联的连续值属性

应用:药物反应,股票价格

算法:线性回归,SVR(支持向量回归),ridge regression(岭回归),LASSO回归

聚类

将相似的对象自动聚集到不同的集合中

应用:顾客细分,分组试验结果

算法:K-Means,谱聚类,mean-shift中值移动

降维

降低随机变量的数目

可视化:可视化,提高效率

算法:PCA(主成分分析),特征选取,非负矩阵分解

模型选取

比较,验证,参数和模型的选择

目标:通过参数调整改进精度

模块:网格搜索,交叉验证,metrics(度量)

预处理

特征提取和正则化

应用: 转换数据以便机器学习算法使用

模块:预处理,特征提取

一、机器学习：问题设定

通常，一个学习问题是通过分析一些数据样本来尝试预测未知数据的属性。如果每一个样本不仅仅是一个单独的数字，比如一个多维的实例（multivariate data），也就是说有着多个属性特征.我们可以把学习问题分成如下的几个大类：

（1）有监督学习

数据带有我们要预测的属性。这种问题主要有如下几种：

①分类

样例属于两类或多类，我们想要从已经带有标签的数据学习以预测未带标签的数据。识别手写数字就是一个分类问题，这个问题的主要目标就是把每一个输出指派到一个有限的类别中的一类。另一种思路去思考分类问题，其实分类问题是有监督学习中的离散形式问题。每一个都有一个有限的分类。对于样例提供的多个标签，我们要做的就是把未知类别的数据划分到其中的一种。

②回归

去过预期的输出包含连续的变量，那么这样的任务叫做回归。根据三文鱼的年纪和中联预测其长度就是一个回归样例。

（2）无监督学习

训练数据包含不带有目标值的输入向量x。对于这些问题，目标就是根据数据发现样本中相似的群组——聚类。或者在输入空间中判定数据的分布——密度估计，或者把数据从高维空间转换到低维空间以用于可视化

训练集和测试集

机器学习是学习一些数据集的特征属性并将其应用于新的数据。这就是为什么在机器学习用来评估算法时一般把手中的数据分成两部分。一部分我们称之为训练集，用以学习数据的特征属性。一部分我们称之为测试集，用以检验学习到的特征属性。

二、加载一个样本数据集

scikit-learn本身带有一些标准数据集。比如用来分类的iris(鸢尾花)数据集、digits(数字)数据集；用来回归的boston house price(波士顿房屋价格) 数据集。

接下来，我们我们从shell开启一个Python解释器并加载iris和digits两个数据集。【译注：一些代码惯例就不写了，提示符>>>之类的学过Python的都懂】

$ python

>>>from sklearn import datasets #从sklearn包中加载数据集模块

>>>iris = datasets.load_iris() #加载鸢尾花数据集

>>>digits = datasets.load_digits() #加载数字图像数据集

一个数据集是一个包含数据所有元数据的类字典对象。这个数据存储在 '.data'成员变量中，是一个$n*n$的数组，行表示样例，列表示特征。在有监督学习问题中，一个或多个响应变量（Y）存储在‘.target’成员变量中。不同数据集的更多细节可以在专属章节中找到。

例如，对于digits数据集，digits.data可以访问得到用来对数字进行分类的特征：

>>>print(digits.data)

[[ 0. 0. 5. ..., 0. 0. 0.]

[ 0. 0. 0. ..., 10. 0. 0.]

[ 0. 0. 0. ..., 16. 9. 0.]

...,

[ 0. 0. 1. ..., 6. 0. 0.]

[ 0. 0. 2. ..., 12. 0. 0.]

[ 0. 0. 10. ..., 12. 1. 0.]]

digits.target 就是数字数据集各样例对应的真实数字值。也就是我们的程序要学习的。

>>>digits.target

array([0, 1, 2, ..., 8, 9, 8])

数据数组的形状

尽管原始数据也许有不同的形状，但实际使用的数据通常是一个二维数组（n个样例，n个特征）。对于数字数据集，每一个原始的样例是一张（8 x 8）的图片,也能被使用：

>>>digits.images[0]

array([[ 0., 0., 5., 13., 9., 1., 0., 0.],

[ 0., 0., 13., 15., 10., 15., 5., 0.],

[ 0., 3., 15., 2., 0., 11., 8., 0.],

[ 0., 4., 12., 0., 0., 8., 8., 0.],

[ 0., 5., 8., 0., 0., 9., 8., 0.],

[ 0., 4., 11., 0., 1., 12., 7., 0.],

[ 0., 2., 14., 5., 10., 12., 0., 0.],

[ 0., 0., 6., 13., 10., 0., 0., 0.]])

三、学习和预测

对于数字数据集（digits dataset），任务是预测一张图片中的数字是什么。数字数据集提供了0-9每一个数字的可能样例，可以用它们来对位置的数字图片进行拟合分类。

在scikit-learn中，用以分类的拟合（评估）函数是一个Python对象，具体有fit(X,Y)和predic(T)两种成员方法。

其中一个拟合（评估）样例是sklearn.svmSVC类，它实现了支持向量分类（SVC）。一个拟合（评估）函数的构造函数需要模型的参数，但是时间问题，我们将会把这个拟合（评估）函数作为一个黑箱：

>>>from sklearn import svm

>>>clf = svm.SVC(gamma=0.001, C=100.)

选择模型参数

我们调用拟合（估测）实例clf作为我们的分类器。它现在必须要拟合模型，也就是说，他必须要学习模型。这可以通过把我们的训练集传递给fit方法。作为训练集，我们使用其中除最后一组的所有图像。我们可以通过Python的分片语法[:-1]来选取训练集，这个操作将产生一个新数组，这个数组包含digits.data中除最后一组数据的所有实例。

>>>clf.fit(digits.data[:-1], digits.target[:-1])

SVC(C=100.0, cache_size=200, class_weight=None, coef0=0.0, degree=3,

gamma=0.001, kernel='rbf', max_iter=-1, probability=False,

random_state=None, shrinking=True, tol=0.001, verbose=False)

现在你就可以预测新的数值了。我们可以让这个训练器预测没有作为训练数据使用的最后一张图像是什么数字。

>>>clf.predict(digits.data[-1])

array([8])

相应的图片如下图：

正如你所看到的，这是一个很有挑战的任务：这张图片的分辨率很低。你同意分类器给出的答案吗？

这个分类问题的完整示例在这里识别手写数字，你可以运行并使用它。[译：看本文附录]

四、模型持久化

可以使用Python的自带模块——pickle来保存scikit中的模型：

>>>from sklearn import svm

>>>from sklearn import datasets

>>>clf = svm.SVC()

>>>iris = datasets.load_iris()

>>>X, y = iris.data, iris.target

>>>clf.fit(X, y)

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0, degree=3, gamma=0.0,

kernel='rbf', max_iter=-1, probability=False, random_state=None,

shrinking=True, tol=0.001, verbose=False)

>>>import pickle

>>>s = pickle.dumps(clf)

>>>clf2 = pickle.loads(s)

>>>clf2.predict(X[0])

array([0])

>>>y[0]

对于scikit，也许使用joblib的pickle替代——（joblib.dump&joblib.load）更有趣。因为它在处理带数据时更高效。但是遗憾的是它只能把数据持久化到硬盘而不是一个字符串（译注：搬到string字符串意味着数据在内存中）：

>>>from sklearn.externals import joblib

>>>joblib.dump(clf, 'filename.pkl')

往后你就可以加载这个转储的模型（也能在另一个Python进程中使用），如下：

>>>clf = joblib.load('filename.pkl')

注意：

joblib.dump返回一个文件名的列表，每一个numpy数组元素包含一个clf在文件系统上的名字，在用joblib.load加载的时候所有的文件需要在相同的文件夹下

注意pickle有一些安全和可维护方面的问题。请参考Model persistent 获得在scikit-learn中模型持久化的细节。

五、惯例约定

scikit-learn的各种拟合（评估）函数遵循一些确定的规则以使得他们的用法能够被预想到（译：使得各种学习方法的用法统一起来）

①类型转换

除非特别指定，输入将被转换为float64

import numpy

from sklearn import random_projection

rng = np.random.RandomState(0)

X = rng.rand(10,2000)

X = np.array(X,dtype ='float32')

print x.dtype

transformer = random_projection.GaussianRandomProjection()

X_new = transformer.fit_transform(X)

print X_new.dtype

在这个例子中，X是float32，被fit_transform(X)转换成float64,回归被转换成float64，分类目标维持不变.

from sklearn import datesets

from sklearn.svm import SVC

iris = datasets.load_iris()

clf =SVC()

clf.fit(iris.data,iris.target)

print list(clf.predict(iris.data[:3]))

clf.fit(iris.data,iris.target_names[iris.target])

print list(clf.predict(iris.data[:3]))

这里第一个predict()返回一个整数数组，是因为iris.target(一个整数数组)被用于拟合。第二个predict()返回一个字符串数组，因为iris.target_names被用于拟合。

②重拟合和更新参数

一个拟合（评估）函数的混合参数（超参数）能够在通过sklearn.pipeline.Pipeline.set_params方法构造之后被更新。多次调用fit()能够覆写之前fit()学习的内容：

import numpy as np

from sklearn.svm import SVC

rng = np.random.RandomState(0);

X = rng.rand(100,10)

Y = rng.binomial(1,0.5,100)

X_test = rng.rand(5,10)

clf = SVC()

clf.set_params(kernel = 'linear').fit(X,Y)

clf.predict(X_test)

clf.set_params(kernel='rbf').fit(X,Y)

clf.predict(X_test)

这里,用SVC()构造之后，开始拟合（评估）函数默认的'rbf'核被改编成'linear'，后来又改回'rbf'去重拟合做第二次的预测。

附：

①digits数据集：一个展示怎样用scikit-learn识别手写数字的样例:绘制数字：

# 源代码: Gaël Varoquaux

# 修改以进行文档化:Jaques Grobler

# 协议: BSD 3

from sklearn import datasets

import matplotlib.pyplot as plt

#加载数字数据集

digits = datasets.load_digits()

#展示第一个数字

plt.figure(1, figsize=(3, 3))

plt.imshow(digits.images[-1], cmap=plt.cm.gray_r, interpolation='nearest')

plt.show()

②绘制数字分类（plot_digits_classification.py）

# 作者: Gael Varoquaux

# 协议: BSD 3 clause

# Python标准科学计算包导入

import matplotlib.pyplot as plt

# 导入数据集,分类器和评估度量

from sklearn import datasets, svm, metrics

# 数字数据集

digits = datasets.load_digits()

#数据是一个8x8的数字图像,让我们先看看开头的三张图像.图像存储在数据集

#的`images`属性中,如果我们要加载图像文件的话,可以使用pylab.imread.

#注意每一张图像尺寸必须相等.这些图像各自对应的数字是多少我们是知道的

#他们存储在数据集的target属性中.

images_and_labels = list(zip(digits.images, digits.target))

for index, (image, label) in enumerate(images_and_labels[:4]):

plt.subplot(2, 4, index + 1)

plt.axis('off')

plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')

plt.title('Training: %i' % label)

# 在数据上应用一个分类器, 我们需要铺平图像,

# 将数据转换成二位矩阵:

n_samples = len(digits.images)

data = digits.images.reshape((n_samples, -1))

# 创建一个分类器: 一个支持向量分类器

classifier = svm.SVC(gamma=0.001)

# 我们在前半部分数据上进行学习

classifier.fit(data[:n_samples / 2], digits.target[:n_samples / 2])

# 现在预测后半部分的值:

expected = digits.target[n_samples / 2:]

predicted = classifier.predict(data[n_samples / 2:])

print("Classification report for classifier %s:\n%s\n"

% (classifier, metrics.classification_report(expected, predicted)))

print("Confusion matrix:\n%s" % metrics.confusion_matrix(expected, predicted))

images_and_predictions = list(zip(digits.images[n_samples / 2:], predicted))

for index, (image, prediction) in enumerate(images_and_predictions[:4]):

plt.subplot(2, 4, index + 5)

plt.axis('off')

plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')

plt.title('Prediction: %i' % prediction)

plt.show()

2024年Python最新统信UOS_麒麟KYLINOS上安装特定版本python_统信uos安装python 2401_84558914 程序员 python linux 服务器
准备解压…/16-libidn2-dev_2.0.5.1-1+dde_amd64.deb…正在解压libidn2-dev:amd64(2.0.5.1-1+dde)…/var/cache/apt/archives/libidn2-dev_2.0.5.1-1+dde_amd64.deb正在选中未选择的软件包libp11-kit-dev:amd64。准备解压…/17-libp11-kit-dev_0.2
JVM——垃圾回收五月茶 JVM jvm
在Java开发中，JVM不仅负责运行Java字节码，还通过自动内存管理机制帮助开发者避免手动内存管理的复杂性。1.JVM内存模型JVM的内存模型主要包括以下几个部分：方法区(JDK8之后叫元空间):存储类信息，常量池，静态变量堆：所有线程共享的一块内存区域，存放对象实例栈：线程私有程序计数器：线程私有，记录当前线程执行的字节码行号本地方法栈：为Native方法服务2.Java堆的划分年轻代Surv
ADB 安装 APK 及处理安装弹窗的方法要站在顶端 APP自动化 adb
ADB安装APK及处理安装弹窗的方法总结✅背景说明在自动化测试或CI流程中（如JenkinsPipeline），我们经常需要通过ADB安装APK。但在某些设备上，安装过程会弹出“继续安装”按钮或其他确认界面，导致安装命令阻塞，无法继续执行后续操作。为此，我们需要：避免安装卡住自动点击安装按钮（如果必须）保证脚本兼容性（尤其适配Windows+Jenkins）方法一：使用adbinstall-r--
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一键难忘 harmonyos HarmonyOS应用开发者
文章目录HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一、高级组件开发模式1.1自定义组合式组件二、网络通信与数据缓存2.1智能请求管理三、动态交互与动画引擎3.1手势驱动动画四、模块化工程架构4.1分层架构设计4.2动态模块加载五、多设备适配策略5.1响应式布局系统六、性能监测与优化6.1渲染性能分析七、测试与质量保障7.1自动化测试框架八、持续集成与部署8.1自动化构建流程结
LabVIEW实现SSB调制解调技术的详细教程九门提督守皇上
本文还有配套的精品资源，点击获取简介：本文详细探讨了在LabVIEW环境下实现单边带调制（SSB）的技术和原理。SSB是一种高效且广泛应用于无线电通信的模拟调制技术。通过LabVIEW的虚拟仪器（VI）编程，可以完成包括信号生成、预处理、调制、滤波、存储或发送以及接收、反向调制、解调和后处理在内的完整SSB调制解调过程。这些步骤对于优化通信系统和提高通信效率至关重要。1.SSB调制解调技术概述1.
Android开发：管理设备配置更改与广播接收器
背景简介在Android开发中，确保应用在面对设备配置更改时数据不丢失，以及高效地管理网络请求，是提升用户体验的关键。本篇博客将基于《AndroidDeveloperFundamentalsCourse(V2)》课程内容，探讨如何使用AsyncTaskLoader来处理数据持久化问题，以及如何利用广播接收器来响应系统广播和自定义广播。使用AsyncTaskLoader进行数据持久化当用户旋转设备屏
TCP/UDP通信调试实战工具
本文还有配套的精品资源，点击获取简介：TCP调试助手是一款旨在协助程序员和网络管理员进行TCP和UDP协议调试的网络通信工具。TCP作为一种面向连接、可靠的协议，具有诸如连接管理、数据分片与重组、流量和拥塞控制等特点。该工具支持TCPServer和TCPClient两种模式，允许用户模拟服务器和客户端进行通信测试。同时，它也支持UDP通信模式，适合实时性要求高而数据完整性要求不高的场合。通过TCP
昌乐一中2021年高考成绩查询,2021年潍坊高考各高中成绩及本科升学率数据排名及分析... 带虾条酱
一、潍坊高考各高中成绩及本科升学率数据2020山东高考省前50名最多的是烟台一中，共有7位进入其次是淄博实验中学4位，潍坊一中3位，潍坊一中的孟令昊同学取得了711分的高分，(语文125分、数学150分、英语145分、物理98分、化学97分、地理96分)为山东目前最高分。临沂有1位，来自郯城一中！山东省前50名分布烟台一中788人报考，680分以上的33人临沂一中3077人报考，660分以上25人
指数计算机在线使用,ffmi(在线ffmi指数计算器) 带虾条酱指数计算机在线使用
我们可用FatFreeMassIndex(FFMI)无脂肪重量指数来做为一个衡量肌瘦肉量的基准。不像BMI会把脂肪算到重量里，FFMI在测量进展和潜力上是更有实用性的。FFMI的.彭于晏的体型用FatFreeMassIndex(FFMI)无脂肪重量指数来看应该是处于20左右，而26是不依赖药物所能达到的极限了，所以算是很不错的了。专业健美运动员都是用.首先讲一点，当年的施瓦辛格也是使用固醇类药物的
b树与b+树的区别 Senkorl MySQL b树数据结构 mysql
B树和B+树都是平衡树的一种，广泛应用于数据库和文件系统中。它们的主要区别在于结构和性能优化上。以下是B树和B+树的主要区别：1.结构差异B树：节点存储键和值：B树的每个节点不仅存储键，还存储与键关联的数据（值）。叶子节点和内部节点都可以存储数据。多层次的值存储：数据可能存储在内节点或叶子节点，因此查找时可能会终止于非叶节点。B+树：节点只存储键，值存储在叶子节点：B+树的内部节点只存储键，数据（
【MySQL】事务七七&556 面试学习路线阿里巴巴 mysql 数据库
MySQL(六)事务一、事务的特性1.原子性2.一致性3.持久性4.隔离性4.1无隔离4.1.1隔离级别4.1.2执行效果4.2写加锁4.2.1隔离级别4.2.2脏读解决4.2.3执行效果4.3读加锁4.3.1不一致解决4.3.2执行效果4.4读写加锁4.4.1隔离级别4.4.2不可重复读解决4.4.3执行效果4.5串行化4.5.1隔离级别4.5.2幻读解决4.5.3执行效果二、事务的使用1.开启
springboot整合rabbitmq集群配置详解 ThePual java spring boot rabbitmq 队列
springboot整合rabbitmq集群创建方式这里省略整合开始1引入starterorg.springframework.bootspring-boot-starter-parent2.2.6.RELEASEorg.springframework.bootspring-boot-starter-amqp2配置文件rabbitmq:addresses:127.0.0.1:6605,127.0.
[由浅入深理解神经网络] 2 张量流与反向传播
由浅入深理解神经网络2张量流与反向传播0前言1张量流和运算图2复合函数视角2.1复合函数求导2.1.1链式法则2.1.2多元函数的链式法则2.2前馈网络的反向传播2.3任意网络的反向传播3结语0前言在由浅入深理解神经网络1一个简单到极致的神经网络中,我们已经发现了训练神经网络最重要的一件事,那就是求梯度,然后优化算法利用梯度来调整网络参数.我们重写一下前面提到的一个通用的神经网络:y=f(x;θ)
spring 面试题爆爆凯 spring 数据库 java
一、Spring基础概念什么是Spring框架？Spring是一个开源的Java应用程序框架，它提供了一种轻量级的、非侵入式的方式来构建企业级应用。Spring的核心功能包括依赖注入（DependencyInjection，DI）、面向切面编程（Aspect-OrientedProgramming，AOP）、事务管理、数据访问等，旨在简化企业级Java开发，提高开发效率和代码的可维护性。Sprin
【自用】git常用操作
Git常用操作1.vscode连接上远程容器后，使用git进行开发的大致流程2.PR中出现文件内容上传错误，此时还没有合入，如何修改这次PR？情况一：上次推送的本地仓库以及分支都还在情况二：本地仓库没有，需要重新拉取远程分支进行开发3.如何在本地开发代码进行版本管理（本地开发）示例工作流程常用指令如何基于某个分支创建一个新分支git配置如何设置理解`gitclone`理解`gitfetch`1.v
C#索引和范围：简化集合访问的现代特性详解阿蒙Armon C#工作中的应用 c#开发语言
C#索引和范围：简化集合访问的现代特性详解在C#8.0中引入的索引（Index）和范围（Range）特性，为集合元素的访问提供了更简洁、直观的语法。无论是数组、列表还是字符串，这些特性都能大幅简化获取元素或子序列的代码，使开发者能够更专注于业务逻辑而非边界计算。本文将全面解析索引和范围的工作原理、使用方法及实战技巧，帮助你彻底掌握这一现代C#特性。一、索引：超越传统下标的访问方式传统上，C#通过从
HarmonyOS Next 记事本应用开发实践鱼弦 harmonyos 华为
HarmonyOSNext记事本应用开发实践引言在移动互联网时代，记事本应用作为基础生产力工具，仍然是用户日常使用频率最高的应用类型之一。随着HarmonyOSNext的发布，华为推出了全新的应用开发框架和工具链，为开发者提供了构建全场景分布式应用的能力。本文将全面介绍基于HarmonyOSNext平台的记事本应用开发实践，从技术背景到具体实现，再到部署与优化，为开发者提供完整的开发指南。技术背景
以太坊dapp_构建以太坊DApp：使用自定义令牌进行投票 culi3182 java python 区块链人工智能 javascript ViewUI
以太坊dappInpart5ofthistutorialseriesonbuildingDAppswithEthereum,wedealtwithaddingcontenttothestory,lookingathowtoaddtheabilityforparticipantstobuytokensfromtheDAOandtoaddsubmissionsintothestory.It’snowt
Python 安装使用 tesseract OCR 识别中文花果山总钻风 Python/Flask Linux python ocr 开发语言
前言：i、中文识别效果更好的开源OCR库：CnOCR使用教程ii、6款开源中文OCR使用介绍（亲测效果）：点我查看iii、windows安装tesserract教程：windows安装：点我查看教程1、点我查看教程2windows安装完成，设置好环境变量后，报找不到路径的错误点这里：解决办法本文为CentOS下安装教程Tesseract的OCR引擎目前已作为开源项目发布在GoogleProject
UI前端与大数据的深度融合：打造智慧应用的新生态前端开发与ui设计的老司机 ui 前端大数据
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!在数字化转型的浪潮中，UI前端与大数据正逐渐成为推动智慧应用发展的核心力量。UI前端作为用户与应用程序交互的直接界面，负责提供直观、便捷且吸引人的用户体验；而大数据则凭借其强大的数据收集、分析和预测能力，为应用程序
Django REST framework - 元数据 pythondjango
[OPTIONS]方法允许客户端确定与资源相关联的选项和/或要求，或者服务器的能力，而不暗示资源操作或启动资源检索。——RFC7231，第4.3.7节。RESTframework包含一个可配置的机制，用于确定你的API应该如何响应OPTIONS请求。这允许你返回API模式或其他资源信息。目前没有被广泛采用的关于OPTIONS请求应该返回何种风格响应的确切约定，因此我们提供了一种临时风格，返回一些有
鸿蒙应用发布全解析：应用模块化的实践操作系统内核探秘操作系统内核揭秘 OS harmonyos 华为 ai
鸿蒙应用发布全解析：应用模块化的实践关键词：鸿蒙系统、应用模块化、分布式能力、原子化服务、应用发布、HarmonyOS、开发实践摘要：本文全面解析鸿蒙(HarmonyOS)应用发布的核心机制，重点探讨应用模块化设计在鸿蒙生态中的实践。文章从鸿蒙系统架构出发，深入分析模块化应用的设计原理、开发流程和发布策略，结合实际案例展示如何利用鸿蒙的分布式能力和原子化服务特性构建高效、灵活的应用架构。同时，本文
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记迁移学习人工智能机器学习
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？文章目录【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？✅一、使用正则化进行模型压缩（ModelCompression）目标：方法：L1正则化促使权重稀疏化代码示例：后续压缩步骤
Java面试题专项（Redis篇）嗨，正在熬夜的你面试部分 java redis 开发语言
1.什么是缓存穿透？怎么解决？答：缓存穿透是指查询一个一定不存在的数据（例：假设数据库只有用户1-1000的信息，黑客一直请求用户ID=99999，每次都查DB，DB扛不住。），由于存储层查不到数据因此不写入缓存，这将导致这个不存在的数据每次请求都要到DB去查询，可能导致DB挂掉。这种情况大概率是遭到了攻击。通常都用布隆过滤器（提前用布隆过滤器存储所有存在的key。查询前先查布隆过滤器，不存在的直
鸿蒙应用开发全攻略：调试与性能优化实践 vvilkin的学习备忘 #HarmonyOS harmonyos 华为
引言：为什么鸿蒙开发需要特别关注调试与优化？在移动应用开发领域，鸿蒙操作系统（HarmonyOS）作为华为推出的全场景分布式操作系统，为开发者带来了全新的机遇和挑战。与传统的Android/iOS开发相比，鸿蒙开发在分布式能力、跨设备协同和性能优化方面有着独特的要求。据统计，经过充分优化的鸿蒙应用启动速度可提升40%，内存占用减少30%，这直接关系到用户体验和应用市场竞争力。本文将系统性地介绍鸿蒙
Python中Tesseract OCR的中文识别包实操指南
本文还有配套的精品资源，点击获取简介：TesseractOCR是一个开源的光学字符识别引擎，支持多语言包括中文识别。介绍如何在Python中使用pytesseract库进行图像文字识别，并详细说明安装TesseractOCR以及其中文语言包的步骤。提供了一个Python示例代码来展示图像识别的流程，并解释如何通过预处理提高识别准确率。此外，概述了TesseractOCR的高级功能和训练自定义模型的
企业架构与IT架构关系的探讨深海科技服务 IT应用探讨安全架构安全安全架构 IT架构企业架构程序人生
一、企业架构在实践中，企业架构往往是偏业务层面的，甚至可以说完全是基于业务层面的，设计企业架构是需要设计者根据外部的政治、经济、法律、市场、文化等因素，结合自身的资金、技术、人才、原材料等进行企业架构设计，是以客户为导向的。企业架构的业务本质企业架构在实践中是偏业务层面的，甚至可以说完全是基于业务层面的。这与很多人可能误解的“企业架构就是IT架构”有本质区别。企业架构的核心目标是：将企业的战略愿景
C#数据流处理：深入解析System.IO.Pipelines的奥秘阿蒙Armon C#工作中的应用 c#php 服务器
C#数据流处理：深入解析System.IO.Pipelines的奥秘在当今高并发、高性能的应用开发领域，高效处理数据流是一项至关重要的挑战。传统的StreamAPI在处理大量数据时，往往面临内存分配效率低、频繁数据拷贝、难以高效处理异步I/O等问题。为了解决这些痛点，.NET团队在.NETCore2.1中引入了System.IO.Pipelines库，为开发者提供了一套高性能、低延迟的数据流处理解
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

aidlearning开发python使用教程_[译]使用scikit-learn进行机器学习(scikit-learn教程1)

你可能感兴趣的:(aidlearning开发python使用教程_[译]使用scikit-learn进行机器学习(scikit-learn教程1))