weixin_37988176

如何自学python到做项目-如何使用python进行第一个机器学习项目（详细教程篇）...

你是否想使用python进行机器学习但却难以入门？

在这篇教程中，你将用Python完成你的第一个机器学习项目。

在以下的教程中，你将学到：

1.下载并安装Python SciPy，为Python中的机器学习安装最有用的软件包。

2.使用统计摘要和数据可视化加载数据集并了解其结构。

3.创建6个机器学习模型，并挑选出最佳模型以确保准确性。

如果你是一个机器学习初学者，并希望开始使用Python进行你的机器学习项目，那么本教程是为你量身打造的。

话不多说，开始正题吧

如何使用Python开始机器学习？

学习机器学习的最好方式是设计和完成小型项目。

在入门Python时遇到的困难

Python是一种当下流行并且功能强大的解释型语言。与R语言不同，Python是一个完善的语言和平台，能用来研究和开发。

还有很多模块和库可以选择，提供多种方式来完成每个任务。

开始使用Python进行机器学习的最好方法是完成一个项目。

它将促使你安装并启动Python解释器。

它让你全面的观察如何开发一个小项目。

它会给你信心，也许还会驱动你继续做自己的小项目。

初学者需要一个小型的端到端项目

很多书籍和课程让人失望。他们给你很多方法和片段，但你永远不会看到他们如何融合在一起。

当你将机器学习应用在自己的数据集时，你已经开始了一个项目。

机器学习项目可能不是线性的，但它有许多典型的步骤：

定义问题

准备数据

评估算法。

改善成绩。

得到结果。

真正开始新平台或工具的最好的方法是通过一个机器学习项目进行端到端的工作，并覆盖关键步骤。也就是从加载数据、总结数据、评估算法和做出一些预测。

如果可以这样做，你将有一个可以在数据集之后使用数据集上的模板。一旦你有更多的信心，你可以进一步的填补数据和改进结果的任务.

机器学习的Hello World

开始使用新工具的最好的小项目是鸢尾花的分类（如鸢尾花数据集 https://archive.ics.uci.edu/ml/datasets/Iris）。

这是一个很好理解的项目。

属性是数值型的，因此你必须弄清楚如何加载和处理数据。

这是一个分类问题，让你可以练习更简单的监督学习算法。

这是一个多类的分类问题（多项式），可能需要一些专门的处理。

它只有4种属性和150行，这意味着它很小，很容易适应内存(以及屏幕或A4页面)。

所有的数值属性都是相同的单位和相同的比例，不需要任何特殊的缩放或变换就可以开始。

让我们开始使用Python中的hello world机器学习项目。

Python中的机器学习：分步教程

在本节中，我们将通过端到端的小型机器学习项目进行工作。

以下是我们将要介绍的内容：

安装Python和SciPy平台

加载数据集

汇总数据集

可视化数据集

评估一些算法

做一些预测

慢慢来，一步一步做。

你可以尝试自己输入命令也可以通过复制粘贴来加快速度。

下载，安装和启动Python SciPy

如果你的系统上尚未安装，请安装Python和SciPy平台。

我不想太详细地介绍这个，因为有别人已经介绍过了，这对一个开发人员来说很简单。

1.1安装SciPy库

本教程假设Python版本为2.7或3.5。

你需要安装5个关键库。以下是本教程所需的Python SciPy库列表：

SciPy

numpy

matplotlib

pandas

sklearn

有很多方法来安装这些库，我的建议是选择一种方法，然后在安装每个库时保持一致。

该SciPy的安装页面（https://www.scipy.org/install.html）对多个不同的平台提供了极好的说明书，如Linux，Mac OS X和Windows。如果你有任何疑问或疑问，请参阅本说明。

在Mac OS X上，你可以使用macports来安装Python 2.7和这些库。

在Linux上，你可以使用包管理器，例如Fedora上的yum来安装RPM。

如果你使用Windows或者你没什么信心，我建议安装免费版本的Anaconda（https://www.anaconda.com/download/），其中包含你需要的一切。

注意：本教程假设你已经安装scikit-learn版本0.18或更高版本。

1.2启动Python并检查版本

确保你的Python环境安装成功并按预期工作，这是很有必要的。

下面的脚本将帮助你测试你的环境。它导入本教程中所需的每个库并打印出版本。

打开命令行并启动python解释器：

python

我建议直接在解释器中工作，或者编写脚本并在命令行上运行它们，而不是用大型编辑器和IDE。不要很复杂的操作，把中心放在机器学习而不是工具链上。

键入或者复制粘贴以下脚本：

# Check the versions of libraries

# Python version

import sys

print('Python: {}'.format(sys.version))

# scipy

import scipy

print('scipy: {}'.format(scipy.__version__))

# numpy

import numpy

print('numpy: {}'.format(numpy.__version__))

# matplotlib

import matplotlib

print('matplotlib: {}'.format(matplotlib.__version__))

# pandas

import pandas

print('pandas: {}'.format(pandas.__version__))

# scikit-learn

import sklearn

print('sklearn: {}'.format(sklearn.__version__))

这是我在我的OS X工作站上得到的输出：

Python:2.7.11 (default, Mar 1 2016,18:40:10)

[GCC4.2.1 Compatible Apple LLVM7.0.2 (clang-700.1.81)]

scipy:0.17.0

numpy:1.10.4

matplotlib:1.5.1

pandas:0.17.1

sklearn:0.18.1

将以上输出与你的版本进行比较。

理想情况下，你的版本应该匹配或更新。这些API不会很快改变，所以如果你的版本更高，不必担心，本教程中的所有内容很有可能仍然适用于你。

如果你出现错误，请停止。现在是修复它的时候了。

如果你无法正常运行上述脚本，你将无法完成本教程。

我最好的建议是在Google上搜索你的错误信息。

加载数据

我们将使用鸢尾花数据集。这个数据集很有名，因为它被用作机器学习和统计中的“hello world”。

该数据集包含150个鸢尾花观测值。有四列测量花的尺寸。第五列是观察到的花的种类。所有观察到的花属于三种物种之一。

在此步骤中，我们将从CSV文件的URL加载鸢尾数据。

2.1导入库

首先，我们将导入我们将在本教程中使用的所有模块，函数和对象。

# Load libraries

import pandas

from pandas.tools.plottingimport scatter_matrix

import matplotlib.pyplot as plt

from sklearnimport model_selection

from sklearn.metricsimport classification_report

from sklearn.metricsimport confusion_matrix

from sklearn.metricsimport accuracy_score

from sklearn.linear_modelimport LogisticRegression

from sklearn.treeimport DecisionTreeClassifier

from sklearn.neighborsimport KNeighborsClassifier

from sklearn.discriminant_analysisimport LinearDiscriminantAnalysis

from sklearn.naive_bayesimport GaussianNB

from sklearn.svmimport SVC

这些加载正常情况下是没错的。如果出现错误，请停止。回到上面，你需要一个可行的SciPy环境。请参阅上面关于设置环境的建议。

2.2加载数据集

我们可以直接从UCI机器学习存储库加载数据。

我们正在使用pandas来加载数据。我们还将使用pandas来探索具有描述性统计数据和数据可视化的数据。

请注意，我们在装载数据时指定了每个列的名称。这有助于我们稍后研究数据。

# Load dataset

url= "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names= ['sepal-length','sepal-width','petal-length','petal-width','class']

dataset= pandas.read_csv(url, names=names)

数据集应该会加载的很顺利

如果你有网络问题，可以下载iris数据（https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data）。将文件放入工作目录，并使用相同的方法加载它，将URL更改为本地文件名。

汇总数据集

现在是查看数据的时候了。

在这一步中，我们将以几种不同的方式来查看数据：

数据集的维度。

仔细观察数据本身。

所有属性的统计汇总。

按类变量细分数据。

记住查看数据，一个数据集就是一个命令。这些都是有用的命令，你可以在以后的项目中反复使用。

3.1数据集的尺寸

我们可以快速通过shape属性了解数据中包含多少个实例（行）和多少个属性（列）

# shape

print(dataset.shape)

你应该看到150个实例和5个属性：

(150,5)

3.2观察数据

仔细观察你的数据

# head

print(dataset.head(20))

你应该会看到数据的前20行：

sepal-length sepal-width petal-length petal-width class

0 5.1 3.5 1.4 0.2 Iris-setosa

1 4.9 3.0 1.4 0.2 Iris-setosa

2 4.7 3.2 1.3 0.2 Iris-setosa

3 4.6 3.1 1.5 0.2 Iris-setosa

4 5.0 3.6 1.4 0.2 Iris-setosa

5 5.4 3.9 1.7 0.4 Iris-setosa

6 4.6 3.4 1.4 0.3 Iris-setosa

7 5.0 3.4 1.5 0.2 Iris-setosa

8 4.4 2.9 1.4 0.2 Iris-setosa

9 4.9 3.1 1.5 0.1 Iris-setosa

10 5.4 3.7 1.5 0.2 Iris-setosa

11 4.8 3.4 1.6 0.2 Iris-setosa

12 4.8 3.0 1.4 0.1 Iris-setosa

13 4.3 3.0 1.1 0.1 Iris-setosa

14 5.8 4.0 1.2 0.2 Iris-setosa

15 5.7 4.4 1.5 0.4 Iris-setosa

16 5.4 3.9 1.3 0.4 Iris-setosa

17 5.1 3.5 1.4 0.3 Iris-setosa

18 5.7 3.8 1.7 0.3 Iris-setosa

19 5.1 3.8 1.5 0.3 Iris-setosa

3.3统计汇总

现在我们可以看一下每个属性的总结。

这包括计数，平均值，最小值和最大值以及一些百分位数。

# descriptions

print(dataset.describe())

我们可以看到，所有的数值都有相同的单位（厘米），范围在0到8厘米之间。

sepal-length sepal-width petal-length petal-width

count 150.000000 150.000000 150.000000 150.000000

mean 5.843333 3.054000 3.758667 1.198667

std 0.828066 0.433594 1.764420 0.763161

min 4.300000 2.000000 1.000000 0.100000

25% 5.100000 2.800000 1.600000 0.300000

50% 5.800000 3.000000 4.350000 1.300000

75% 6.400000 3.300000 5.100000 1.800000

max 7.900000 4.400000 6.900000 2.500000

3.4分类

现在来看看属于每个类的实例（行）的数量。我们可以将其视为绝对数。

# class distribution

print(dataset.groupby('class').size())

我们可以看到每个类具有相同数量的实例（50或者说33％的数据集）。

class

Iris-setosa 50

Iris-versicolor 50

Iris-virginica 50

数据可视化

我们现在对数据有一个基本的了解。我们需要通过一些可视化来让自己更了解它。

我们要看两种图：

单变量图让你更好地了解每个属性。

多变量图让你更好地了解属性之间的关系。

4.1单变量图

我们从一些单变量开始，即每个变量的曲线。

鉴于输入变量是数值型，我们可以创建每个输入变量的盒型图。

# box and whisker plots

dataset.plot(kind='box', subplots=True, layout=(2,2), sharex=False, sharey=False)

plt.show()

这使我们对输入属性的分布有了更清晰的认识,我们还可以创建每个输入变量的直方图来获得分布的概念。

# histograms

dataset.hist()

plt.show()

看起来可能有两个输入变量具有高斯分布。这一点很有用，因为我们可以使用这种假设比较算法的准确性。

4.2多变量图

现在我们可以看一下变量之间的相互作用。

首先，我们来看看所有属性对的散点图。这可以有助于发现输入变量之间的结构化关系。

# scatter plot matrix

scatter_matrix(dataset)

plt.show()

注意这些接近对角线的组，这是高度的相关性和可预测关系的表现。

评估算法

现在创建一些数据模型，并评估它们对未来数据预测的准确性。

下面是我们将要讨论的内容是:

抽离一个验证数据集。

设置测试工具使用10倍交叉验证。

建立5种不同的模型来预测花卉测量中的种类。

选择最好的模型。

5.1创建验证数据集

我们需要知道，我们创建的模型有什么用。

之后，我们将使用统计方法来估计我们在预测的数据上创建模型的准确性。我们还希望通过对实际预测数据进行评估，从而更具体地估计出最佳模型的准确性。

也就是说，我们将保留一些算法无法看到的数据，我们将利用这些数据来确定模型究竟有多精确。

我们将把加载的数据集分为两部分，其中80％将用于训练我们的模型，20％将被用作验证数据集。

# Split-out validation dataset

array= dataset.values

X= array[:,0:4]

Y= array[:,4]

validation_size= 0.20

seed= 7

X_train, X_validation, Y_train, Y_validation= model_selection.train_test_split(X, Y, test_size=validation_size, random_state=seed)

你现在可以在X_train和Y_train中训练数据为准备模型和X_validation和Y_validation集，因为我们一会儿用得上。

5.2测试工具

我们将使用10倍交叉验证来估计精度。

这将把我们的数据集分为10个部分，在9上训练，并在1上进行测试，并重复训练分组的所有组合。

# Test options and evaluation metric

seed= 7

scoring= 'accuracy'

我们使用“ accuracy” 的度量来评估模型。这是正确预测实例的数量除以数据集中的实例总数乘以100的百分比（例如95％准确）的比率。当我们运行构建并评估每个模型时，我们将使用评分变量。

5.3建立模型

我们不知道哪些算法对这个问题或什么配置使用是好的。我们从图中得出一些想法，即某些类在某些方面是部分可线性分离的，所以我们期望一般的结果很好。

我们来评估6种不同的算法：

逻辑回归（LR）

线性判别分析（LDA）

邻近算法（KNN）。

分类和回归树（CART）。

高斯朴素贝叶斯（NB）。

支持向量机（SVM）。

这是简单线性（LR和LDA），非线性（KNN，CART，NB和SVM）算法的良好混合。我们在每次运行之前重置随机数种子，以确保使用完全相同的数据分割来执行每个算法的评估。它确保结果直接可比。

我们来建立和评估我们的五个模型：

# Spot Check Algorithms

models= []

models.append(('LR', LogisticRegression()))

models.append(('LDA', LinearDiscriminantAnalysis()))

models.append(('KNN', KNeighborsClassifier()))

models.append(('CART', DecisionTreeClassifier()))

models.append(('NB', GaussianNB()))

models.append(('SVM', SVC()))

# evaluate each model in turn

results= []

names= []

for name, modelin models:

kfold= model_selection.KFold(n_splits=10, random_state=seed)

cv_results= model_selection.cross_val_score(model, X_train, Y_train, cv=kfold, scoring=scoring)

results.append(cv_results)

names.append(name)

msg= "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std())

print(msg)

5.4选择最佳模型

我们现在每个都有6个模型和精度估计。我们需要将模型相互比较，并选择最准确的。

运行上面的例子，我们得到以下原始结果：

LR: 0.966667 (0.040825)LDA: 0.975000 (0.038188)KNN: 0.983333 (0.033333)CART: 0.975000 (0.038188)NB: 0.975000 (0.053359)SVM: 0.981667 (0.025000)

我们可以看到，看起来KNN具有最高的估计精度分数。

我们还可以创建模型评估结果的图，并比较每个模型的差异和平均精度。每个算法有一个精确度量的群体，因为每个算法被评估10次（10次交叉验证）。

# Compare Algorithms

fig= plt.figure()

fig.suptitle('Algorithm Comparison')

ax= fig.add_subplot(111)

plt.boxplot(results)

ax.set_xticklabels(names)

plt.show()

你可以看到盒型图在顶部被压扁，许多样品达到100％的准确度。

做预测

KNN算法是我们测试的最精确的模型。现在我们想了解验证集上模型的准确性。

这让我们对最佳模型的准确性进行独立的最终检查。保持一个验证集是有用的，以防万一你在训练过程中犯错，比如过拟合或数据外泄。两者都将导致过于乐观的结果。

我们可以直接在验证集上运行KNN模型，并将结果总结为最终准确度分数，混淆矩阵和分类报告。

# Make predictions on validation dataset

knn= KNeighborsClassifier()

knn.fit(X_train, Y_train)

predictions= knn.predict(X_validation)

print(accuracy_score(Y_validation, predictions))

print(confusion_matrix(Y_validation, predictions))

print(classification_report(Y_validation, predictions))

我们可以看到准确度是0.9即90％。混淆矩阵提供了三个错误的指示。最后，分类报告通过精确度，召回率，f1分数和支撑显示出优异的结果（授予验证数据集很小）提供每个类别的细目。

view source

0.9

[[7 0 0]

[0 11 1]

[0 2 9]]

precision recall f1-score support

Iris-setosa 1.00 1.00 1.00 7

Iris-versicolor 0.85 0.92 0.88 12

Iris-virginica 0.90 0.82 0.86 11

avg/ total 0.90 0.90 0.90 30

完成上面的教程，只需要5到10分钟。

概要

在这篇文章中，你会逐步发现如何在Python中完成第一个机器学习项目。

你将发现，完成一个小型的端到端项目并将数据加载到预测中，是熟悉新平台的最佳途径。

你可能感兴趣的:(如何自学python到做项目-如何使用python进行第一个机器学习项目（详细教程篇）...)

剑指 Offer II 061. 和最小的 k 个数对炫云云大数据算法和数据结构 leetcode 算法 python
剑指OfferII061.和最小的k个数对给定两个以升序排列的整数数组nums1和nums2,以及一个整数k。定义一对值(u,v)，其中第一个元素来自nums1，第二个元素来自nums2。请找到和最小的k个数对(u1,v1),(u2,v2)…(uk,vk)。示例1:输入:nums1=[1,7,11],nums2=[2,4,6],k=3输出:[1,2],[1,4],[1,6]解释:返回序列中的前3对
Java多线程与高并发专题——Callable 和 Runnable 的不同？黄雪超技术基础 java 开发语言并发编程
为什么需要Callable？Runnable的缺陷Runnable是JDK1.0就有的，而Callable是JDK1.5新增的，那我们为什么需要Callable？要想回答这个问题，我们先来看看先有的Runnable有哪些缺陷？不能返回一个返回值第一个缺陷，对于Runnable而言，它不能返回一个返回值，虽然可以利用其他的一些办法，比如在Runnable方法中写入日志文件或者修改某个共享的对象的办法
使用大语言模型API在AI应用中的实现 qq_37836323 人工智能语言模型自然语言处理 python
随着人工智能技术的迅速发展，大语言模型（LLM）在自然语言处理（NLP）领域的应用越来越广泛。本文将介绍如何使用大语言模型API来实现一些基础的AI应用，并提供一个简单的demo代码，帮助大家更好地理解和使用这些技术。大语言模型API简介大语言模型（如GPT-4）能够理解和生成类似人类的文本。这些模型可以应用于各种任务，包括文本生成、语言翻译、情感分析、对话系统等。为了方便国内用户访问这些强大的模
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
python strip()函数牛也唱歌
strip函数原型声明：s为字符串，rm为要删除的字符序列.只能删除开头或是结尾的字符或是字符串。不能删除中间的字符或是字符串。s.strip(rm)删除s字符串中开头、结尾处，位于rm删除序列的字符s.lstrip(rm)删除s字符串中开头处，位于rm删除序列的字符s.rstrip(rm)删除s字符串中结尾处，位于rm删除序列的字符注意：1.当rm为空时，默认删除空白符（包括'\n','\r',
Vscode niuhe 插件使用教程 - xorm 代码生成诗意地回家 niuhe 插件 vscode ide 编辑器
官方教程已经上线,请访问:http://niuhe.zuxing.net本文相关项目:vue3-element-admin基于niuhe插件的管理后台模板niuhe-mdbookniuhe插件示例项目在日常开发中，新增数据库表时通常需要编写大量重复的增删改查代码。为提高开发效率，niuhe插件0.3.4版本新增Xorm基础代码生成功能，可自动生成：数据库表对应的Golang模型结构体基础CURD操
MySQL学习路线蜡笔小新星 MySQL 数据库 mysql 学习经验分享
本专栏纯干货订阅专栏不迷路以下是一个详细的MySQL学习路线，适合从初学者到中高级用户的逐步学习。整个路线分为几个阶段，每个阶段包含了必要的知识点和学习材料。第一阶段：基础知识（1-2周）目标：了解数据库的基本概念，熟悉MySQL的基本用法。学习内容：数据库基础什么是数据库、数据库管理系统（DBMS）数据库的类型（关系型数据库与非关系型数据库）SQL（结构化查询语言）概述MySQL入门MySQL的
用python执行js代码：PyExecJS库详解数据知道 2025年爬虫和逆向教程 python javascript 爬虫数据采集 nodejs
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.介绍和安装1.1PyExecJS介绍1.2安装JavaScript运行时1.3安装PyExecJS2.PyExecJS的基本使用2.1执行简单的JavaScript代码2.2使用外部JavaScript文件2.3先编译、后调用2.4传递参数和获取返回值3.PyExecJS的高级功能3.1指定JavaScript运行时3.2处理异步JavaSc
Python中strip()函数详细讲解甯公子_ Python入门程序 python 开发语言算法
strip()是Python中字符串（str）对象的一个内置方法，用于去除字符串开头和结尾的空白字符（包括空格、换行符、制表符等）。它不会修改字符串中间的空白字符。语法str.strip([chars])str：需要处理的字符串。chars（可选）：指定要去除的字符集合。如果未指定，默认去除空白字符（包括空格、换行符\n、制表符\t等）。返回值返回一个新的字符串，去除了开头和结尾的指定字符。常见用
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
[NOIP2011 提高组] 铺地毯 Nerous_ 刷题之路算法 c++数据结构
题目描述为了准备一个独特的颁奖典礼，组织者在会场的一片矩形区域（可看做是平面直角坐标系的第一象限）铺上一些矩形地毯。一共有nnn张地毯，编号从111到nnn。现在将这些地毯按照编号从小到大的顺序平行于坐标轴先后铺设，后铺的地毯覆盖在前面已经铺好的地毯之上。地毯铺设完成后，组织者想知道覆盖地面某个点的最上面的那张地毯的编号。注意：在矩形地毯边界和四个顶点上的点也算被地毯覆盖。输入格式输入共n+2n+
Flutter开发：运行报错Error detected in pubspec.yaml：…的解决方法三掌柜666 大前端开发常识 flutter android
前言在Flutter开发中，经常会遇到一些稀奇古怪的的报错，比如版本更新之后会报错、文件没有导入会报错、第三方插件版本不一致的报错等等，而且最近几年Flutter不断完善和更新的速度越来越快，这就需要Flutter相关的开发者时刻保持不断学习的心态，来应对在Flutter开发中遇到的各种突发情况。本篇博文就来分享一下关于Flutter开发中运行Flutter项目之后报错Errordetectedi
AI开发日记- Prompt Library篇 BillyXie23 AI探索 prompt 人工智能 github python AI编程
突发奇想想在git上host一个静态页面的promptlibrary，于是花了一天时间配合cursor硬是撸了出来Github地址：https://github.com/MrXie23/PromptLibrary页面地址PromptLibrary-探索AI提示的艺术目前代码结构有些混乱，有些失败的folder还没清理，不过基础功能都已经可以work了，接下来的开发roadmap是把一些没做的页面都
利用Python爬虫获取淘宝商品评论：实战案例分析数据小爬虫@ API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是对于电商平台而言，商品评论作为用户反馈的重要载体，蕴含着丰富的信息。本文将详细介绍如何利用Python爬虫技术获取淘宝商品评论，包括代码示例和关键步骤解析。淘宝商品评论的重要性淘宝商品评论不仅对消费者购买决策有着重要影响，而且对于商家来说，也是了解市场需求、改进产品和服务的重要途径。因此，获取并分析淘宝商品评论数据，对于电商运营和市场分析具有重要意义。Pyt
stm32完全学习——NRF24L01模块小A159 STM32完全学习 stm32 学习嵌入式硬件
对于这个模块的移植，无论是标准库还是HAL库，无论是软件模拟SPI还是，硬件SPI通信，网上都有很多的例子，这里关于移植的事情就不再赘述了。一、调试中遇到的一些问题我是用的别人的代码进行移植的，使用的是软件模拟SPI时序，在进行通信的时候，可以正确检测到NRF24L01的存在，但是发送数据和接收数据都不能成功的运行，本来以为是发送的时候数据包设置的不正确，后来发现他的代码里面使用软件SPI里面的延
C#电子相册：面向对象设计与架构实践金融先生-Frank
本文还有配套的精品资源，点击获取简介：C#电子相册是一个使用高级编程语言C#开发的Windows平台应用程序。该项目采用面向对象编程方法，将对象如照片和相册封装、继承和多态地组织起来。它可能采用了MVC、MVVM或MVP架构模式，并使用.NETFramework或.NETCore以及VisualStudio作为开发环境。数据库管理部分涉及SQL数据库，支持相册数据的存储与检索。文件列表中的"eri
【NLP】 API在大语言模型中的应用 Nerous_ 深度学习自然语言处理语言模型人工智能
大语言模型（LargeLanguageModels,LLMs）通过API（应用程序接口）为开发者提供了便捷的调用方式，使其能够快速集成自然语言处理能力到各类应用中。以下是API在LLM中的核心应用场景及技术实现细节：一、核心应用场景自然语言理解与生成应用示例：智能客服：解析用户问题并生成回复（如ChatGPTAPI）。内容创作：自动生成文章、广告文案或代码（如OpenAI的GPT-4）。技术实现：
Python 自动探索性数据分析库———KLib 若木胡 tools python 数据分析开发语言
Python自动探索性数据分析库——KLib一、引言在当今数据驱动的时代，数据分析师和科学家们面临着海量的数据需要处理和分析。探索性数据分析（EDA）作为数据处理流程中的关键环节，旨在帮助人们快速理解数据的特征、分布、相关性等重要信息，从而为后续的深入分析、建模以及决策提供坚实的基础。Python以其丰富的生态系统和强大的功能在数据分析领域占据着重要地位，而KLib则是其中一款专注于自动探索性数据
一口气告诉你Deepseek与manus有什么区别？小二爱编程· ai 人工智能
DeepSeek像是个特别聪明的“顾问”，你问他问题，他能给你写论文、改合同、算数学题，甚至能讲冷笑话。但他有个特点：动嘴不动手。比如你说“帮我做个PPT”，他会给你写个特别详细的提纲，但最后你得自己打开电脑动手做。Manus更像是个“动手达人”，你只要说“帮我做个PPT”，他能直接打开软件，自己找模板、排版、插图片，最后把做好的PPT文件甩给你，全程不用你动手。具体区别在哪？擅长的事不一样Dee
源码篇：python生成《蔬菜店销售数据分析报告》案例 IT小本本 python python 数据分析开发语言
本文将通过Python实现一个完整的蔬菜销售数据分析项目，涵盖数据生成、清洗、分析及可视化全流程。我们将利用模拟数据生成技术创建90天的销售记录，通过Pandas进行数据处理，结合Matplotlib和Seaborn实现多样化的可视化图表，并最终生成动态交互报告。一、数据生成：模拟真实销售场景为了模拟真实的蔬菜销售数据，我们设计了包含10种蔬菜（白菜、土豆、西红柿等）的90天销售记录。数据生成逻辑
JAVA毕业设计BS架构考研交流学习平台设计与实现计算机源码+lw文档+系统+调试部署+数据库瑞致网络 java 开发语言 jvm
JAVA毕业设计BS架构考研交流学习平台设计与实现计算机源码+lw文档+系统+调试部署+数据库JAVA毕业设计BS架构考研交流学习平台设计与实现计算机源码+lw文档+系统+调试部署+数据库本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：
[附源码]Python计算机毕业设计SSM基于B-S的心理健康管理系统（程序+LW) Python、JAVA毕设程序源码 java 开发语言
环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：
对比与详解：QR 分解、奇异值分解（SVD）与 Schur 分解及其他可产生正交基的方法 DuHz 机器学习人工智能信号处理算法矩阵信息与通信线性代数
对比与详解：QR分解、奇异值分解（SVD）与Schur分解及其他可产生正交基的方法在数值线性代数与矩阵分析中，常见的能产生正交（或酉）矩阵的分解方法包括QR分解、奇异值分解（SVD）、Schur分解等。这些方法虽然都会产生一个（或多个）正交矩阵，但它们在适用范围、分解形式、计算重点和应用场景等方面各不相同。本文将尽量对这些分解方法进行系统地介绍与对比。1.正交矩阵（Orthogonal/Unita
5-1 使用ECharts将MySQL数据库中的数据可视化上课的牛马实训大数据
方法一：使用PythonFlask框架搭建API对于技术小白来说，使用ECharts将MySQL数据库中的数据可视化需要分步骤完成。以下是详细的实现流程：一、技术架构‌后端服务‌：使用PythonFlask框架搭建API（简单易学，适合新手）数据库连接‌：通过Python的pymysql库连接MySQL前端可视化‌：HTML+JavaScript+ECharts数据流向‌：MySQL数据库→Pyt
图论：以二维数组表示的连通图/树应如何表示？leetcode1042.不邻接种花坠金技术面算法图论算法 leetcode
1042.不邻接植花-力扣（LeetCode）容器在这道题中输入类似[[1,2],[3,4]]，这意味着花园1连通了花园2，花园3连通了花园4。那么该怎么根据这个输入，获取一个方便后面算法的表示呢？我们通常管这种存放邻居的数据格式叫做：邻接表通常我的思路是使用下列容器作为邻接表：哈希表，key就是花园i，value是与花园i接壤的其他所有花园。二维数组，第i个数组中的元素是与花园i接壤的其他所有花
Java运行jar包需要读取arguments配置文件好人静 Java java 配置argument
在项目中有时候要把一些代码打包成jar，只要运行jar就可以执行。同时为了方便设置代码执行的一些外部参数，通常会配置arguments。1、Intelidea配置arguments在菜单栏找到Run－>EditConfiguration弹出的窗口中选择配置文件所在的路径即可。2、Eclipse配置arguments在main函数，右击，在弹出的菜单中选择EditConfiguration，在弹出的
绕过 reCAPTCHA V2/V3：Python、Selenium 指南 qq_33253945 python selenium javascript 网络爬虫爬虫算法
前言验证码（CAPTCHA）技术已经存在许多年，尽管它的有效性一直备受争议，但许多网站仍然依赖它来保护资源。尤其是Google推出的reCAPTCHA系列，一直是验证码领域的佼佼者。本文将详细介绍如何绕过reCAPTCHAV2和V3，并提供实用的代码示例。详情请见：解决验证码recaptcha、cloudflare、incapsula1.什么是reCAPTCHA？reCAPTCHA是Google推
计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）毅铭科技数据库
计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）计算机毕业设计JavaBS景区票务管理系统设计与实现(源码+系统+mysql数据库+lw文档）本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：
图论——Prim算法水代码的程序猿力扣算法图论数据结构
53.寻宝（第七期模拟笔试）题目描述在世界的某个区域，有一些分散的神秘岛屿，每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路，方便运输。不同岛屿之间，路途距离不同，国王希望你可以规划建公路的方案，如何可以以最短的总公路距离将所有岛屿联通起来（注意：这是一个无向图）。给定一张地图，其中包括了所有的岛屿，以及它们之间的距离。以最小化公路建设长度，确保可以链接到所有岛屿。输入描述第一行包
CSP-J备考冲刺必刷题（C++） | AcWing 11 背包问题求方案数热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】AcWing：11.背包问题求方案数-AcWi
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d