调参侠鱼尾

Python机器学习日记2：鸢尾花分类（持续更新）

Python机器学习日记2：鸢尾花分类

一、书目与章节
二、前言
- 1. 什么是机器学习
- 2. 熟悉任务和数据
- 3. 本文软件版本
- 4. scikit-learn参考资料
三、问题类型
四、鸢尾花数据集
- 1. 导入库
- 2. 数据集初探
- - 2.1. DESCR
  - 2.2. target_names
  - 2.3. feature_names
  - 2.4. data
  - 2.5. target
  - 2.6. frame
五、衡量模型是否成功
- 1. 机器学习目的
- 2. 泛化能力
- 3. 训练集与测试集
六、观察数据/检查数据
七、k邻近算法
- 1. 模型构建
- 2. 进行预测
- 3. 模型评估

一、书目与章节

拜读的是这本《Python机器学习基础教程》，本文选自第一章引言，主要内容为：鸢尾花分类入门案例。

本书全部代码：https://github.com/amueller/introduction_to_ml_with_python

二、前言

1. 什么是机器学习

机器学习（machine learnin）是从数据中提取知识。它是统计学、人工智能、和计算机科学交叉的研究领域，也被称为预测分析（predictive analytics）或统计学习（statistical learning）

2. 熟悉任务和数据

机器学习中最重要的一部分是理解手头上在处理的数据！以及这些数据与需要解决的问题间的关系！随机选择一个算法并输入数据，这样做是无效的。因此，在建模前理解数据集的内容极其重要！每种算法输入数据类型和最合适解决的问题都是不一样的。以下几个问题都是我们需要预先思考的：

需要解决什么问题？现有数据可否解决？
用什么机器学习方法最好？
提取了什么数据特征？这些特征可否实现正确预测？
如何衡量应用是否成功？
机器学习解决方案与我的研究或商业产品中的其他部分是如何相互影响的？

3. 本文软件版本

Anaconda3 2021.05

import sys
print(f"Python version:{sys.version}")
print("--"*40)
import sklearn
print(f"scikit-learn version:{sklearn.__version__}")
print("--"*40)
import pandas as pd
print(f"pandas version:{pd.__version__}")
print("--"*40)
import numpy as np
print(f"numpy version:{np.__version__}")
print("--"*40)
import scipy as sp
print(f"Scipy version:{sp.__version__}")
print("--"*40)
import matplotlib
print(f"matplotlib version:{matplotlib.__version__}")
print("--"*40)

Python version:3.8.8 (default, Apr 13 2021, 15:08:03) [MSC v.1916 64 bit (AMD64)]
--------------------------------------------------------------------------------
scikit-learn version:0.24.1
--------------------------------------------------------------------------------
pandas version:1.2.4
--------------------------------------------------------------------------------
numpy version:1.20.1
--------------------------------------------------------------------------------
Scipy version:1.6.2
--------------------------------------------------------------------------------
matplotlib version:3.3.4
--------------------------------------------------------------------------------

4. scikit-learn参考资料

scikit-learn是最有名的机器学习库，建议学习参考以下内容：
scikit-learn文档
scikit-learn用户指南

三、问题类型

监督学习问题（有已知品种的鸢尾花的测量数据）+ 三分类问题（在三个鸢尾花品种中预测一个）

四、鸢尾花数据集

1. 导入库

from sklearn.datasets import load_iris
import numpy as np
import pandas as pd
iris = load_iris()

2. 数据集初探

Iris数据集是常用的分类实验数据集，由Fisher于1936收集整理。Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。

load_iris返回的是一个Bunch对象，与字典类似，包含键和值：

>>> type(iris)
sklearn.utils.Bunch

查看Bunch的键：

>>> iris.keys()
dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'])

下面我们分别来看看这些键中的内容是什么：

2.1. DESCR

DESCR键对应的为数据集的基本描述：

>>> print(iris['DESCR'][0:1210]+"\n...")
.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

    ============== ==== ==== ======= ===== ====================
                    Min  Max   Mean    SD   Class Correlation
    ============== ==== ==== ======= ===== ====================
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)
    ============== ==== ==== ======= ===== ====================

    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
    :Date: July, 1988
...

2.2. target_names

target_names中返回的为数据集贡献者所研究的三种鸢尾花的名称，我们称之为“类别”，分别为Iris setosa（山鸢尾）、Iris versicolor（杂色鸢尾）、Iris virginica（维吉尼卡鸢尾）:

>>> print(iris.target_names) #  iris的种类
['setosa' 'versicolor' 'virginica']

2.3. feature_names

feature_names中返回的是被研究的鸢尾花的4个“特征值”，分别为“花萼长度”、“花萼宽度”、“花瓣长度”、“花瓣宽度”（以cm为单位）：

>>> print(iris.feature_names)
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

2.4. data

data中返回的是特征值的具体数据（这里仅查看前五行）：

>>> iris.data[:5] # iris_datas.values()
array([[5.1, 3.5, 1.4, 0.2],
       [4.9, 3. , 1.4, 0.2],
       [4.7, 3.2, 1.3, 0.2],
       [4.6, 3.1, 1.5, 0.2],
       [5. , 3.6, 1.4, 0.2]])

数据类型为numpy.ndarray：

>>> type(iris.data)
numpy.ndarray

该对象含有150行和4列：

>>> iris.data.shape
(150, 4)

机器学习中的个体叫做样本（sample），其属性叫做特征（feature）。data数组的形状（shape）是样本数乘以特征数。

2.5. target

target返回的为鸢尾花种类，上述三个种类鸢尾花每种各50个样本，分别用0、1、2指代，：

>>> iris.target
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

数据类型为numpy.ndarray：

>>> type(iris.target)
numpy.ndarray

对象的大小为150行的一维数组：

>>> iris.target.shape   #一维数据，后面是n则是n维数据
(150,)

2.6. frame

frame返回值为None

将数据转为dataframe格式看看（列名为4个特征值，数据部分为特征值的大小，索引被我更改为0,1，2三个类型）：

X = iris.data
y = iris.target
df = pd.DataFrame(X, columns= iris.feature_names, index = y)
df

五、衡量模型是否成功

1. 机器学习目的

利用现有数据预测新测量的鸢尾花的品种。

2. 泛化能力

不能用构建模型的数据用于评估模型，否则模型的“记忆”总会预测正确的标签，无法评价模型的“泛化”能力（指机器学习算法对新鲜样本的适应能力：泛化能力）

3. 训练集与测试集

因此，需要用新的数据（模型未见过的）来评估模型性能。通常是将现有数据分为两分，一部分用于构建机器学习模型，称为“训练数据/训练集”；另一部分用于评估模型性能，称为“测试数据/测试集”。

train_test_split函数可以利用“伪随机数生成器”将数据集打乱并拆分：默认75%为训练集，25%为测试集（可以自行定义比例），但是一般为3:1。

数据通常用大写的X表示，标签用小写的y表示。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris_datas['data'],iris_datas['target'],random_state=0)

可见150行数据被顺利拆分，比例为112:38 = 3:1。

训练数据X_train与训练标签y_train：

>>> print(f"X_train shape:{X_train.shape}")
>>> print(f"y_train shape:{y_train.shape}")
X_train shape:(112, 4)
y_train shape:(112,)

测试数据X_test与测试标签y_test：

>>> print(f"X_test shape:{X_test.shape}")
>>> print(f"y_test shape:{y_test.shape}")
X_test shape:(38, 4)
y_test shape:(38,)

查看下y_train，确实被打乱了。

>>> y_train
array([1, 1, 2, 0, 2, 0, 0, 1, 2, 2, 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 1, 2,
       1, 0, 2, 1, 1, 1, 1, 2, 0, 0, 2, 1, 0, 0, 1, 0, 2, 1, 0, 1, 2, 1,
       0, 2, 2, 2, 2, 0, 0, 2, 2, 0, 2, 0, 2, 2, 0, 0, 2, 0, 0, 0, 1, 2,
       2, 0, 0, 0, 1, 1, 0, 0, 1, 0, 2, 1, 2, 1, 0, 2, 0, 2, 0, 0, 2, 0,
       2, 1, 1, 1, 2, 2, 1, 1, 0, 1, 2, 2, 0, 1, 1, 1, 1, 0, 0, 0, 2, 1,
       2, 0])

六、观察数据/检查数据

构建模型之前，检查数据有以下几个好处：

帮助我们判断机器学习是否可以轻松完成任务。
查看需要的信息是否包含于数据中。
发现异常值和特殊值的好方法。

最佳方法为“数据可视化”：

!pip install mglearn

散点矩阵图（pair plot）是个不错的选择，适用于大于三个特征的数据集作图，函数为scatter_matrix：

import mglearn
iris_dataframe = pd.DataFrame(X_train, columns = iris.feature_names) # 选择的是训练集的数据绘图
grr = pd.plotting.scatter_matrix(iris_dataframe, c = y_train, figsize = (15,15), marker = 'o',
                                 hist_kwds = {'bins':20}, s = 60, alpha = 0.8, cmap = mglearn.cm3)

矩阵的对角线是每个特征的直方图。

从图中可以观察出，利用花瓣和花萼的数据基本可以将三个类别区分开，这说明机器学习模型很可能可以学会区分它们。

七、k邻近算法

1. 模型构建

选择的是“k邻近分类器”：若要对一个新的数据点做出预测，算法会在训练集中寻找出与这个新数据点距离最近的数据点，然后将找的数据点的标签赋值给这个新数据点。

其中k的含义为：可以考虑训练集这两个与新数据点最近的任意k个邻居（比如，最近的3个或5个），而非只考虑最近的那一个。接着，用这些邻居中数量最多的类别做出预测。

from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors = 1) # 此处设置邻居数目为1

这个模型只需要保存训练集即可：

>>> knn.fit(X_train,y_train)
KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
                     metric_params=None, n_jobs=None, n_neighbors=1, p=2,
                     weights='uniform')

2. 进行预测

假设一朵新发现的鸢尾花的数据为：花萼长5cm宽2.9cm；花瓣长1cm宽0.2cm。将数据保存于NumPy数组中：

>>> X_new = np.array([[5,2.9,1,0.2]])
>>> X_new.shape
(1, 4)

进行预测：

>>> prediction = knn.predict(X_new)
>>> print('Prediction:', prediction)
Prediction: [0]

该新数据的预测结果为setosa：

>>> print('Predicted target name:',iris['target_names'][prediction])
Predicted target name: ['setosa']

但我们并不知道是否该去相信这个模型，因此需要对模型的预测准确性进行评估。

3. 模型评估

对测试集的数据进行标签预测：

>>> y_pred = knn.predict(X_test)
>>> print(y_pred)
[2 1 0 2 0 2 0 1 1 1 2 1 1 1 1 0 1 1 0 0 2 1 0 0 2 0 0 1 1 0 2 1 0 2 2 1 0
 2]

可以通过计算精度（accuracy）来衡量模型优劣：

>>> np.mean(y_pred == y_test)
0.9736842105263158

>>> knn.score(X_test,y_test)
0.9736842105263158

模型准确率达到了97%以上，说明可信度较高。后续还会学习如何提高准确率，以及调参的注意事项。

To be continued…

欢迎继续浏览：第二章监督学习第1、2节

计算机毕业设计之基于PythonBOSS直聘招聘数据可视化系统的设计与实现 wx—bishe58 信息可视化数据分析数据挖掘 rnn 人工智能课程设计 python
本文主要介绍了基于PythonBOSS直聘招聘数据可视化系统的设计与实现。随着互联网的普及，BOSS直聘招聘网站成为了企业和求职者的重要交流平台。然而，大量的招聘信息给用户带来了信息过载的问题。为了解决这一问题，本文提出了一种基于PythonBOSS直聘招聘数据可视化系统的设计与实现方法。首先，本文采用爬虫技术收集了拉勾BOSS直聘招聘网站上的大量招聘信息。然后，利用爬虫优化算法对爬取到的数据进行
Python 中的异常处理：try except Exception as e 三带俩王 python
在Python编程中，异常处理是一项至关重要的技能，它可以帮助我们提高程序的稳定性和可靠性。其中，tryexceptExceptionase语句是一种常见的异常处理方式。在这篇博客中，我们将深入探讨这个语句的要点和高级用法。一、异常处理的重要性在编程过程中，错误是不可避免的。这些错误可能是由于用户输入错误、文件不存在、网络连接问题等原因引起的。如果我们不处理这些错误，程序可能会崩溃，导致数据丢失或
python中的CSV模块一粒微尘_1 Python基础 python 开发语言后端
1、查询CSV模块中都有哪些函数和功能？①通过dir()函数查询CSV模块都有哪些函数importcsvforiindir(csv):print(i)②搜索CSV模块的官方教程’https://docs.python.org/3.6/library/csv.html‘③搜索中文教材’https://yiyibooks.cn/xx/python_352/library/csv.html#module
python爱心代码高级 youyouxiong python 开发语言
在Python中，绘制爱心图案可以通过多种方式实现，包括使用turtle模块、matplotlib库或者PIL库。以下是一些使用这些库绘制爱心的高级方法：使用turtle模块绘制动画爱心importturtleimportmathdefdraw_heart(t,size):""“绘制爱心的函数”""t.begin_fill()a=2*math.pit.circle(size,a/2)t.circl
Python李峋同款跳动的爱心代码（可写字版）雪碧没气阿 python 数据库开发语言 ide webstorm 爬虫
一年前小编曾用python编写过跳动的爱心代码，不知道有多少小伙伴们已经学会了呢，最近小编在用c语言和java编写跳动的爱心的时候，发现之前用python编写跳动的爱心时没有添加文字，这不，小编立马翻出之前的代码一顿操作，给大家带来了更新后的爱心，快来看看趴~（附详细分析哦）环境PythonPyCharm跳动的爱心运行结果完整程序importtkinterastkimporttkinter.mes
Apache Airflow 2.1.2：开源工作流管理系统的全面指南銀河鐵道的企鵝
本文还有配套的精品资源，点击获取简介：ApacheAirflow2.1.2是一个开源的工作流管理系统，用于编排、调度和监控复杂的业务逻辑。它基于DAG（有向无环图）概念，通过Python代码定义任务的Operator，定义任务的执行顺序和条件。该版本提供了任务调度、监控、错误处理、插件扩展和多环境管理等核心功能。解压后包含许可证文件、文档和源代码目录等，且介绍了安装和运行步骤。Airflow适用于
python无法启动此程序因为_(python shell怎么用)为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？... weixin_39540023 python无法启动此程序因为
python3.8遍历整个列表？你打印的是colorprint(color)不对应该是magician为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？这是你windows操作文件丢失的，和python无关。首先去网上搜索下载api-ms-win-crt-process-l1-1-0.dll文件载完毕后，把dll文件放到C:\Windows\System32下即可。如果下载的d
举例说明Python的CSV模块 weixin_30556161 python
举例说明Python的CSV模块byGaryJia—上次修改时间:2007-11-3017:28文章标签pythonzope举几个例子来介绍一下，Python的CSV模块的使用方法，包括，reader,writer,DictReader,DictWriter.register_dialect一直非常喜欢python的csv模块，简单易用，经常在项目中使用，现在举几个例子说明一下。reader(cs
Python爬虫实战：解析京东商品信息（附部分源码）是有头发的程序猿 API API接口 python 爬虫开发语言
在信息爆炸的今天，网络爬虫（WebScraping）作为一种自动获取网页内容的技术，已经成为数据采集的重要手段。Python，因其简洁的语法和强大的库支持，成为编写爬虫的首选语言之一。本文将通过一个实战案例，展示如何使用Python编写爬虫，以京东商品页面为例，解析商品信息。环境准备在开始编写爬虫之前，需要准备以下环境和工具：Python3.x网络请求库：requestsHTML解析库：Beaut
代码随想录算法训练营第三十六天-动态规划-474.一和零 taoyong001 算法动态规划 c++leetcode
背包问题本身就已经够反思维的了，竟然物品会有两个维度的情况，这是闹哪样？题目要求是最大子集的个数题目中的mmm和nnn可以类比为容器，要装潢这个容器，最多要多少个元素的个数，就是结果，这个容器最多有mmm个0，nnn个1这个容器相当于一个背包，这个背包是有两个维度，最多有mmm个0，nnn个1，装潢这个背包最多需要多少个物品给出的数据集就是物品这是一道01背包问题动规五部曲这里要使用一个二维的动规
90、Python Web抓取与数据爬虫：技巧、实践与道德规范多多的编程笔记 python 前端爬虫
Python开发：学习Web抓取和数据爬虫大家好，今天我将向大家介绍Python的Web抓取和数据爬虫技术，主要包括BeautifulSoup和Scrapy两个库。在此之前，请大家先思考一个问题：为什么我们需要Web抓取和数据爬虫？为什么需要Web抓取和数据爬虫？在互联网时代，数据量呈爆炸式增长，但并不是所有数据都易于获取。很多时候，我们需要从网站上获取数据，这就需要用到Web抓取和数据爬虫技术。
《CPython Internals》阅读笔记：p360-p377 python
《CPythonInternals》学习第20天，p360-p377总结，总计18页。一、技术总结1.seaborn可视化工具。2.dtrace(1)安装sudoapt-getinstallsystemtap-sdt-dev(2)编译./configure--with-dtracemakecleanmake3.snakeviz适用于cProfile的可视化工具。二、英语总结(生词：0)无。关于英语
【python】csv模块 m 宽 python python 开发语言
importcsv#用列表方式写入withopen("test.csv","w",newline="")asf:#注意，执行newline=""那么数据会自动换行,如果不指定，那么会多换一行writer=csv.writer(f)writer.writerow(["symbol","date","close"])writer.writerow(["rb2101","20200907","3736"
解决Python中libhdfs.so的共享库找不到的问题 code_welike python 开发语言 Python
解决Python中libhdfs.so的共享库找不到的问题在Python开发过程中，有时会遇到导入共享库时出现"ImportError:Cannotfindthesharedlibrary:libhdfs.so"的错误。这个错误通常发生在使用Python访问Hadoop分布式文件系统（HadoopDistributedFileSystem，简称HDFS）时，由于缺少libhdfs.so共享库文件而
The application can not locate Python39.dll (126) chengyunkuan python python 运维 windows
TheapplicationcannotlocatePython39.dll(126)描述：利用pyinstaller打包带pywinauto项目报如下错误：TheapplicationcannotlocatePython39.dll(126)（我这是利用pyinstaller打包带pywinauto项目出现的。）解决办法：将pywinauto库，换成0.6.5版本。pipinstallpywin
Evaluation of OpenAI o1: Opportunities and Challenges of AGI UnknownBody LLM Daily LLM Evaluation agi 人工智能大数据语言模型
本文是LLM系列文章，针对《EvaluationofOpenAIo1:OpportunitiesandChallengesofAGI》的翻译。OpenAIo1评估：AGI的机遇和挑战摘要1引言1.1背景：o1的新功能2研究范围和使用的公共数据集3相关工作4实验和观察5讨论5.1LLMAgents和o1：推进科学与工程中的问题解决6结论摘要这项全面的研究评估了OpenAI的o1-preview大型语
【2024最新】python第三方库的概述——功能、特点西西很呆 python 开发语言源代码管理编辑器计算机网络 scrapy pandas
文章目录一、网络请求与爬虫Requests：Scrapy：BeautifulSoup：二、数据处理与分析NumPy：Pandas：SQLAlchemy：SciPy：matplotlib：Seaborn：三、Web开发Flask：Django：四、图像处理Pillow（PILFork）：OpenCV-Python：五、游戏开发Pygame：Pyglet：六、自然语言处理NLTK（NaturalLan
使用python调用JIRA6 进行OAuth1认证获取AccessToken yaoshengting python #jira python
Jira配置应用程序链接1)创建应用程序链接登录JIRA管理后台。转到Administration>Applications>ApplicationLinks。在输入框中输入外部应用程序的URL（例如GitLab或自定义应用），然后点击Createnewlink。2)配置ConsumerKey和PublicKey在创建应用链接的过程中：ConsumerKey：自定义一个唯一的字符串标识应用程序（例
【python】2024年最新——爱心代码高级西西很呆 python 开发语言编辑器计算机网络源代码管理 matplotlib numpy
文章目录一、字符爱心（简单）思路代码示例二、图案爱心（普通）思路代码示例三、炫酷的爱心（高级）思路代码示例总结一、字符爱心（简单）思路这个代码定义了一个名为print_heart的函数，该函数包含了一个字符串列表，每个字符串代表爱心形状的一部分。然后，通过遍历这个列表并打印每一行，我们在控制台上得到了一个简单的爱心形状。代码示例#定义爱心形状的字符打印函数defprint_heart():hear
python name is not defined_Python: name is not defined weixin_39654322 Python 汉诺塔游戏代码实现文本界面
D'aprèscequejevois,auniveauindentation,jeu=clHanoiTxt(h)estaumêmeniveauquedef__init__DoncpourPython,les3dernièrelignesdetonprogrammefontpartiedetaclasse.Ilfautqu'ilssoientendébutdeligne.Penseàbieninde
预测未来，Python中的时间序列分析模型ARIMA Python学研大本营 python 开发语言
时间序列分析：Python中的ARIMA模型，ARIMA模型是一种常用的时间序列预测工具，可以使用statsmodels库在Python中实现。微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩时间序列分析广泛用于预测和预报时间序列中的未来数据点。ARIMA模型被广泛用于时间序列预测，并被认为是最流行的方法之一。在本教程中，我们将学习如何在Python中搭建和评估用于时间序列预测的A
正确解决NameError: name ‘python‘ is not defined异常的有效解决方法飞码创造者解决bug python 前端开发语言 bug
正确解决NameError:name‘python‘isnotdefined异常的有效解决方法文章目录报错问题报错原因解决方法报错问题NameError:name‘python‘isnotdefined异常报错原因在Python中，如果你遇到了NameError:nam
蓝桥刷题记——python实现第二篇一台电脑走天下 python 蓝桥杯平面
1.卡片#统计1累计出现的次数val=0num=0whileTrue:num+=str(val).count('1')ifnum>=2021:print(val)breakval+=12.直线#解析参考这位博主#直线x=[iforiinrange(20)]y=[iforiinrange(21)]zuobiao=set()foriinx:forjiny:zuobiao.add((i,j))zuobi
蓝桥刷题基础训练python 小馨不滑水笔记 python 蓝桥杯算法
""""数列排序问题描述给定一个长度为n的数列，将这个数列按从小到大的顺序排列。1<=n<=200输入格式第一行为一个整数n。第二行包含n个整数，为待排序的数，每个整数的绝对值小于10000。输出格式输出一行，按从小到大的顺序输出排序后的数列。"""#ls=[]#a=int(input())#b=input().split()#foriinb:#ls.append(int(i))#ls.sort(
一、深度学习的基本介绍关关钧深度学习深度学习人工智能神经网络
机器学习的基本步骤：前馈运算、反向传播计算梯度、根据梯度更新参数值。一、定义及基本概念深度学习，就是一种利用深度人工神经网络来进行自动分类、预测和学习的技术。它可以从海量的数据中自动学习，找寻数据中的特征。所以说，它的本质就是自动提取特征的能力。可以说，深度学习就等于深度人工神经网络。一般认为超过三层的神经网络就可以叫做深度神经网络。深度学习属于一种特殊的人工智能技术。反向传播算法：此算法是人工神
NameError: name ‘python‘ is not defined的正确解决方法，亲测有效，嘿嘿嘿代码无疆 Python python 开发语言
文章目录问题分析：报错原因：解决思路：解决方法：问题分析：NameError是Python中的一个异常类型，它表明你尝试访问一个当前作用域中未定义的变量名。在给出的错误信息NameError:name‘python‘isnotdefined中，它表明你尝试使用一个名为python的变量或对象，但是在当前的代码上下文中并没有定义这个名称。报错原因：报错原因通常是因为以下几个情况之一：拼写错误：可能你
Python中常见的几种输出形式 .zhy. Python python 开发语言
目录一、标准输出（print函数）特点适用场景二、格式化占位符输出（%操作符）特点适用场景三、格式化输出（str.format()方法）特点适用场景四、格式化字符串常量输出（f-string）特点适用场景五、总结一、标准输出（print函数）这是最基本的输出方式，使用print函数简单直观，适用于快速输出数据。print函数可以输出多种类型的数据，如字符串、数字、列表等，并且默认在输出结束后换行。
如何用一分钟画出生日蛋糕【Python】时光-小巷 python项目 python pygame 开发语言
看到网上有很多用Python画蛋糕的代码，但觉得它们执行效率比较低，代码重复率也比较高，所以对代码做了很多改动，不过蛋糕样式跟网上是一样的。运行效果的视频可以去b站观看，id也是“时光-小巷”，以后也会在CSDN发实用项目的代码，喜欢的小伙伴们可以关注一下~一、最终效果图二、代码importturtleast#导入turtle内置模块，t变成turtle的别名importmathasm#移动海龟的
【Python报错已解决】NameError: name ‘python‘ is not defined HoRain云小助手 python python 开发语言
很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨目录引言：一、问题描述：1.1报错示例：1.2报错分析：1.3解决思路：二、解决方法：2.1方法一：定义变量2.2方法二：检查变量名拼写2.3方法三：确认变量作用域2.4方法四：检查模
chrome小恐龙游戏【Python】时光-小巷 python项目游戏 python pygame
一、游戏效果图（1）运行时（2）结束后二、具体代码importpygamefrompygame.localsimport*#导入pygame的常量importsysimporttimeimportrandom#各个图片的位置bg_site=[(0,0),(640,0)]#背景1和2的位置dino_site=[45,125]#恐龙的位置ca_site=[(-52,117),(-52,130)]#仙人
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe