qigeyonghuming_1

Python机器学习手册从数据预处理到深度学习（一）

这周借了本书，打算看看Python了，不知道会不会又半途而废，希望能够坚持下来，打算就是前面几章数据预处理，加上SVM的部分，感觉不多，希望这次真的可以坚持下来

今天先学习第一章：向量、矩阵和数组
这一章主要是用numpy库来实现对向量、矩阵、数组的基本操作，代码和注释基本都是来源于这本书的

#这是本书的第一章：向量、矩阵和数组——本章将介绍在进行机器学习的过程中可能经常遇到的numpy操作
######################################################################
#1.1 创建一个向量
#问题描述：创建一个向量
#加载库
import numpy as np  #书中是numPy，但会报错没有这个模块

#创建一个行向量
vector_row=np.array([1,2,3])

#创建一个列向量
vector_column=np.array([[1],
                        [2],
                        [3]])
#####################################################################
#1.2 创建一个矩阵
#问题描述：创建一个向量
#加载库
import numpy as np  #书中是numPy，但会报错没有这个模块

#创建一个矩阵
matrix=np.array([[1,2],
                [1,2],
                [1,2]])
#三行两列的矩阵，第1列都是1，第2列都是2
#实际上，numpy提供了专门的数据结构来表示矩阵
matrix_object=np.mat([[1,2],
                      [1,2],
                      [1,2]])
matrix=([[1,2],
         [1,2],
         [1,2]])
#虽然有专门的数据结构来表示矩阵，但是不建议使用矩阵数据结构，
#原因有二:1 数组才是numpy的标准数据结构 2绝大多数的numpy操作返回的是数组而不是矩阵对象
###########################################################################################
#1.3创建一个稀疏矩阵
#问题描述：高效地表示只有零星非零值的数据
#加载库
import numpy as np
from scipy import sparse

#创建一个矩阵
matrix=np.array([[0,0],
                 [0,1],
                 [3,0]])

#创建一个压缩的稀疏行（Compressed Sparse Row,CSR）矩阵
matrix_sparse=sparse.csr_matrix(matrix)

#查看稀疏矩阵
print(matrix_sparse)
#结果如下
# (1, 1)	1
# (2, 0)	3
#矩阵的下标从0开始，(1,1)代表第2行第2列元素非零。1表示值为1，(2, 0)代表第3行第1列元素非零。3表示值为3

#创建一个更大的矩阵
matrix_large=np.array([[0,0,0,0,0,0,0,0,0,0],
                       [0,1,0,0,0,0,0,0,0,0],
                       [3,0,0,0,0,0,0,0,0,0]])
#创建CSR矩阵
matrix_large=sparse.csr_matrix(matrix_large)

#查看原先的稀疏矩阵
print(matrix_sparse)

#查看更大的稀疏矩阵
print(matrix_large)
#可见，尽管实际上这个更大的矩阵中增加了很多非零的元素，但是它的表示和原来那个稀疏矩阵是一样的

#稀疏矩阵有很多种类型，不存在完美的稀疏矩阵，它们之间的差异都是有意义的，而且知道在什么场景下选择哪种类型
#的稀疏矩阵是很有必要的
###########################################################################################
#1.4选择元素
#问题描述：在向量或矩阵中，选择一个或多个元素
#加载库
import numpy as np

#创建一个行向量
vector = np.array([1,2,3,4,5,6])

#创建一个矩阵
matrix = np.array([[1,2,3],
                   [4,5,6],
                   [7,8,9]])

#选择向量的第三个元素
vector[2] #不会显示出来
print(vector[2]) #显示出来

#选择第2行第2列
matrix[1,1] #不会显示出来
print(matrix[1,1]) #显示出来

#讨论
#如同Python中的大多数事物一样，numpy数组的索引编号是从0开始的，这意味着第一个元素的下标是0而不是1
#除此之外，numpy还提供了很多方式来选取元素或数组中的一组元素（即索引和切片）

#选取所有的元素
vector[:] #不会显示出来
print(vector[:]) #显示出来
#结果：
# [1 2 3 4 5 6]

#选取从0开始一直到第3个（包含第3个元素）
vector[:3] #不会显示出来
print(vector[:3]) #显示出来
#结果：
# [1 2 3]


#选取第3个元素以后得所有元素
vector[3:] #不会显示出来
print(vector[3:]) #显示出来
#结果：
#[4 5 6]

#选取最后一个元素
vector[-1] #不会显示出来
print(vector[-1]) #显示出来
#结果：
#6

#选取矩阵的第1行和第2行以及所有列
matrix[:2,:] #不会显示出来
print(matrix[:2,:]) #显示出来
#结果：
# [[1 2 3]
#  [4 5 6]]


#选取所有行以及第2列
matrix[:,1:2] #不会显示出来
print(matrix[:,1:2]) #显示出来
#结果：
# [[2]
#  [5]
#  [8]]
###########################################################################################
#1.5展示一个矩阵的属性
#问题描述：展示一个矩阵的形状大小和维数
#加载库
import numpy as np

#创建矩阵
matrix=np.array([[1,2,3,4],
                 [5,6,7,8],
                 [9,10,11,12]])
#查看航速和列数
matrix.shape #不会显示出来
print(matrix.shape) #显示出来
#结果：
# (3, 4)

#查看元素的数量（行数*列数）
matrix.size #不会显示出来
print(matrix.size) #显示出来
#结果：
# 12

#查看维数
matrix.ndim #不会显示出来
print(matrix.ndim) #显示出来
#结果：
# 2

#讨论
#虽然这些操作看起来很简单（确实也是这样，但是在做下一步计算之前或在某个操作之后，简单检查一下数组的形状
# 和大小是很有价值的）
#################################################################################
#1.6对多个元素同时应用某个操作
#问题描述：对一个数组中的多个元素同时应用某个函数
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9]])

#创建一个函数，返回输入值加上100后的值
add_100=lambda i:i+100

#创建向量化函数
vectorized_add_100 =np.vectorize(add_100)

#对矩阵所有元素应用这个函数
vectorized_add_100(matrix) #不显示出来
print(vectorized_add_100(matrix)) #显示出来
#结果：
# [[101 102 103]
#  [104 105 106]
#  [107 108 109]]

#讨论
#numpy的vectorze类将一个函数转换成另一个函数，这个函数能把某个操作应用在数组的全部元素或一个切片上，
#值得注意的是，vectorize本质上是在对所有元素循环进行猴哥操作，所以并不会提升性能，此外，使用numpy的
# 数组，我们可以对两个维度不同的数组执行操作（这是一种叫做广播的方法）。举个例子，对于上述问题使用
# 广播后，我们的解决方案更加简单

#将所有的元素加上100
matrix +100
print(matrix +100)
#################################################################
#1.7找到最大值和最小值
#问题描述：计算一个数组的最大值和最小值
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9]])
#返回最大的元素
np.max(matrix) #不会显示出来
print(np.max(matrix)) #显示出来

#返回最小的元素
np.min(matrix) #不会显示出来
print(np.min(matrix)) #显示出来

#讨论
#使用axis参数可以对一个特定的坐标轴应用此操作
#找到每一列最大的元素
np.max(matrix,axis=0)  #不会显示出来
print(np.max(matrix,axis=0)) #显示出来

#找到每一行最大的元素
np.max(matrix,axis=1) #不会显示出来
print(np.max(matrix,axis=1)) #显示出来
###################################################################
#1.8计算平均值、方差和标准差
#问题描述：计算数组的一些描述性统计值
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9]])

#返回平均值
np.mean(matrix)
print(np.mean(matrix))

#返回方差
np.var(matrix)
print(np.var(matrix))

#返回标准差
np.std(matrix)
print(np.std(matrix))

#讨论
#就如同使用min和max一样，我们可以计算出整个矩阵或其中一个坐标轴的描述性统计值
#求每一列的平均值
np.mean(matrix,axis=0)
print(np.mean(matrix,axis=0))
#结果
# [4. 5. 6.]

#求每一行的平均值
np.mean(matrix,axis=1)
print(np.mean(matrix,axis=1))
#结果
#[2. 5. 8.]
#######################################################################
#问题描述：在不改变元素值的前提下，改变一个数组的形状（行数和列数）
#加载库
import numpy as np

#创建一个4 x 3的矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9],
                 [10,11,12]])

#将该矩阵变形为2 x 6的矩阵
matrix.reshape(2,6)
print(matrix.reshape(2,6))

#讨论
#reshape 能传入一个非常有用的参数值 -1，表示可以“根据需要填充元素”，
# 所以reshape（1,-1）意味着矩阵的函数是1，列数则根据需要填充
matrix.reshape(1,-1)
print(matrix.reshape(1,-1))
##########################################################
#1.10转置向量或矩阵
#问题描述：转置一个向量或矩阵
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9]])
#转置一个矩阵
matrix.T
print(matrix.T)

#讨论
#转置是线性代数中很常见的操作，它将每个元素的行、列下标互换
#严格意义上讲，一个向量是不能被转置的，因为它只是值的集合。

#将向量转置
np.array([1,2,3,4,5,6]).T
print(np.array([1,2,3,4,5,6]).T)
# 结果
# [1 2 3 4 5 6]

#转置一个行向量 （注意第2对括号）
np.array([[1,2,3,4,5,6]]).T
print(np.array([[1,2,3,4,5,6]]).T)
# 结果
# # [[1]
# #  [2]
# #  [3]
# #  [4]
# #  [5]
# #  [6]]
###########################################################
#1.11展开一个矩阵
#问题描述：将矩阵转换为一个一维数组
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [4,5,6],
                 [7,8,9]])
#将矩阵展开
matrix.flatten()
print(matrix.flatten())
#讨论
#flatten是将矩阵转换为一维数组的一种简单方法，另一种是用reshape来构建一个行向量
matrix.reshape(1,-1)
print(matrix.reshape(1,-1))
###############################################################################
#计算矩阵的秩
#问题描述;计算一个矩阵的秩
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,1,1],
                 [1,1,10],
                 [1,1,15]])
#返回矩阵的秩
np.linalg.matrix_rank(matrix)
print(np.linalg.matrix_rank(matrix))
#讨论
#矩阵的秩就是由它的列或行展开的向量空间的维数，多亏由numpy的matrix_rank,计算一个矩阵的秩才能如此简单
#############################################################################################
#1.13计算行列式
#问题描述：计算一个矩阵的行列式
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [2,4,6],
                 [3,8,9]])
#返回矩阵的行列式
np.linalg.det(matrix)
print(np.linalg.det(matrix))
#讨论
#有时候矩阵的行列式是很有用的，使用numpy的det能够很容易计算出矩阵的行列式
########################################################################
#1.14获取矩阵的对角线元素
# 问题描述：获取矩阵的对角线元素
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [2,4,6],
                 [3,8,9]])
#返回对角线元素
matrix.diagonal()
print(matrix.diagonal())
#讨论
#我们还可以使用offset参数在主对角线的上下偏移，获取偏移后的对角线方向的元素：
# 返回对角线向上偏移量为1的对角线元素
matrix.diagonal(offset=1)
print(matrix.diagonal(offset=1))

# 返回对角线向下偏移量为1的对角线元素
matrix.diagonal(offset=-1)
print(matrix.diagonal(offset=-1))
############################################################################
#1.15计算矩阵的迹
#问题描述：计算一个矩阵的迹
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,2,3],
                 [2,4,6],
                 [3,8,9]])
#返回矩阵的迹
matrix.trace()
print(matrix.trace())
#讨论
#矩阵的迹是其对角线元素之和，我们还可以先返回矩阵的对角线元素，再对其求和来计算矩阵的迹
sum(matrix.diagonal())
print(sum(matrix.diagonal()))
#######################################################################
#1.16计算特征值和特征向量
#问题描述：计算一个方阵的特征值和特征向量
#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,-1,3],
                 [1,1,6],
                 [3,8,9]])
#计算特征值和特征向量
eigenvalues,eigenvector=np.linalg.eig(matrix)

#查看特征值
eigenvalues
print(eigenvalues)

#查看特征向量
eigenvector
print(eigenvector)
#############################################################
#1.17计算点积
#问题描述：计算两个向量的点积
#加载库
import numpy as np

#创建两个向量
vector_a=np.array([1,2,3])
vector_b=np.array([4,5,6])

#计算点积
np.dot(vector_a,vector_b)
print(np.dot(vector_a,vector_b))

#讨论
#计算点积：在Python3.5以上的版本中使用新操作符@
vector_a @ vector_b
print(vector_a @ vector_b)
###############################################################
#1.18矩阵的相加或相减
#问题的描述：将两个矩阵相加或相减
#加载库
import numpy as np

#创建一个矩阵
matrix_a=np.array([[1,1,1],
                   [1,1,1],
                   [1,1,2]])
#创建另一个矩阵
matrix_b=np.array([[1,3,1],
                   [1,3,1],
                   [1,3,8]])
# 将两个矩阵相加
np.add(matrix_a,matrix_b)
print(np.add(matrix_a,matrix_b))

# 将两个矩阵相减
np.subtract(matrix_a,matrix_b)
print(np.subtract(matrix_a,matrix_b))
#讨论
#还可以简单地使用“+”和“-”操作符来实现矩阵的相加或相减
#将两个矩阵相加
matrix_a + matrix_b
print(matrix_a + matrix_b)

#将两个矩阵相减
matrix_a - matrix_b
print(matrix_a - matrix_b)
###############################################################
#1.19矩阵的乘法
#问题描述：将两个矩阵相乘
#加载库
import numpy as np

#创建一个矩阵
matrix_a=np.array([[1,1],
                   [1,2]])
#创建另一个矩阵
matrix_b=np.array([[1,3],
                   [1,2]])
#将两个矩阵相乘
np.dot(matrix_a,matrix_b)
print(np.dot(matrix_a,matrix_b))
#讨论
#还可以在Python3.5以上的版本中使用@操作符
matrix_a @ matrix_b
print(matrix_a @ matrix_b)
#结果：
# [[2 5]
#  [3 7]]

#如果是想将两个矩阵对应的元素相乘，则需要使用*操作符
#让两个矩阵对应的元素相乘
matrix_a * matrix_b
print(matrix_a * matrix_b)
#结果：
# [[1 3]
#  [1 4]]
###########################################################
#1.20计算矩阵的逆
#问题描述：计算一个方阵的逆
#加载库
import numpy as np

#加载库
import numpy as np

#创建一个矩阵
matrix=np.array([[1,4],
                 [2,5]])

#计算一个矩阵的逆
np.linalg.inv(matrix)
print(np.linalg.inv(matrix))
#讨论
#将一个矩阵和它的逆矩阵相乘，结果会是一个单位矩阵
matrix @ np.linalg.inv(matrix)
print(matrix @ np.linalg.inv(matrix))
#结果
# [[1. 0.]
#  [0. 1.]]
####################################################################################
#1.21生成随机数
#问题描述：生成一些伪随机数
#加载库
import  numpy as np

#设置随机数种子
np.random.seed(0)

#生成3个0.0到1.0之间的随机浮点数
np.random.random(3)
print(np.random.random(3))
#结果
# [0.54488318 0.4236548  0.64589411]
#使用相同的种子，产生相同的随机数
#讨论
#numpy提供了生成随机数的大量方法，对此更深入的讨论超出了本书的范围，
# 我们的解决方案中中生成的是浮点数，但是其实生成整数更常见
#生成3个1到10之间的随机整数
np.random.randint(0,11,3)
print(np.random.randint(0,11,3))

#或者可以从一个分布中随机抽取一些数来生成随机数
#从平均值是0.0，且标准差是1.0的正态分布中抽取3个数
np.random.normal(0.0,1.0,3)
print(np.random.normal(0.0,1.0,3))

#从平均值是0.0，且散布程度是1.0的logistic中抽取3个数
np.random.logistic(0.0,1.0,3)
print(np.random.logistic(0.0,1.0,3))

#从大于或等于1.0并且小于2.0的范围中抽取3个数
np.random.uniform(1.0,2.0,3)
print(np.random.uniform(1.0,2.0,3))
#最后 多次返回相同的随机数对于获取可预测、可重复的结果是很有用的，如果希望返回同样的随机数，
# 可以设置伪随机数生成器的“种子”（一个整数），如果在程序中用到了随机数，则拥有相同“种子”的程序会生成同样的
# 结果，对种子的使用会贯彻整本书，所以本书中使用“种子”的代码所生成的随机数，
# 与它们在你的电脑上运行产生的随机数是相同的。

python中的dict与set “光光” python
python内置字典：dict支持key-value存储方式，在放进去的时候，必须根据key算出value的存放位置，这样取出来的时候才能根据key拿到value。由于一个key只能对应一个value,所以，多次对一个key放入value,后面的值会将前面的值覆盖掉。如果key不存在，dict就会报错要避免key不存在的错误，有两种方法：1）通过in判断key是否存在>>>d=｛'a':'1'｝>
Python基础---Dict（字典） grace666 Python
1.字典以键值对组成，包含在{}中，字典的键必须为hashable，即不可变（字符串、元组、数字），并且唯一；值可以是任何类型#dict1={[1]:1}#报错：TypeError:unhashabletype:'list'#dict1={{1}:1}#报错：TypeError:unhashabletype:'set'dict1={(1,):1}print(dict1)#{(1,):1}dict1
Markdown 到 PowerPoint 转换工具——md2pptx 伍盛普Silas
Markdown到PowerPoint转换工具——md2pptxmd2pptxMarkdownToPowerPointconverter项目地址:https://gitcode.com/gh_mirrors/md/md2pptxmd2pptx是一个开源项目，它可以将Markdown格式的文本转换为PowerPoint演示文稿。该项目主要使用Python编程语言实现。项目基础介绍md2pptx是一个
Python网络爬虫-WebSocket数据抓取程序小勇 faiss 爬虫 python 网络协议 websocket 开发语言
目录前言1、WebSocket请求的分析通常涉及以下几个方面：2、利用WebSocket爬取数据总结最后，创作不易！非常感谢大家的关注、点赞、评论啦！谢谢三连哦！好人好运连连，学习进步！工作顺利哦！博主介绍：✌专注于前后端、机器学习、人工智能应用领域开发的优质创作者、秉着互联网精神开源贡献精神，答疑解惑、坚持优质作品共享。本人是掘金/腾讯云/阿里云等平台优质作者、擅长前后端项目开发和毕业项目实战，
python 山脊图_（数据科学学习手札98）纯Python绘制满满艺术感的山脊地图 weixin_39780255 python 山脊图
1简介下面的这幅图可能很多读者朋友们都看到过，这是英国摇滚乐队JoyDivision在1979年发行的其第一张录音室专辑UnknownPleasures的封面，由艺术家PeterSaville基于射电脉冲星信号的数据图创作而成，成为了一种流行文化的符号标志。图1类似图1的风格，在地图制作中也存在着一种山脊地图，基于记录地表海拔信息的高程数据，我们可以利用水平方向上的基于实际位置海拔高度的曲线，来对
JVM 内存管理详解 pjx987 JVM jvm
Java虚拟机(JVM)是Java应用程序的基础，而内存管理则是JVM最为核心的功能之一。本篇文章将详细介绍JVM如何管理和分配内存，以及如何处理垃圾回收等问题。此外，还将通过一些代码示例和实际项目场景来说明内存管理的重要性，并引用一些专家的观点加深理解。1.JVM内存区域概述JVM的内存主要分为以下几个区域：堆(Heap)：所有线程共享的内存区域，主要用于存储对象实例、数组等数据。方法区(Met
【Python 学习 / 5】函数详解（定义、参数、作用域、lambda、内置函数）卜及中 Python基础 python 学习开发语言
文章目录一、函数1.定义函数1.1基本函数定义1.2带参数的函数1.3带返回值的函数2.参数传递2.1位置参数2.2默认参数2.3可变参数2.3.1使用`*args`2.3.2使用`**kwargs`2.4参数的混合使用3.作用域3.1局部和全局变量3.2`global`关键字输出：3.3`nonlocal`关键字输出：4.lambda表达式4.1基本用法4.2与`map()`、`filter()
哈希表(C语言实现) 写代码的大学生散列表 c语言哈希算法
在计算机世界中，哈希表如同一位聪慧的图书管理员。他知道如何计算索书号，从而可以快速找到目标图书。文章目录1.哈希表的概念1.1哈希表的基本操作1.2哈希表的常用操作2.基于数实现哈希表2.1哈希表的结构体定义2.2哈希表的初始化2.3删除哈希表2.4哈希函数2.5查找哈希表中的元素2.6删除哈希表中的元素2.7添加哈希表元素3.哈希冲突与扩容4.链式地址改良哈希表4.1链式地址哈希表结构体定义4.
哈希表（C语言版） coding_rui 数据结构与算法 C语言散列表 c语言数据结构
文章目录哈希表原理实现(无自动扩容功能)代码运行结果分析应用哈希表如何统计一段文本中，小写字母出现的次数?显然，我们可以用数组inttable[26]来存储每个小写字母出现的次数，而且这样处理，效率奇高。假如我们想知道字母’k’出现的次数，直接访问元素table['k'-'a']即可，时间复杂度为O(1)。在现实生活中，我们经常需要存储键值对(key-value)数据，比如上面的‘a’:10,‘b
leetcode简单(181-200)python 九日火 leetcode python
762.PrimeNumberofSetBitsinBinaryRepresentation(e-181)GiventwointegersLandR,findthecountofnumbersintherange[L,R](inclusive)havingaprimenumberofsetbitsintheirbinaryrepresentation.(Recallthatthenumberofs
LeetCode 88. 合并两个有序数组，java合并两个有序数组含自己思考代码常清静~ 数据结构与算法 leetcode 算法
1.官方链接：.-力扣（LeetCode）2.题目：给你两个按非递减顺序排列的整数数组nums1和nums2，另有两个整数m和n，分别表示nums1和nums2中的元素数目。请你合并nums2到nums1中，使合并后的数组同样按非递减顺序排列。注意：最终，合并后数组不应由函数返回，而是存储在数组nums1中。为了应对这种情况，nums1的初始长度为m+n，其中前m个元素表示应合并的元素，后n个元素
LeetCode 88.合并两个有序数组 Xin_Hack LeetCode leetcode 算法
原题链接如下：88.合并两个有序数组解法1（先合并后排序）：classSolution{public:voidmerge(vector&nums1,intm,vector&nums2,intn){//先将nums2合并在nums1后面for(inti=m,j=0;i&nums1,intm,vector&nums2,intn){//先将nums2合并在nums1后面for(inti=0i&nums1
PaddleOCR面板恢复python脚本--针对pdf的面板恢复 zsh669 paddlepaddle ocr 百度 python pdf
问题在做一个项目的时候，使用PaddleOCR提供的模型，实现对图片或者pdf进行面板恢复，并保存为.docx文档。但是，官方的文档只提供了针对图片进行面板恢复的python脚本，没有提供pdf进行面板恢复的python脚本，官方只提供了pdf面板恢复的命令行使用方法，因此，我去看了PaddleOCR的源码，将命令行方法转换为python脚本准备工作环境配置和文档请参考：\ppstructure/
html5 二进制数据解析,JavaScript读写二进制数据的方法详解如果有片海 html5 二进制数据解析
前言二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数，如果想要在前端中处理音频和视频。那你必须要对二进制数据有很好地掌握和操作能力。下面话不多说了，来一起看看详细介绍的吧类型化数组的出现类型化数组是HTML5中引入的API，它能够让开发者使用JavaScript直接操作二进制数据。在类型化数组出现之前，我们是无法直接通过JavaScript操作二进制数据，通常都是操作J
Python库 - transformers 司南锤 PYTHON库 python机器学习 python 开发语言
transformers库是由HuggingFace开发的一个非常流行的Python库，用于自然语言处理（NLP）任务。它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。以下是关于transformers库的详细介绍：1.主要特点预训练模型：transformers库包含了多种预训练的语言模型，如BERT、GPT、T5、XLNet等。这些模型在大规模文本
【NLP-04】tranformers库保姆级使用教程---以BERT模型为例云天徽上 NLP bert 人工智能深度学习自然语言处理机器学习 numpy 信息可视化
安装要安装一个非常轻量级的Transformers库，您可以执行以下步骤：1、打开终端或命令提示符。2、运行以下命令来安装Transformers库：pipinstalltransformers这将使用pip工具从PythonPackageIndex（PyPI）下载并安装Transformers库。请确保您的计算机上已经安装了pip。然后，您可以在Python代码中导入Transformers库：
利用 OpenCV 进行棋盘检测与透视变换萧鼎 python基础到进阶教程 opencv 人工智能计算机视觉
利用OpenCV进行棋盘检测与透视变换1.引言在计算机视觉领域，棋盘检测与透视变换是一个常见的任务，广泛应用于摄像机标定、文档扫描、增强现实（AR）等场景。本篇文章将详细介绍如何使用OpenCV进行棋盘检测，并通过透视变换将棋盘区域转换为一个标准的矩形图像。我们将基于一段Python代码进行分析，代码的主要任务包括：读取图像并进行预处理（灰度转换、自适应直方图均衡化、去噪）检测边缘并提取棋盘区域计
conda更换环境版本（比如torch版本）挨打且不服66 python python
找到想要的torch版本pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡训练的时候，需要安装与显卡对应的cuda和cudnn。但不同的项目所支持的pytorch版本是不一样的，而pytorch版本和cuda版本之间又是互相依赖的，所以如果可以
一文读懂！深度学习 + PyTorch 的超实用学习路线 a小胡哦深度学习 python pytorch
深度学习作为人工智能领域的核心技术，正深刻改变着诸多行业。PyTorch则是深度学习实践中备受青睐的框架，它简单易用且功能强大。下面就为大家详细规划深度学习结合PyTorch的学习路线。一、基础知识储备数学基础数学是很重要的！！！线性代数、概率论与数理统计、微积分是深度学习的数学基石。熟悉矩阵运算、概率分布、梯度计算等概念，能帮助理解深度学习模型的原理。例如，在神经网络中，矩阵乘法用于神经元之间的
流行编程语言全解析：优势、应用与短板 a小胡哦 python java c++c语言 javascript swift r语言
Python：优势Python以其简洁、易读的语法闻名，新手能快速上手。丰富的库和框架，能极大地提高开发效率。适用领域数据科学与分析：处理和分析大规模数据集，进行数据可视化。典型示例：Google用Python进行数据分析，处理海量数据以支持各种业务决策。机器学习与人工智能：构建和训练模型。典型示例：OpenAI在很多人工智能项目中广泛使用Python，如GPT系列模型的研发。网络爬虫：轻松从网页
用conda虚拟环境解决py+torch环境问题 SevenZS Note anaconda python
要事先安装wheelpipinstallwheelcondainstallnb_conda安装nb_conda这样可以在shell切换虚拟环境启动jupyternotebook后切换到虚拟环境创建虚拟环境condacreate-npython36python=3.6condaactivatepython36加载后再pip安装torch1.4+cu101所有版本torch放在某个文件夹，比如桌面后p
【报错】ImportError: cannot import name ‘get_refined_artifact_map‘ from ‘basicsr.losses.loss_util‘ 之群害马 python 深度学习 pytorch
ImportError:cannotimportname'get_refined_artifact_map'from'basicsr.losses.loss_util'(xxx/lib/python3.10/site-packages/basicsr/losses/loss_util.py)解决办法：找到basicsr库网站缺失的部分如下，补充到原来的xxx/lib/python3.10/site
Python 用pytorch从头写Transformer源码，一行一解释；机器翻译实例代码；Transformer源码解读与实战医学小达人 NLP LLMs GPT 深度学习人工智能 transformer python 机器学习
1.Transformer简介Transformer模型被提出的主要动机是解决序列处理任务的长距离依赖问题。传统的RNN和LSTM虽然能够处理序列任务，但因为它们在处理序列时需要一步步前进，因此其他信息无法立即对其产生影响，当序列变长时，长距离依赖的信息很可能会被丢失。为了解决这个问题，Transformer模型被设计出来，内核思想是利用自注意力机制，这样模型可以直接对输入序列的任意两个位置建立直
Spring Framework 7.0.0-M1 预发布版重磅更新！全面优化，性能与稳定性双提升！
在当今快速发展的技术领域中，SpringFramework作为Java生态系统中的核心框架之一，今天的内容是介绍v7.0.0-M1预发布版——一个旨在为开发者们带来前所未有的编程体验的里程碑版本。v7.0.0-M1预发布：spring-projects/spring-framework⭐新特性在ClassUtils.forName()中移除对二进制数组名称的处理。(#34291https://gi
【自学笔记】机器学习基础知识点总览-持续更新 Long_poem 笔记机器学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录机器学习重点知识点总览一、机器学习基础概念二、机器学习理论基础三、机器学习算法1.监督学习2.无监督学习3.强化学习四、机器学习处理流程五、机器学习常见问题与解决方法六、机器学习应用领域总结机器学习重点知识点总览一、机器学习基础概念定义：机器学习是一种人工智能技术，通过对数据的学习和分析，让计算机系统自动提高其性能。本质：找到
解锁机器学习核心算法 | 逻辑回归：不是回归的“回归” 紫雾凌寒 AI 炼金厂机器学习算法逻辑回归深度学习 python scikit-learn matplotlib
引言前面一篇文章我们介绍了机器学习算法中我们最先会接触到的算法——线性回归：机器学习的基石。今天我们继续学习机器学习中的另一个算法模型——逻辑回归（LogisticRegression）。一、逻辑回归：不是回归的“回归”在机器学习的庞大算法体系中，逻辑回归（LogisticRegression）虽然名字中带有“回归”，但却是一位不折不扣的“分类高手”，主要用于解决二分类问题，在众多领域发挥着关键作
C# 反射与动态编程萨达大 C#上位机开发 c#开发语言反射动态编程
文章目录1.反射（Reflection）1.1什么是反射？1.2反射的基本操作1.2.1获取类型信息1.2.2获取成员信息1.3调用成员1.4实例化对象1.5常见应用场景2.动态编程2.1什么是动态编程？2.2dynamic关键字2.3动态对象和ExpandoObject2.4动态编程的应用场景3.反射与动态编程的对比4.反射与动态编程的综合应用示例示例1：反射实现对象的深拷贝示例2：动态对象作为
python正则表达式快速入门_Python 正则表达式入门 weixin_39955938 python正则表达式快速入门
本文主要为没有使用正则表达式经验的新手入门所写。转载请写明出处引子首先说正则表达式是什么？正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语：RegularExpression，在代码中常简写为regex、regexp或RE)，计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那
JavaScript设计模式 -- 迭代器模式鎈卟誃筅甡 javascript 设计模式迭代器模式
在软件开发中，我们经常需要遍历集合、数组、链表、树等数据结构。传统上，这些数据结构往往需要暴露内部实现细节，或者写大量重复的遍历代码。**迭代器模式（IteratorPattern）**提供了一种统一的方式来访问集合内的元素，而不暴露集合的内部表示。通过定义统一的迭代器接口，可以使客户端代码与数据结构实现解耦，从而使系统更易扩展和维护。迭代器模式简介迭代器模式属于行为型设计模式，其主要思想是将遍历
python正则表达式必知必会的基础豆子前端 python基础 python 正则表达式
文章目录正则表达式re.match()和re.search()SRE_Matchobjectre.match()re.search()（重点）re.flags小结re.sub()re.split()re.findall()re.fullmatch()re.compile()小结方法分类注意细节正则表达式网站参考资料正则表达式本文主要讲的是正则表达式在python中的简单使用，只介绍关键的几个方法函
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

Python机器学习手册从数据预处理到深度学习（一）

你可能感兴趣的:(烟酒僧,Python,Python,机器学习,向量矩阵数组基本操作)