阿大古古古古

用python识别一张数字图片

这是我看《深度学习入门——基于Python的理论和实现》的第N天，这本书，教你如何利用python，不用机器学习第三方库，自己去实现那些高大上的机器学习能实现的功能。
是的它会涉及到很多数学知识，尤其是矩阵的处理，还有微分等等，但是作者写的真的很细心，真厉害的人物。
在看这种类型书的时候，不知道你们会不会有这种情况，上一次看的内容很容易忘记（可能是我每次看隔的时间都太长了，没有一口气把它看完，但是这真的很难做到），特别是很多的函数在后面的实例调用的时候，可能我还能记得这个函数是干嘛用的，却很难想起来它是怎么实现的…所以，我们需要做总结，要多做总结，总结，结。
好了言归正传，你是否很好奇，程序是如何看懂一张图片上的手写数字到底是几呢？没有天才的头脑，我根本想不出可能用程序实现计算机视觉的方法，但是神奇的是，像识别数字这样的技术，技术上甚至可以达到99%的正确率。那么到底是如何实现的呢，看了前四章，我似乎明白了，哦！原来是这样，真**的牛逼！
让我们来看看自己如何编写一个能识别数字图片的Python程序（专业的部分真的没把握讲清楚，有兴趣的一定要去看看这本书）

1.

首先，我们知道计算机可以识别图片中的数字，是通过从大量的图片中找规律（似乎可以这么认为，其实是通过不断调节所谓的神经网络中的参数的方法），从而找到图片像素和标签之间的某种关系，以达到识别的目的。简单说就是这样：
给一个图片
机器随机初始化参数（其实若按照正态分布初始化将取得较好的结果）
机器：这是0
修改参数
机器调节下自己的神经网络参数：这是5
修改参数
机器再调节下自己的神经网络参数：这是3
修改参数
…（不停重复）

（不知道结果怎么知道如何修改参数呢？很简单，人工来标注好正确结果）

2.

所以，我们要实现这么几个步骤
（1）我要大量的数据来让我学习和测试结果。可以用MNIST（一个有60000数字图片且已经人工标注好的数据集）
（2）我要写一个函数用于判断这个图片是数字几
（3）我要写一个函数，用来告诉我我的结果和正确结果差多少（我们先管这个值叫loss），我通过调节参数应该让这个值不断降低
（4）我要写一个函数来调节神经网络的参数。这块还要注意，参数调节可不是随便调节的，我们要想方法让参数的调节使得loss减小，而且是减小的最快的那个方向（这块用一个叫做梯度法的方法，涉及微分，其实花点时间你可以搞明白的）
（5）最后就是循环，不停的修正我们的参数，到了后面，我们的识别正确率也就越来越高了
来看代码实现，第一部分是主要函数的实现，第二部分是识别的流程：

#功能
# coding: utf-8
import numpy as np
import matplotlib.pyplot as plt
import random


def sigmoid(x):
    return 1 / (1 + np.exp(-x))


def softmax(x):
    if x.ndim == 2:
        x = x.T
        x = x - np.max(x, axis=0)
        y = np.exp(x) / np.sum(np.exp(x), axis=0)
        return y.T

    x = x - np.max(x) # 溢出对策
    return np.exp(x) / np.sum(np.exp(x))


def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)

    # 监督数据是one-hot-vector的情况下，转换为正确解标签的索引
    if t.size == y.size:
        t = t.argmax(axis=1)

    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size


def numerical_gradient(f, x):
    h = 1e-4  # 0.0001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + h
        fxh1 = f(x)  # f(x+h)

        x[idx] = tmp_val - h
        fxh2 = f(x)  # f(x-h)
        grad[idx] = (fxh1 - fxh2) / (2 * h)

        x[idx] = tmp_val  # 还原值
        it.iternext()

    return grad

def sigmoid_grad(x):
    return (1.0 - sigmoid(x)) * sigmoid(x)

class TwoLayerNet:
    def __init__(self, input_size, hidden_size, output_size, weight_init_std=0.01):
        # 初始化权重
        self.params = {}
        self.params['W1'] = weight_init_std * np.random.randn(input_size, hidden_size)
        self.params['b1'] = np.zeros(hidden_size)
        self.params['W2'] = weight_init_std * np.random.randn(hidden_size, output_size)
        self.params['b2'] = np.zeros(output_size)

    def predict(self, x):
        W1, W2 = self.params['W1'], self.params['W2']
        b1, b2 = self.params['b1'], self.params['b2']

        a1 = np.dot(x, W1) + b1
        z1 = sigmoid(a1)
        a2 = np.dot(z1, W2) + b2
        y = softmax(a2)

        return y

    # x:输入数据, t:监督数据
    def loss(self, x, t):
        y = self.predict(x)

        return cross_entropy_error(y, t)

    def accuracy(self, x, t):
        y = self.predict(x)
        y = np.argmax(y, axis=1)
        t = np.argmax(t, axis=1)

        accuracy = np.sum(y == t) / float(x.shape[0])
        return accuracy

    # x:输入数据, t:监督数据
    def numerical_gradient(self, x, t):
        loss_W = lambda W: self.loss(x, t)

        grads = {}
        grads['W1'] = numerical_gradient(loss_W, self.params['W1'])
        grads['b1'] = numerical_gradient(loss_W, self.params['b1'])
        grads['W2'] = numerical_gradient(loss_W, self.params['W2'])
        grads['b2'] = numerical_gradient(loss_W, self.params['b2'])

        return grads

    def gradient(self, x, t):
        W1, W2 = self.params['W1'], self.params['W2']
        b1, b2 = self.params['b1'], self.params['b2']
        grads = {}

        batch_num = x.shape[0]

        # forward
        a1 = np.dot(x, W1) + b1
        z1 = sigmoid(a1)
        a2 = np.dot(z1, W2) + b2
        y = softmax(a2)

        # backward
        dy = (y - t) / batch_num
        grads['W2'] = np.dot(z1.T, dy)
        grads['b2'] = np.sum(dy, axis=0)

        da1 = np.dot(dy, W2.T)
        dz1 = sigmoid_grad(a1) * da1
        grads['W1'] = np.dot(x.T, dz1)
        grads['b1'] = np.sum(dz1, axis=0)

        return grads

# coding: utf-8
#测试
import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist
from chapter4.allfun import TwoLayerNet
import random

# 读入数据，分别表示 用于训练的数据  用于训练的数据对应的标签 用于测试的数据 用于测试的数据对应的标签
#暂时没必要知道它是怎么加载的，你知道知道他们表示什么就可以了
# #另外，图片数据是（28*28）像素的矩阵，修改load_mnist的参数也可以把（28*28）转换成（784,）这样的形状
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)

#这个network 就是我们的神经网络
network = TwoLayerNet(input_size=784, hidden_size=50, output_size=10)


iters_num = 5000  # 适当设定循环的次数

#每次从所有训练数据中抽出100个来学习  这个叫做mini-batch学习
batch_size = 100

#一共多少个训练数据 60000个
train_size = x_train.shape[0]


#学习率，这个影响每次修正神经网络中参数时的力度
learning_rate = 0.1

#训练开始
for i in range(iters_num):
    #mini - batch学习，随机抽取 batch_size 个数据
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = x_train[batch_mask]
    t_batch = t_train[batch_mask]

    # 计算梯度 下面是两种方法，还记得梯度是干嘛的吗，它告诉我如何能让我的loss减小的最快
    # 第一种方法较慢，叫做数值微分，就是用python计算微分结果
    # 第二种方法快 叫做误差反向传播，我觉得自己无法解释清楚，它是一种利用"计算图"来快速求微分的方法
    # 返回的这个值，用于更新神经网络的参数

    # grad = network.numerical_gradient(x_batch, t_batch)
    grad = network.gradient(x_batch, t_batch)

    # 更新参数，一共4个参数，每层神经网络2个，一个2个神经网络层
    for key in ('W1', 'b1', 'W2', 'b2'):
        network.params[key] -= learning_rate * grad[key]


print('模型训练完成')

# 修改这个值，测试不同图片
whtch = 101
y = network.predict(x_test[whtch])
y = np.argmax(y)

print('y', y)

mytestone = np.array(x_test[whtch])
mytestone = mytestone.reshape(28, 28)

plt.imshow(mytestone)
plt.title(str(y))
plt.show()

#MNIST数据集加载部分
# coding: utf-8
try:
    import urllib.request
except ImportError:
    raise ImportError('You should use Python 3.x')
import os.path
import gzip
import pickle
import os
import numpy as np


url_base = 'http://yann.lecun.com/exdb/mnist/'
key_file = {
    'train_img':'train-images-idx3-ubyte.gz',
    'train_label':'train-labels-idx1-ubyte.gz',
    'test_img':'t10k-images-idx3-ubyte.gz',
    'test_label':'t10k-labels-idx1-ubyte.gz'
}

dataset_dir = os.path.dirname(os.path.abspath(__file__))
save_file = dataset_dir + "/mnist.pkl"

train_num = 60000
test_num = 10000
img_dim = (1, 28, 28)
img_size = 784


def _download(file_name):
    file_path = dataset_dir + "/" + file_name
    
    if os.path.exists(file_path):
        return

    print("Downloading " + file_name + " ... ")
    urllib.request.urlretrieve(url_base + file_name, file_path)
    print("Done")
    
def download_mnist():
    for v in key_file.values():
       _download(v)
        
def _load_label(file_name):
    file_path = dataset_dir + "/" + file_name
    
    print("Converting " + file_name + " to NumPy Array ...")
    with gzip.open(file_path, 'rb') as f:
            labels = np.frombuffer(f.read(), np.uint8, offset=8)
    print("Done")
    
    return labels

def _load_img(file_name):
    file_path = dataset_dir + "/" + file_name
    
    print("Converting " + file_name + " to NumPy Array ...")    
    with gzip.open(file_path, 'rb') as f:
            data = np.frombuffer(f.read(), np.uint8, offset=16)
    data = data.reshape(-1, img_size)
    print("Done")
    
    return data
    
def _convert_numpy():
    dataset = {}
    dataset['train_img'] =  _load_img(key_file['train_img'])
    dataset['train_label'] = _load_label(key_file['train_label'])    
    dataset['test_img'] = _load_img(key_file['test_img'])
    dataset['test_label'] = _load_label(key_file['test_label'])
    
    return dataset

def init_mnist():
    download_mnist()
    dataset = _convert_numpy()
    print("Creating pickle file ...")
    with open(save_file, 'wb') as f:
        pickle.dump(dataset, f, -1)
    print("Done!")

def _change_one_hot_label(X):
    T = np.zeros((X.size, 10))
    for idx, row in enumerate(T):
        row[X[idx]] = 1
        
    return T
    

def load_mnist(normalize=True, flatten=True, one_hot_label=False):
    """读入MNIST数据集
    
    Parameters
    ----------
    normalize : 将图像的像素值正规化为0.0~1.0
    one_hot_label : 
        one_hot_label为True的情况下，标签作为one-hot数组返回
        one-hot数组是指[0,0,1,0,0,0,0,0,0,0]这样的数组
    flatten : 是否将图像展开为一维数组
    
    Returns
    -------
    (训练图像, 训练标签), (测试图像, 测试标签)
    """
    if not os.path.exists(save_file):
        init_mnist()
        
    with open(save_file, 'rb') as f:
        dataset = pickle.load(f)
    
    if normalize:
        for key in ('train_img', 'test_img'):
            dataset[key] = dataset[key].astype(np.float32)
            dataset[key] /= 255.0
            
    if one_hot_label:
        dataset['train_label'] = _change_one_hot_label(dataset['train_label'])
        dataset['test_label'] = _change_one_hot_label(dataset['test_label'])
    
    if not flatten:
         for key in ('train_img', 'test_img'):
            dataset[key] = dataset[key].reshape(-1, 1, 28, 28)

    return (dataset['train_img'], dataset['train_label']), (dataset['test_img'], dataset['test_label']) 


if __name__ == '__main__':
    init_mnist()

我们把测试图片和识别结果打印出来看看，我们可以得到这样的结果：

世界上就是有那些牛逼的人，能想出方法。太厉害了
代码部分参考了书中的源码，我将用到的部分单独拿了出来，打包下载链接在下

打包整理资源下载

python怎么处理表格的去重 Rhys.. python pandas 开发语言
在Python处理表格时，可以使用pandas库中的drop_duplicates方法对一个表格进行去重。这个方法能够根据某些列或者所有列的重复值来删除重复的行，并保留第一次出现的行或指定保留的情况。让我们来看一下如何对一个Excel表格去重的示例。假设你有一个Excel文件data.xlsx，我们要对其中的数据进行去重。首先，请确保你已经安装了pandas库。如果尚未安装，请使用以下命令进行安装
『OpenCV-Python』色彩空间及色彩转换 opencv
点赞+关注+收藏=学会了在计算机图像处理中，色彩空间是理解和操作图像色彩的重要基础。每一种色彩空间都有自己的适用范围。RGB是比较常见的色彩空间，除此之外比较常见的色彩空间还有GRAY、HSV、Lab、YUV等。为什么会有这么多色彩空间呢？有兼容性的原因，也有为了方便计算的原因。比如YUV这个是电视信号系统采用的，以前的老电视是黑白电视，只需要一个颜色通道，后来出现了彩色电视，为了使视频信号能够兼
Python如何写日志文件测试小白2951 python 开发语言
改目录加testcase加common，存放log6/写日志log.pyimportloggingimportosimporttimeclassLoggingUtil():def__init__(self,logger=None):#创建一个loggerself.logger=logging.getLogger(logger)level='INFO'iflevel=='DEBUG'orlevel=
PYTHON UI自动化，selenium第一节，登录测试小白2951 python 开发语言
'''1/安装Selenium库：使用pip工具来安装Selenium库。在命令行中输入以下命令：pipinstallselenium/requestspip常用基础命令查看已经安装的第三方库:piplist直接安装库：pipinstall库名指定版本安装：pipinstallrobotframework==2.8.7卸载已安装的库：pipuninstallrequests更新某个库：pipins
python怎样读取数据类型_python相关的几种数据类型的存储读取方式瘦下来 python怎样读取数据类型
归纳一下python中不同数据保存格式的存储和读取，旨在方法整理和速度比较。从数据角度分两种，一是ndarray格式的纯数值数据的读写，二是对象(数据结构)如dict的文件存取。数值数据的读写.bin格式，np.tofile()和np.fromfile()importnumpyasnpa=np.random.randint(0,100,size=(10000,5000))print(a.dtype
Spark性能调优大数据侠客 spark相关问题汇总及解决 spark 性能调优
1、前言在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作，应用范围与前景非常广泛。在美团•大众点评，已经有很多同学在各种项目中尝试使用Spark。大多数同学（包括笔者在内），最初开始尝试使用Spark的原因很简单，主要就是为了让大数据计算作业的执行速度更
Python 3 基本数据类型详解 ivwdcwso 开发 python windows 开发语言
Python是一种简单而强大的编程语言，具有丰富的数据类型来处理不同类型的数据。在本文中，我们将介绍Python3中的基本数据类型，包括整数、浮点数、字符串、列表、元组、集合和字典，并举例说明它们的使用方法和应用场景。1.整数（int）整数是Python中最基本的数据类型之一，用于表示没有小数部分的数字。整数可以是正数、负数或零。x=10y=-5z=0应用场景：计数器和计数器变量。代表物品的数量或
Python的旅游网站数据爬虫分析与可视化大屏展示论文 IT实战课堂—x小凡同学 Python毕业设计项目 python 旅游爬虫
摘要随着互联网技术的迅猛发展，旅游行业也逐渐实现了数字化转型。旅游网站作为游客获取旅游信息的主要渠道，蕴含着丰富的旅游数据资源。本文旨在通过Python技术，实现旅游网站数据的爬虫分析，并利用可视化大屏展示分析结果，为旅游行业的数据驱动决策提供支持。关键词：Python；旅游网站；数据爬虫；可视化大屏一、引言旅游行业作为服务业的重要组成部分，其发展水平直接关系到国家经济的繁荣和人民生活的质量。随着
Python学习-九大数据类型整合，详细讲解小伙儿. Python python 开发语言学习
目录1.int(整型)2.float(浮点型)3.Bool(布尔类型)4.Str(字符串类型)5.None(空值)6.List(列表)7.Tuple(元组)8.Dict(字典)9.Set(集合)（字典，列表，元组，字符串知识点可能不全，可以参考本人之前发的博客进行学习，加油。）1.int(整型)特点和用途：1.可以表示正整数、负整数和零，没有小数部分。2.取值范围取决于您所使用的Python版本和
Python GIL（全局解释器锁）机制对多线程性能影响的深度分析人工智能机器学习python
在Python开发领域，GIL（GlobalInterpreterLock）一直是一个广受关注的技术话题。在3.13已经默认将GIL去除，在详细介绍3.13的更亲前，我们先要留了解GIL的技术本质、其对Python程序性能的影响。本文将主要基于CPython（用C语言实现的Python解释器，也是目前应用最广泛的Python解释器）展开讨论。GIL的技术定义GIL（GlobalInterprete
Python学习笔记 - 探索5种数据类型 Mr数据杨 Python 编程基础 python 数据类型
在当今的数字时代，编程已经成为一种基本技能，不仅适用于软件开发人员，更广泛地应用于数据分析、人工智能、自动化和科学研究等领域。Python作为一种强大且易于学习的编程语言，因其简洁的语法和广泛的应用场景，成为了初学者学习编程的首选语言。在学习Python编程的过程中，理解和掌握数据类型是至关重要的。数据类型决定了程序中可以进行的操作类型，以及如何存储和处理信息。理解不同数据类型的特性和使用场景，不
ubuntu 安装python Y.zh
在官网找到自己需要的python版本，我选择的是Gzippedsourcetarball下载压缩包#e.g.wgethttps://www.python.org/ftp/python/3.9.0/Python-3.9.0.tgz解压tar-xzvfPython-3.9.0.tgz安装#安装依赖sudoapt-getinstall-yzlibczlib1gzlib1g-devlibffi-devli
python中的九种数据类型的简单介绍 yaohappy10801 python 开发语言
目录一、基本数据类型：1.Int2.Float3.Bool二、复合型数据类型：2.1.Str2.2.List2.3.Tuple2.4.Dict2.5.Set三、None今天我来讲解一下python中的九种数据类型：在python中可以分为两类：基本数据类型和复合数据类型。在基本数据类型中包括：数字（int，float，bool）和字符串两种在复合数据类型种包括：字典（dict），元组（tuple）
python爬虫项目（八十二）：爬取旅游攻略网站的用户评论，构建旅游景点推荐系统人工智能_SYBH 爬虫试读 2025年爬虫百篇实战宝典:从入门到精通 python 爬虫旅游开发语言金融信息可视化
构建一个旅游景点推荐系统，可以帮助用户根据他们的偏好和其他用户的评论来选择旅行目的地。在这个项目中，我们将通过爬取旅游攻略网站的用户评论数据，分析这些数据，并使用协同过滤等推荐算法来构建一个基本的推荐系统。本文将详细描述整个过程，包括爬虫部分和推荐系统的构建。目录文章大纲一、项目背景与目标项目的目标：二、目标网站分析与数据需求数据需求：目标网站：三、爬虫技术选型安装所需库四、使用Scrapy爬取用
用一个例子详细说明python单例模式 hunter206206 python python
单例模式是一种设计模式，它确保一个类只有一个实例，并提供一个全局访问点来访问该实例。这在需要控制资源（如数据库连接、文件系统等）的访问时非常有用。下面是一个使用Python实现单例模式的例子：classSingleton:_instance=Nonedef__new__(cls,*args,**kwargs):ifnotcls._instance:cls._instance=super(Singl
如何把一个python文件打包成一步一步安装的可执行程序 hunter206206 python python
将一个Python文件打包成可执行程序（如.exe文件），并实现一步一步的安装过程，通常需要以下步骤：1.将Python文件打包成可执行文件使用工具将Python脚本打包成可执行文件（如.exe）。常用的工具有PyInstaller和cx_Freeze。使用PyInstaller安装PyInstaller：pipinstallpyinstaller打包Python文件：pyinstaller--o
【设计模式】深入理解Python中的组合模式（Composite Pattern）写bug如流水 Python 架构设计设计模式 python 组合模式
深入理解Python中的组合模式（CompositePattern）在软件开发中，如何处理树形结构的数据和对象常常是一个挑战。**组合模式（CompositePattern）**为我们提供了一种灵活的方法来解决这一问题。它允许我们将对象组合成树形结构以表示“部分-整体”的层次关系，使得客户端可以以一致的方式对待单个对象和组合对象。在本文中，我们将详细探讨组合模式的定义、应用场景、实现方式，并通过示
P叔带你学Python-1.6-测试Python环境 Python_P叔 P叔带你学Python python 开发语言
在编程中，测试是一项重要的工作，可以帮助我们验证代码的正确性和稳定性。在Python编程环境中，同样需要进行测试来确保Python的安装和配置是正确的。在本篇文章中，我们将介绍如何测试Python环境，以确保我们的Python开发环境正常工作。一、检查Python版本在测试Python环境之前，首先需要检查Python的版本。Python有多个版本，例如Python2.x和Python3.x，这两
检查Python环境是否正确并确保PyCharm环境配置正确测试小白2951 python
要检查Python环境是否正确并确保PyCharm环境配置正确，可以按照以下步骤进行：检查Python安装：打开命令行或终端，输入python--version或python3--version，然后按回车键。如果看到Python的版本号，说明Python已正确安装。检查pip安装：在命令行中输入pip--version或pip3--version，然后按回车键。如果看到pip的版本号，说明pip
基于Python的携程旅游景点数据分析与可视化 ChengKe---Dawn 爬虫后端开发 python 数据分析开发语言
基于Python的携程旅游景点数据分析与可视化爬取景点、价格、开放状态、评论、热度、优惠政策等信息。功能列表指定城市爬取支持登录支持筛选支持评论爬取支持数据存在数据库支持生成Excel支持可视化部分效果演示爬取的旅游景点信息生成Excel指定城市爬取可视化部门图颜色都是随机,图形是动态图，例如水位图、环图等都是动态图启动文档导入数据库，启动Python脚本质量拉满，涵盖高质量开源项目，欢迎来访，博
Python学习——面向对象之ORM luke-skyworker Python
文章目录前述表格设计用户表结构电影表结构公告表结构表格对应的类设计字段类字符串类字段数值字段类用户表类电影表类公告类元类设计Models基类Models的元类ModelMetaclass以用户User类为例，查看元类改造前后类的名称空间的变化继续完成Models基类，增加数据库操作前述本篇文章就是要实现一个简单版本的ORM框架，前面的面向对象写了好几篇，光说不练是不行的，因此用ORM实现，好好巩固
多元随机分布的协方差矩阵的计算（python示例）读思辨 Python 数学矩阵 python 线性代数
协方差矩阵是统计学中描述两个或多个随机变量之间线性相关程度的一个重要工具。对于一个kkk维随机向量X=(X1,X2,...,Xk)X=(X_1,X_2,...,X_k)X=(X1,X2,...,Xk)，其协方差矩阵是一个k×kk\timeskk×k的矩阵，其中每个元素σij\sigma_{ij}σij是随机变量XiX_iXi和XjX_jXj的协方差。协方差的计算公式为：σij=Cov(Xi,Xj)
Anaconda中安装gdal 夏日麋鹿～ Python python 开发语言
anaconda中安装gdal包直接使用condainstallgdal或pipinstallgdal是难以安装上的，需要手动安装。在手动安装前，建议新建一个虚拟环境，专门用于安装类似于gdal等用于处理地理数据的包。因为这些包容易与其它包发生版本不兼容问题，导致整个环境崩溃。同时，新建的环境的python最好使用3.7版本的，经本人试验这个版本容错率比3.9高。1、创建新的虚拟环境。具体见我的另
Python使用 pandas 处理 .xlsx 数据非常全面数据库内核 python 基础 python
具体细节见：Python利用pandas处理Excel数据的应用-华妹陀-博客园根据表格中某一值获取其对应行数据：Pandas中根据列值，选取DataFrame数据，并获取行索引号列表_悟空丶kong的博客-CSDN博客_df=pd.dataframe#1：读取指定行df=pd.read_excel('lemon.xlsx')#这个会直接默认读取到这个Excel的第一个表单data=df.ix[0
通过调整尺寸压缩 PNG 图片并转换为 PDF (Python) Persus python pdf png 图像处理图片压缩
通过调整尺寸压缩PNG图片并转换为PDF1.环境准备确保已经安装了Python和所需的库。如果尚未安装，可以使用以下命令：pipinstallPillowreportlab2.代码实现以下是完整的Python程序，用于通过缩小图片尺寸来压缩PNG图片并将其保存为PDF格式：fromPILimportImagefromreportlab.pdfgenimportcanvasdefcompress_a
python使用pandas操作xlsx 豆芽脚脚 python pandas 开发语言
python操作xlsx有很多种方法，以前使用其他控件操作，使用这个pandas之后发现更好用。场景，我需要读取xlsx模板，然后根据模板去获取数据，根据用户要求导出指定的xlsx文件。读取文件data=pd.read_excel('sleepStageAhi.xlsx')head=data.columns.tolist()#表格头cloum=data.values.tolist()[0]#模板字
SQLAlchemy：Python SQL工具包和对象关系映射器零度° python python
SQLAlchemy是一个PythonSQL工具包和对象关系映射器（ORM），它提供了一个高层的ORM以及底层的SQL表达式语言。SQLAlchemy是数据驱动的应用程序的常用工具，它能够与多种数据库后端进行交互，包括但不限于SQLite、MySQL、PostgreSQL和MicrosoftSQLServer。SQLAlchemy的主要特点ORM:将Python类映射到数据库表。SQL表达式语言:
Python中Sqlite的使用&ORM的使用&如何通过code初始化DB lianxiang_biancheng Python sqlite python sql user insert import
1.python中如何sqlite下面的示例是通过拼接sql语句，来使用sqlite数据的。importsqlite3;delmain():dbpath="db\\test.db";try:conn=sqlite3.connect(self.dbpath);except:pass;#readsqlite3cur=self.conn.cursor();sql='Selectuser,pwd,sex,
python 使用Whisper模型进行语音翻译哦里哦里哦里给 AI 大语言模型实战 python whisper
目录一、Whisper是什么？二、Whisper的基本命令行用法三、代码实践四、是否保留Token标记五、翻译长度问题六、性能分析一、Whisper是什么？Whisper是由OpenAI开源的一个自动语音识别（AutomaticSpeechRecognition,ASR）系统。它的主要特点是：多语言支持：它本身就能识别几十种语言，包括中文。多尺寸预训练模型：官方提供了5个不同大小的模型（tiny,
40_Python-对象关系映射SQLALchemy SeanYBLL Python
SQLALchemy一、ORM二、SQLAlchemy简介三、基本操作四、总结【2】优缺点一、ORMORM，即Object-RelationalMapping（对象关系映射），它的作用是在关系型数据库和业务实体对象之间作一个映射，这样，我们在具体的操作业务对象的时候，就不需要再去和复杂的SQL语句打交道，只需简单的操作对象的属性和方法。本质上就是将数据从一种形式转换到另外一种形式。这也同时暗示着额
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

用python识别一张数字图片

1.

2.

你可能感兴趣的:(机器学习,机器学习,深度学习,python)