亚伯拉罕·黄肯

机器学习入门（二）--CASIA-HWDB（tensorflow）微调efficientNetB0实现手写字体的识别

对数据集做一个resize后会导致某些图片失真，可以采用不失真的resize方法，能提高准确率。

1.准备数据集

CASIA-HWDB2.x（offline）数据集下载地址：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
将官网下载的HWDB数据进行解压，文件夹名称作为label。代码如下：
注意分开test和train

import struct
import os
from PIL import Image
DATA_PATH="HWDB1.1tst_gnt" #gnt数据文件路径
IMG_PATH="test"#解析后的图片存放路径
files=os.listdir(DATA_PATH) #os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。
num=0
for file in files:
    tag = []
    img_bytes = []
    img_wid = []
    img_hei = []
    f=open(DATA_PATH+"/"+file,"rb")
    while f.read(4):
        tag_code=f.read(2)
        tag.append(tag_code)
        width=struct.unpack(', bytes(f.read(2)))
        height=struct.unpack(',bytes(f.read(2)))
        img_hei.append(height[0])
        img_wid.append(width[0])
        data=f.read(width[0]*height[0])
        img_bytes.append(data)
    f.close()
    for k in range(0, len(tag)):
        im = Image.frombytes('L', (img_wid[k], img_hei[k]), img_bytes[k])
        if os.path.exists(IMG_PATH + "/" + tag[k].decode('gbk')):
            im.save(IMG_PATH + "/" + tag[k].decode('gbk') + "/" + str(num) + ".jpg")
        else:
            os.mkdir(IMG_PATH + "/" + tag[k].decode('gbk'))
            im.save(IMG_PATH + "/" + tag[k].decode('gbk') + "/" + str(num) + ".jpg")
    num = num + 1
print(tag.__len__())

files=os.listdir(IMG_PATH)
n=0
f=open("label.txt","w") #创建用于训练的标签文件
for file in files:
    files_d=os.listdir(IMG_PATH+"/"+file)
    for file1 in files_d:
        f.write(file+"/"+file1+" "+str(n)+"\n")
    n=n+1

解压后可以得到

2.微调efficientNetB0网络

导入

from tensorflow.keras.applications import EfficientNetB0

进行微调

如果没有BN层就取消冻结权重参数可以有效解决训练后进行单张预测时BN层归一化的值无法接近训练时的归一化值，以此达到单张预测也可达到评估时的准确率。

	model = EfficientNetB0(include_top=False, weights='imagenet', input_tensor=x, input_shape=input_shape)
    '''
    include_top：是否在网络顶部包含完全连接的层
    weights：无（随机初始化）、“imagenet”（imagenet上的预训练）或要加载的权重文件路径之一
    input_tensor：可选Keras张量（即layers.Input（）的输出），用作模型的图像输入。即图像增广后作为输入
    input_shape：输出
    '''
    model.trainable = False #冻结
    #施加全局平均值池化 GAP
    x = layers.GlobalAveragePooling2D()(model.output)
    #批量化 BN
    x = layers.BatchNormalization()(x)
    #防止过拟合
    x = layers.Dropout(0.2)(x)
    #全连接层 激活函数softmax
    outputs = layers.Dense(num_classes, activation='softmax')(x)

    #封装自己的输入输出进去model
    model = tf.keras.Model(inputs, outputs)

    #对某些层进行修改（如果没有BN层就取消冻结权重参数）
    for layer in model.layers[-20:]:
        if not isinstance(layer, layers.BatchNormalization):
            layer.trainable = True
    model.compile(
        optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),
        loss='sparse_categorical_crossentropy',
        metrics=['sparse_categorical_accuracy']
    )
    return model

3.训练

对于输入的图片做一个图片增强（旋转，修改对比度等）

img_augmentation = Sequential([ #创建一个Sequential模型
        # 随机旋转每个图像 默认情况下，仅在训练期间应用随机旋转。
        preprocessing.RandomRotation(factor=0.15),
        # 在训练期间随机翻译每个图像。
        preprocessing.RandomTranslation(height_factor=0.1, width_factor=0.1),
        # 随机水平和垂直翻转每个图像。
        preprocessing.RandomFlip(),
        # 通过随机因子调整一个或多个图像的对比度
        preprocessing.RandomContrast(factor=0.1),
    ])

完整代码如下：

import json
import datetime
from pathlib import Path

import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential
from tensorflow.keras.applications import EfficientNetB0
from tensorflow.keras.layers.experimental import preprocessing
from tensorflow.keras.preprocessing import image_dataset_from_directory

# 数据集
img_size = 112 #输入尺寸
batch_size = 32 #批次
image_size = (112, 112) #图片大小
input_shape = image_size + (3,) #(112, 112, 3) 3通道

train_dir = 'train'  # 训练集目录
validation_dir = 'test'  # 验证集目录

train_dataset = image_dataset_from_directory(train_dir, batch_size=batch_size, image_size=image_size)#读取数据和标签
'''
tf.keras.preprocessing.image_dataset_from_directory:从目录中的图像文件生成一个 tf.data.Dataset
labels='inferred'(默认):标签从目录结构生成
'''
validation_dataset = image_dataset_from_directory(validation_dir, batch_size=batch_size, image_size=image_size)
AUTOTUNE = tf.data.experimental.AUTOTUNE
'''
多线程并行化
tf.data模块运行时，使用多线程进行数据通道处理，从而实现并行，这种操作几乎是透明的。
tf.data.experimental.AUTOTUNE，则根据可用的CPU动态设置并行调用的数量
'''
train_data = train_dataset.prefetch(AUTOTUNE)
validation_data = validation_dataset.prefetch(AUTOTUNE)#Dataset.prefetch() 开启预加载数据，使得在 GPU 训练的同时 CPU 可以准备数据


class_names = train_dataset.class_names  # 类别自动根据目录命名
json.dump(class_names, open('class_names.json', mode='w'))  # 保存分类信息
num_classes = len(class_names)
print('共{}类'.format(num_classes))#多少类


def build_model(num_classes):
    """创建并编译模型"""
    inputs = layers.Input(shape=input_shape) #构建网络的第一层——输入层 告诉尺寸多少
    img_augmentation = Sequential([ #创建一个Sequential模型
        # 随机旋转每个图像 默认情况下，仅在训练期间应用随机旋转。
        preprocessing.RandomRotation(factor=0.15),
        # 在训练期间随机翻译每个图像。
        preprocessing.RandomTranslation(height_factor=0.1, width_factor=0.1),
        # 随机水平和垂直翻转每个图像。
        preprocessing.RandomFlip(),
        # 通过随机因子调整一个或多个图像的对比度
        preprocessing.RandomContrast(factor=0.1),
    ])
    x = img_augmentation(inputs) #图像增广
    #实例化EfficientNetB0体系结构
    model = EfficientNetB0(include_top=False, weights='imagenet', input_tensor=x, input_shape=input_shape)
    '''
    include_top：是否在网络顶部包含完全连接的层
    weights：无（随机初始化）、“imagenet”（imagenet上的预训练）或要加载的权重文件路径之一
    input_tensor：可选Keras张量（即layers.Input（）的输出），用作模型的图像输入。即图像增广后作为输入
    input_shape：输出
    '''
    model.trainable = False #冻结
    #施加全局平均值池化 GAP
    x = layers.GlobalAveragePooling2D()(model.output)
    #批量化 BN
    x = layers.BatchNormalization()(x)
    #防止过拟合
    x = layers.Dropout(0.2)(x)
    #全连接层 激活函数softmax
    outputs = layers.Dense(num_classes, activation='softmax')(x)

    #封装自己的输入输出进去model
    model = tf.keras.Model(inputs, outputs)

    #对某些层进行修改
    for layer in model.layers[-20:]:
        if not isinstance(layer, layers.BatchNormalization):
            layer.trainable = True
    model.compile(
        optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),
        loss='sparse_categorical_crossentropy',
        metrics=['sparse_categorical_accuracy']
    )
    return model

# 回调函数
Path('models').mkdir(parents=True, exist_ok=True)
filepath = 'models/model-B0.h5'
callbacks = [
    tf.keras.callbacks.ModelCheckpoint(filepath=filepath, monitor='val_loss', verbose=1, save_best_only=True),  # 保存模型
    tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=3, verbose=1),  # 训练多次没有提升就降低学习率
    tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=25, verbose=1),  # 训练多次没有提升就停止
]
model = tf.keras.models.load_model('models/model-B0.h5')
#model = build_model(num_classes)
history = model.fit(train_data, epochs=100, validation_data=validation_data, callbacks=callbacks)
print(filepath)

# 绘制训练曲线
# plt.plot(history.history['sparse_categorical_accuracy'])
# plt.plot(history.history['val_sparse_categorical_accuracy'])
# plt.title('model accuracy')
# plt.ylabel('accuracy')
# plt.xlabel('epoch')
# plt.legend(['train', 'validation'], loc='upper left')
# plt.figure()
# plt.plot(history.history['loss'])
# plt.plot(history.history['val_loss'])
# plt.title('model loss')
# plt.ylabel('loss')
# plt.xlabel('epoch')
# plt.legend(['train', 'validation'], loc='upper left')
# plt.show()

训练后的模型保存在models下（需要手动创建文件夹）
我只训练了30批次左右，准确率达到百分之80多。

4.进行预测

1.在test文件夹中随机抽取图片进行预测并使用plt可视化（使用爬虫对识别的汉字进行翻译）

翻译功能如下：

# -*- coding:utf-8 -*-
import requests
def google_translate(content):
    data = {
    'doctype': 'json',
    'type': 'AUTO',
    'i':content
    }
    url = "http://fanyi.youdao.com/translate"
    r = requests.get(url,params=data)
    result = r.json()
    translate_result = result['translateResult'][0][0]["tgt"]
    return translate_result

预测代码：

import time
import json
import random
import pathlib
from translate import google_translate
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.python.keras.preprocessing import image

# 加载类名
class_names = json.load(open('class_names.json'))
print(class_names)

# 加载模型
model = tf.keras.models.load_model('model-B0.h5')

# 预测
image_size = 112  # 图像大小
paths = list(pathlib.Path('test').rglob('*'))  # 测试集所有文件
correct = 0
sum = 0
while True:
    path = random.choice(paths)
    x = image.load_img(path=path, target_size=(image_size, image_size))
    plt.imshow(x)
    plt.ion()
    x = image.img_to_array(x)
    plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置字体显示中文
    plt.rcParams['axes.unicode_minus'] = False  # 正常显示字符（x轴）
    x = np.expand_dims(x, axis=0)
    y = model.predict(x)  # 预测

    # 置信度
    for i in np.argsort(y[0])[::-1]:
        j= 0
        #print('{}: {:.2f}%'.format(class_names[i], y[0][i] * 100), end=' ')
        plt.title("{}:{} {}".format(path.parent.name, class_names[i],google_translate(class_names[i])))
        print("{}:{} {}".format(path.parent.name, class_names[i],google_translate(class_names[i])))

        plt.pause(2)
        j+=1
        plt.show()
        plt.close()
        if path.parent.name == class_names[i]:
            correct+=1
        if j == 1:
            sum +=1
            break
    print("预测个数：{}，正确个数：{}，准确率：{:.2f}%".format(sum,correct,(correct/sum)*100))
    # plt.title("{}:{}".format(path.parent.name,class_names[y[0][0]]))
    # plt.show()
    # q = input('回车继续，q退出')
    # if q == 'q':
    #     break

2.对画板的汉字进行预测（带翻译）

import json
import tensorflow as tf
from tensorflow.python.keras.preprocessing import image
from translate import google_translate
import matplotlib.pyplot as plt
import numpy as np
class_names = json.load(open('class_names.json'))
model = tf.keras.models.load_model('model-B0.h5')

image_size = 112  # 图像大小
path = '2.png'
x = image.load_img(path=path, target_size=(image_size, image_size))
plt.imshow(x)
x = image.img_to_array(x)
plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置字体显示中文
plt.rcParams['axes.unicode_minus'] = False  # 正常显示字符（x轴）
x = np.expand_dims(x, axis=0)
y = model.predict(x)
for i in np.argsort(y[0])[::-1]:
    j = 0
    plt.title("{} {}".format(class_names[i],google_translate(class_names[i])))
    print('{}: {}'.format(class_names[i],google_translate(class_names[i])), end=' ')
    #print(class_names[i],y[0][i] * 100)
    j += 1
    plt.show()
    if j == 1:
        break

3.对长文字进行分割（投影分割法）后逐个识别并全部可视化（带翻译）

将长文字图片使用投影分割成单个文字后存放于 saveImages = 'process/' 文件夹下后，对文件夹内所有图片进行预测

import cv2
import json
import tensorflow as tf
from tensorflow.python.keras.preprocessing import image
from handwrite_tensorflow.translate import google_translate
import matplotlib.pyplot as plt
import numpy as np
import os
import tkinter as tk
from tkinter import filedialog
import shutil
import sys   #导入sys模块
sys.path.append("..")
#显示图片
def cv_show(name, mat):
    cv2.imshow(name, mat)
    cv2.waitKey(0)

#获取图像的在垂直方向上的投影
def getH(img):
    hpro = np.zeros(img.shape, np.uint8)    #用于存放投影图像
    (h, w) = img.shape                      #获取整张图像的高和宽
    h_ = [0]*h                              #长度与图像高度一致的数组，存放每一行白色像素的总数

    #循环统计图像每一行白色像素的个数
    for y in range(h):
        for x in range(w):
            if img[y, x] == 255:
                h_[y] += 1
    #遍历垂直像素点绘制出垂直投影的图像
    for y in range(h):
        for x in range(h_[y]):
            hpro[y, x] = 255

    #cv_show('hpro', hpro)
    #cv2.imwrite('{}h.jpg'.format(saveImages), hpro)
    return h_

#获取图像的在水平方向上的投影
def getW(img):
    wpro = np.zeros(img.shape, np.uint8)    #用于存放投影图像
    (h, w) = img.shape                      #获取图像的高和宽
    w_ = [0]*w                              #长度与图像宽度一致的数组

    #循环统计图像每一列白色像素的个数
    for x in range(w):
        for y in range(h):
            if img[y, x] == 255:
                w_[x] += 1
    #遍历水平像素点绘制出水平投影的图像
    for x in range(w):
        for y in range(h-w_[x],h):      #w_[x]表示当前列的白色像素点总数
            wpro[y, x] = 255

    #cv_show('wpro', wpro)
    #cv2.imwrite('{}w.jpg'.format(saveImages), wpro)

    return w_

#切割
def cut(loadImages):
    #t_img  是读进来的原始图片
    #img    是进行膨胀和二值化后的图片
    k=0 #文件保存命名变量
    t_img = cv2.imread(loadImages)
    plt.imshow(t_img)
    #灰度化、二值化
    img = cv2.cvtColor(t_img, cv2.COLOR_BGR2GRAY)
    retval, img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
    #滤波
    img = cv2.blur(img, (3,3))
    #膨胀
    kernel = np.ones((3, 3), np.uint8)
    img = cv2.dilate(img, kernel, iterations=10)

    #获取图片高度和宽度
    (h, w) = img.shape

    #获取垂直投影的高度
    H = getH(img)

    hstart = 0
    H_Start = []                            #每个字在垂直方向上的起始像素点
    H_End = []                              #每个字在垂直方向上的结束像素点
    for i in range(len(H)):
        #字开始
        if H[i]>50 and hstart==0:
            hstart=1
            H_Start.append(i)
        #字结束
        if H[i]<=50 and hstart==1:
            hstart=0
            H_End.append(i)

    #遍历每一行
    for i in range(len(H_Start)):
        #截取出一行
        cropImg = img[H_Start[i]:H_End[i], 0:w]
        #获取这一行水平投影的宽度
        W = getW(cropImg)

        wstart = 0
        wend   = 0
        W_Start = 0                        #当前字在水平方向上的起始像素点
        W_End = 0                          #当前字在水平方向上的结束像素点

        for j in range(len(W)):
            # 字开始
            if W[j] > 10 and wstart == 0:
                wstart = 1
                W_Start =j
                wend = 0
            # 字结束
            if W[j] <= 10 and wstart == 1:
                wstart = 0
                W_End =j
                wend = 1
            if wend == 1:
                wstart = 0
                wend = 0
                k+=1
                h1 = H_Start[i]
                h2 = H_End[i]
                w1 = W_Start
                w2 = W_End
                #截取出当前字并保存
                temp = t_img[h1:h2, w1:w2]
                #cv_show('1', temp)
                cv2.imwrite('{}{}.jpg'.format(saveImages, k), temp)

#识别文字
def pre(path):
    image_size = 112  # 图像大小
    imagelist = os.listdir(path)
    imagelist.sort()
    #print(imagelist)
    str = ''
    #读取文件夹下所有图片
    for imgname in imagelist:
        if (imgname.endswith(".jpg")):
            x = image.load_img(path=(path+imgname), target_size=(image_size, image_size))
            x = image.img_to_array(x)
            plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置字体显示中文
            plt.rcParams['axes.unicode_minus'] = False  # 正常显示字符（x轴）
            x = np.expand_dims(x, axis=0)
            y = model.predict(x)
            for i in np.argsort(y[0])[::-1]:
                j = 0
                str+= class_names[i]
                #plt.title("{}".format(class_names[i]))
                #print('{}: {:.2f}%'.format(class_names[i], y[0][i] * 100), end=' ')
                # print(class_names[i],y[0][i] * 100)
                j += 1
                #plt.show()
                if j == 1:
                    break
    print('{} {}'.format(str,google_translate(str)))
    plt.title('{} {}'.format(str,google_translate(str)))
    plt.show()

if __name__ == "__main__":
    class_names = json.load(open('../class_names.json'))
    model = tf.keras.models.load_model('../model-B0.h5')
    saveImages = 'process/'
    #初始化文件夹
    shutil.rmtree(saveImages)
    os.mkdir(saveImages)
    while True:#死循环 点击取消退出
        '''打开选择文件夹对话框'''
        root = tk.Tk()
        root.withdraw()
        loadImages = filedialog.askopenfilename()  # 获得选择好的文件路径
        list(loadImages)  # 不加读取不了 会报错
        cut(loadImages)
        pre(saveImages)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s