北雷村炼丹人

show-attend-and-tell-tensorflow源码解读：preprocess.py

show,attend, and tell是image caption领域的经典论文，image caption即“看图说话”，它连接了计算机视觉和自然语言处理。本篇博客主要解读show,attend, and tell的预处理代码，计算机视觉需要预处理流程，自然语言处理也需要把自然语言进行词编码与词嵌入。总体而言，该任务的预处理流程是比较复杂的。

在gitub上搜索show-attend-and-tell-tensorflow，排名第一的仓库就是笔者该系列解读的代码。在深入研究解读代码之前，有必要做一点理论介绍和阐述一些模型细节。

采用的是encoder-decoder架构；encoder是CNN，decoder是RNN，二者不能同时训练，否则the noise in the initial gradients coming from the LSTM into the image model corrupted the CNN and would never recover(show and tell: lessons learned from the 2015 MSCOCO image captioning challenge)。所以遇到的代码中，普遍方法是先使用经过预训练的CNN模型提取feature map/vector（特征图/特征向量，不同模型会有些微差异），再将feature map/vector作为decoder的输入，参与模型的计算。
对于decoder而言，它负责将feature map/vector 解码为人能看得懂的自然语言。但计算机无法直接处理自然语言，所以我们需要对数据集中涉及的单词进行one-hot编码及word embedding(词嵌入)

对涉及到的预处理做的简单介绍到此结束，现在我们正式开始解读预处理代码。预处理代码绝不止preprocess.py一个文件，但它作为预处理程序的汇总，我们有必要通过它来更全面深入地掌握预处理流程的全貌。

preprocess.py的导入信息如下：

from scipy import ndimage
"""
scipy.ndimage: Multi-dimentional image processing(多维图像处理包）
用于多为图像处理的各种功能，包含：
1.Filters: 过滤器
2.Fourier filters: 傅里叶过滤器
3.Interpolation: 图像的插值、旋转及仿射变换
4.Measurements: 图像相关信息的测量
5.Morphology: 形态学图像处理
更强大的图像处理库包括：opencv, scikit-image等
"""

from collections import Counter
"""
collections模块包含多种集合类
1.namedtuple: 可以对tuple的某个维度命名，并且还可以根据命名获得该维度的值
2.deque: 适用于队列和栈，可以实现高效的插入和删除。
3.defaultdict: 使用dict时，如果引用的key值不存在，就会抛出keyerror;如果key不存在时，希望能返回一个默认值而非抛出错误，就可以用defaultdict。
4.OrderDict: 使用dict时，key是无序的，在对dict做迭代时，我们无法确定key的顺序；要保持key的顺序，可以用OrderDict
5.Counter: 是一个简单的计数器，统计字符出现的个数，它是dict的一个子类
"""
from core.vggnet import Vgg19
"""
从imagenet-vgg-verydeep-19.mat中获取了预训练参数，并用其构造了vgg19模型的计算流程（模型/类）
"""
from core.utils import *
import tensorflow as tf
import numpy as np
import pandas as pd
import hickle
import os
import json
"""
深度学习会处理大量输入数据，也会输出大量数据，这些数据全放在CPU/GPU显然是不现实的。
通常的做法是先保存到硬盘文件中，待到需要的时候再加载拿来用。
这中间涉及到文件路径的增删改查（与操作系统进行交互），因此需要os模块。
CPU/GPU中数据的保存、硬盘文件的读取，可以通过json, pickle, hickle等模块/库来实现，处理的文件格式分别是json, pkl, hkl。
"""

我们刚刚提到preprocess.py是预处理程序的汇总，所有涉及预处理的组件都在这里应用。因为main()函数就是preprocess.py文件的入口，所以我们先从main()函数开始。

深度学习通常成批处理输入，这里的CNN从图像中提取feature map/vector也不例外，batch_size（100）表示一批图像的数目。vgg_model_path=’./data/imagenet-vgg-verydeep-19.mat’该路径下的文件

深度学习通常成批处理输入，这里CNN从图像中提取feature map/vector也不例外，batch_size（100）表示一批图像的数目。
vgg_model_path该路径下的文件保存着预训练的vgg模型的参数。core/vggnet.py中的Vgg19类，也就是core.vggnet模块里的Vgg19类，就需要使用这些参数信息来构建vgg19网络。具体如何构建看后续博客解读分析。
max_length（15）与标签语句有关，它规定了一个标签语句最多包含多少单词，超过15就把对应句子删掉。
在前面我们提到了"需要对数据集中涉及的单词进行one-hot编码及word embedding(词嵌入)"。one-hot编码：把训练集中的单词编成一个词汇表，词汇表中的每个单词都是独一无二的，在词汇表的位置也是独一无二的，假设某个单词在词汇表的位置为i，那么它可以用一个固定长度的向量表示，向量的第i维为1，其它维都为0。但在实际操作中，训练集中的有的单词出现频次过低，那么我们可以将其舍去，不列入词汇表中。当出现频次< word_count_threshold就舍去，这里word_count_threshold=1，即出现的单词全都列入词汇表中。
coco2014数据集中的图片有自己的文件名，同时也有自己唯一的图片id信息，后者在annotation文件中有记录。

def main():
    # batch size for extracting feature vectors from vggnet
    batch_size = 100    # 一次提取100幅图像的feature vectors
    # maximum length of caption (number of word). if caption is longer than max_length, deleted.
    max_length = 15    # 标签语句最长15个单词，超过15个单词的语句删掉
    # if word occurs less than word_count_threshold in training dataset, the word index is special unknown token.
    word_count_threshold = 1 # 如果训练集中某个单词出现次数小于1，那就设为null（一个特殊的token）
    # vgg model path
    vgg_model_path = './data/imagenet-vgg-verydeep-19.mat'
    
    # about 80000 images and 400000 captions for train dataset
    train_dataset = _process_caption_data(caption_file='data/annotations/captions_train2014.json, image_dir='image/train2014_resized', max_length=max_length)
    # 有图像文件夹image_dir，有包含标签语句和图像与标签的连接信息的caption_file，这个函数（后面详细介绍）事实上构建了训练集变量，另外一点：./data/ == data/

    # about 40000 images and 200000 captions
    val_dataset = _process_caption_data(caption_file='data/annotations/captions_val2014.json', image_dir='image/val_resized', max_length=max_length)
    # 这里构建了验证集变量

    # about 4000 images and 20000 captions for val / test dataset
    val_cutoff = int(0.1 * len(val_dataset))
    test_cutoff = int(0.2 * len(val_dataset))
    print('Finished processing caption data')

    save_pickle(train_dataset, 'data/train/train.annotations.pkl')
    save_pickle(val_dataset[:val_cutoff], 'data/val/val.annotations.pkl')
    save_pickle(val_dataset[val_cutoff:test_cutoff].reset_index(drop=True), 'data/test/test.annotations.pkl')
    """
        这里save_pickle()函数与pickle模块有关，pickle模块保存的文件后缀名都是pkl，save_pickle()是对pickle.dump()函数的扩展，它的定义在core.utils模块中(前面导入模块中已经写了)。
        reset_index()方法的全称是pandas.DataFrame.reset_index()，用来防止原索引变成数据列。可见_process_caption_data返回的结果是pd.DataFrame类的实例，但疑点是为什么前两个没用该方法？
        从这儿开始，对上面得到的train, val, test三个文件，逐个执行相关操作。
    """
    
    for split in ['train', 'val', 'test']:
        annotations = load_pickle('./data/%s/%s.annotations.pkl' % (split, split))
        # load_pickle()与save_pickle()情形相似，都位于core.utils模块中(core/utils.py文件中)，都是对pickle模块中的函数进行扩展，不同之处在于load_pickle()扩展的是pickle.load()
        
        if split == 'train':
            word_to_idx = _build_vocab(annotations=annotations, threshold=word_count_threshold)
            # 在training阶段，制作词汇表，方便后续的one-hot词编码和词嵌入。
            save_pickle(word_to_idx, '.data/%s/word_to_idx.pkl' % split)    # 把词汇表保存起来
        captions = _build_caption_vector(annotations=annotations, word_to_idx=word_to_idx, max_length=max_length)
        # 制作好词汇表后，对整个句子进行编码
        save_pickle(captions, './data/%s/%s.captions.pkl' % (split, split))    # 对句子编码向量保存起来。
        
        file_names, id_to_idx = _build_file_names(annotations)
        save_pickle(file_names, './data/%s/%s.file.names.pkl' % (split, split))
        image_idxs = _build_image_idxs(annotations, id_to_idx)
        save_pickle(image_idxs, './data/%s/%s.image.idxs.pkl' % (split, split))
        """这四句暂时不清楚具体干了啥，但应该是提取了图片文件名，图片id，标签语句，标签编码之间的关系"""
        # prepare reference captions to compute bleu scores later
        """
        	这部分代码用了前面生成的文件中的参数信息，我们暂时不清楚这些文件的生成细节，所以留在后面详细研究
        """
        image_ids = {}
        feature_to_captions = {}
        i = -1
        for caption, image_id in zip(annotations['caption'], annotations['image_id']):
            if not image_id in image_ids:
                image_ids[image_id] = 0
                i += 1
                feature_to_captions[i] = []
            feature_to_captions[i].append(caption.lower() + ' .')
        save_pickle(feature_to_captions, './data/%s/%s.references.pkl' % (split, split))
        print("finished building %s caption dataset" % split)
	# extract conv5_3 feature vectors
    vggnet = Vgg19(vgg_model_path)
    # 加载预训练的模型参数
    vggnet.build()
    # 加载后构建vgg19模型，得到完整的计算流程
    with tf.Session() as sess:
        tf.initialize_all_variables().run()
        for split in ['train', 'val', 'test']:
            anno_path = './data/%s/%s.annotations.pkl' % (split, split)
            save_path = './data/%s/%s.features.hkl' % (split, split)
            annotations = load_pickle(anno_path)
            image_path = list(annotations['file_name'].unique())
            n_example = len(image_path)
            
            all_feats = np.ndarray([n_example, 196, 512], dtype=np.float32)
            
            for start, end in zip(range(0, n_example, batch_size), range(batch_size, n_example+batch_size, batch_size)):
                image_batch_file = image_path[staart:end]
                image_batch = np.array(map(lambda x: ndimage.imread(x, mode='RGB'), image_batch_file)).astype(np.float32)
                feats = sess.run(vggnet.features, feed_dict={vggnet.images:image_batch})
                all_feats[start:end, :] = feats
                print("Processed %d %s features.." % (end, split))
            
            # use hickle to save huge feature vectors
            hickle.dump(all_feats, save_path)
            print("Saved %s.." % (save_path))

接下来是main()函数中第一个调用的函数__process_caption_data()，函数名前面包括下划线通常是指这个函数不希望被本模块以外的函数调用。

def _process_caption_data(caption_file, image_dir, max_length):
	with open(caption_file) as f:
		caption_data = json.load(f)
	# id_to_filename is a dictionary such as {image_id: filename}
	id_to_filename = {image['id']:image['file_name'] for image in caption_data['images']}
	"""
		搜索"coco data format"就能找到官方文档，caption_data由键-值对构成，
		'images'键对应的值是由image结构体组成的列表/数组（总之可以迭代），这里程序把列表/数组中每个元素也命名为image了。
		image结构体也是由键-值对构成，键包括:
		"id", "width", "height", "file_name", "license", "flickr_url", "coco_url", "data_captured"
		这里使用了"id", "filename"两个键。
	"""
	# data is a list of dictionary which contains 'captions', 'filename' and 'image_id' as key.
	"""
		上面这个注释写错了，是'caption'不是'captions',虽只有一字之差，但'captions'是读取了captions_train(val)2014.json后能直接访问的键，要想访问'caption'键，需要先读取captions_train(val)2014.json文件后访问'annotations'键，然后对'annotations'键的值进行遍历(值是一个列表)，列表中的元素才能访问'caption'键
	"""
	data = []
	for annotation in caption_data['annotations']:
		image_id = annotation['image_id']
		annotation['file_name'] = os.path.join(image_dir, id_to_filename[image_id])
		data += [annotation]
	"""
		与上面的'images'键一样，'annotations'也是caption_data可以直接访问的键。
		'annotations'键对应的值是由annotation结构体组成的列表/数组（总之可以迭代），这里程序把列表/数组中每个元素也命名为annotation了。
		annotation结构体也是由键-值对构成，键包括："id", "image_id", "caption"
		
		image结构体中的file_name<--->image结构体中id==annotation结构体中image_id
		通过上述连接关系，在annotation结构体中添加键"file_name"，并把每个annotation结构实例添加进data列表里。
	"""
	# convert to pandas dataframe (for later visualization or debugging)
	caption_data = pd.DataFrame.from_dict(data)
	# 这时候的caption_data已经不是原先的open()函数后的那个了。
	del caption_data['id']
	# caption_data删除对'id'列的引用，此时只剩'caption', 'file_name', 'image_id'列了。
	caption_data.sort_values(by='image_id', inplace=True)
	"""
		pandas.DataFrame.sort_values(by='xxx', inplace=True)
		参数by对应的列的元素类型必须为数字类型，这里'image_id'列元素类型为int
		另外inplace=True时，为就地排序，无需再赋值就能保存排序后的结果
	"""
	caption_data = caption_data.reset_index(drop=True)
	# 我的pandas版本是0.24.2,测试了pd.DataFrame.sort_value()，发现舍弃reset.index()也没问题

	del_idx = []
	for i, caption in enumerate(caption_data['caption']):
		# 上面提到caption_data现在包含的列有：'captions', 'file_name', 'image_id'。
		caption = caption.replace('.', '').replace(',','').replace("'","").replace('"','')
		caption = caption.replace('&', 'and').replace('(','').replace(")","").replace('-',' ')
		# 最后一个replace函数的第二个参数为什么是空格字符，和其他的不一样？
		caption = " ".join(caption.split()) # replace multiple spaces
		
		caption_data.set_value(i, 'caption', caption.lower())
		# 更改caption_data的第i行，'caption'列的值，将其由caption变为caption.lower()
		if len(caption.split(" ")) > max_length:
			# 虽然切分了，但并没有赋值，所以caption指向的数据对象值没有发生改变
			del_idx.append(i)	# 这里也可以看出idx是index的意思，表示DataFrame结构的行索引
	# delete captions if size is larger than max_length
	print "The number of captions before deletion: %d" % len(caption_data)
	caption_data = caption_data.drop(caption_data.index[del_idx])
	# 或许是版本原因，或许就是有问题，搜索引擎搜不出pd.DataFrame.index()函数，然后在代码中也找不到定义？
	# 我认为这里应该写作：caption_data = caption_data.drop(index=del_idx)
	caption_data = caption_data.reset_index(drop=True)
	print "The number of captions after deletion: %d" % len(caption_data)
	return caption_data

简而言之，_process_caption_data处理了训练集和测试集的json文件，通过访问键’images’和键’captions’，获取了图片的id信息，图片文件名和对应的描述，把它处理成pd.DataFrame类实例，删除其中过长的文本描述后返回。

现在我们来解读下一个函数: _build_vocab()

def _build_vocab(annotations, threshold=1):
	# 在main()函数中，_build_vocab()只调用了一次
	# 包含训练集全部信息的annotations/captions_train2014.json文件，经过_process_caption_data()函数处理，
	# 得到的结果是：包含图片id信息'image_id'，图片文件名'file_name', 图片描述'caption'三个数据列的pandas.DataFrame类实例。而后把它存成pkl文件：train.annotations.pkl。
	# annotations读取了train.annotations.pkl中包含的信息，所以它包含三个键'image_id', 'file_name', 和'caption' 
	counter = Counter()
	max_len = 0
	for i, caption in enumerate(annotations['caption']):
		words = caption.split(' ')
		for w in words:
			counter[w] += 1
		if len(caption.split(" ")) > max_len:
			max_len = len(caption.split(" "))
	
	vocab = [word for word in counter if counter[word] >= threshold]
	# 遍历Counter类实例counter的键，并添加判断条件，符合条件被添加进列表里。dict类实例也有类似功能
	print('Filtered %d words to %d words with word count threshold %d.' % (len(counter), len(vocab), threshold)

	word_to_idx = {u'': 0, U'': 1, u'': 2}
	# 这里再度说明idx指的是index。
	idx = 3
	for word in vocab:
		word_to_idx[word] = idx
		idx += 1
	print "Max length of caption: ", max_len
	return word_to_idx

现在我们解读 _build_caption_vector()函数。

def _build_caption_vector(annotations, word_to_idx, max_length=15):
	# 这里的annotations与上面的_build_vocab()函数中的annotations一样，均是处理训练集等到的
	# 不同之处在于这里的annotations，还将处理验证集和测试集
	# 三个键：'image_id', 'file_name', 'caption'
	n_example = len(annotations)
	captions = np.ndarray((n_examples, max_length+2)).astype(np.int32)
	for i, caption in enumerate(annotations['caption']):
		words = caption.split(" ") # caption contrains only lower-case words
		# 将一张图片的一句描述给切分成单词列表
		cap_vec = []
		cap_vec.append(word_to_idx[''])
		for word in words:
			if word in word_to_idx:
				cap_vec.append(word_to_idx[word])
		cap_vec.append(word_to_idx[''])
		# 将单词列表转换成索引向量(在前后分别添上和)
		# pad short caption with the special null token '' to make it fixed-size vector
		if len(cap_vec) < (max_length + 2):
			for j in range(max_length + 2 - len(cap_vec)):
				cap_vec.append(word_to_idx[''])
		
		captions[i, :] = np.asarray(cap_vec)
		# numpy.asarray()可以将列表、元组、元组列表、列表元组转换成numpy数组
	print "Finished building caption vectors"
	return captions

现在解读_build_file_name()函数

def _build_file_names(annotations):
	# 这里的annotations等同于_build_caption_vector里的annotations
	image_file_names = []
	id_to_idx = {}
	idx = 0
	image_ids = annotations['image_id']
	file_names = annotations['file_name']
	# 由于一张图片有多个描述句子，意味着annotations['image_id']得到的结果里有重复的id信息, annotations['file_name']也有重复的file_name信息，也就意味着image_ids和file_names各自均有重复元素。
	for image_id, file_name in zip(image_ids, file_names):
		if not image_id in id_to_idx:
			id_to_idx[image_id] = idx
			image_file_names.append(file_name)
			idx += 1
	# 上面的for循环，就是起到剔除重复元素的作用，但这时又引入了一个idx，作为id_to_idx中键image_id的值
	file_names = np.asarray(image_file_names)
	return file_names, id_to_idx

最后是_build_image_idxs()函数了

def _build_image_idxs(annotations, id_to_idx):
	# 这里的annotations等同上面函数的annotations。
	image_idxs = np.ndarray(len(annotations), dtype=np.int32)
	image_ids = annotations['image_id']
	# image_idxs和image_ids尺寸大小相同
	for i, image_id in enumerate(image_ids):
		image_idxs[i] = id_to_idx[image_id]
		# 暂时没搞懂多了个复杂的image_idxs有什么好处
	return image_idxs

Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
深度学习：让机器学会“思考”的魔法 AI极客Jayden　 AI 深度学习
文章目录引言：从“鹦鹉学舌”到“举一反三”一、深度学习是什么？1.定义：机器的“大脑”2.核心思想：从数据中“悟”出规律二、深度学习的“大脑”结构：神经网络1.神经元：深度学习的基本单元2.神经网络：多层“神经元”的组合3.深度：为什么需要多层？三、深度学习如何“学习”？1.训练过程：从“笨拙”到“熟练”2.损失函数：衡量“错误”的尺子3.反向传播：从错误中“反思”四、深度学习的“超能力”1.图像
Python 爬虫实战：汽车电商平台价格波动监控与市场趋势洞察西攻城狮北 python 爬虫汽车实战案例
目录一、环境准备与依赖安装二、目标网站分析1.网站页面结构分析2.数据爬取策略三、代码实现1.数据抓取模块(1)爬取车型列表(2)爬取车型详情(3)主爬取函数2.数据存储模块3.数据分析模块四、完整工作流程(1)初始化爬虫(2)执行爬虫(3)数据存储(4)数据分析五、注意事项六、扩展功能在当今数字化时代，汽车电商平台为消费者提供了便捷的购车渠道。通过Python爬虫技术，我们可以监控汽车电商平台的
Python实现微博关键词爬虫才华是浅浅的耐心 python 新浪微博爬虫
1.背景介绍随着社交媒体的广泛应用，微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容，本文将介绍如何使用Python编写一个简单的爬虫脚本，从微博中抓取指定关键词的相关数据，并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例，展示从微博抓取该关键词相关数据的全过程。废话不多说，先上结果图。2.项目实现思路该爬虫通过向微博的搜索接口发送HTTP请求，获取与指定
使用 Python 实现批量发送电子邮件才华是浅浅的耐心 python 爬虫开发语言
引言：在日常工作中，我们可能会遇到需要批量发送邮件的场景，例如通知、营销邮件或测试邮件。如果手动发送，不仅效率低下，还容易出错。今天，我将分享一个使用Python实现的自动化邮件发送脚本，通过读取Excel文件中的发件人和收件人信息，轻松完成批量邮件发送任务。功能概述这个脚本的主要功能包括：从Excel文件中读取发件人信息（邮箱和授权码）和收件人信息（邮箱）。根据发件人邮箱的域名，自动匹配SMTP
python 之GUI设计：Entry组件时间之里 python-tkinter python python
说明：Entry（输入框）组件通常用于获取用户的输入文本。使用条件：Entry组件在GUI界面的设计中主要用于单行文本的键入（实际键入的内容可以比显示的空间更长，此种情况下结束鼠标和位移键能够产看自己输入的隐藏内容），通过几何外观图形属性设计可以改变实际的元素表现如果你希望接收多行文本的输入，可以使用Text组件（后面介绍）。常见用法：-普通输入框作为输入框最重要的属性是输入内容的获取：eg:pa
Python Tkinter库实战（用Entry和button控件做一个小型的浏览器） IT界小菜鸡笔记 python 开发语言
大家好，上一期我们大概了解了一下PythonTkinter库。这是一个方便快捷的GUI库；可以用短短几行代码生成出一个用户图形化接口的窗口。算是非常方便。既然前一期我们了解了tk库。那么我们今天就来做一个实战。今天这个实战项目源自于我一个奇奇怪怪的想法。当时打开浏览器的时候想着，既然我打开浏览器输入网址，搜索URL。既然别人可以，那我为什么不可以自己做一个呢？抱着这个想法，我就开始了这个实验。废话
珍藏！Java SpringBoot 精品源码合集约惠来袭，获取路径大公开秋野酱 java spring boot 开发语言
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
python调用DeepSeek的API garfield_sun06 大模型 python 语言模型
1获取API获得deepseek开放平台的APIhttps://platform.deepseek.com/api_keys点击创建APIkey2调用方法方法一：采用openai的调用方法pipinstallopenai需要openai的包调用的代码框架fromopenaiimportOpenAIimportosclient=OpenAI(api_key='自己的APIkey',base_url=
Python GUI 开发：全面指南一休哥助手 python python 开发语言
1.PythonGUI开发简介GUI是指图形用户界面，它使用户可以通过图形元素（如按钮、文本框、下拉菜单等）与应用程序进行交互。与命令行界面相比，GUI更加直观易用。Python提供了多种库和框架，使开发者能够轻松创建功能丰富的桌面应用程序。1.1为什么选择Python进行GUI开发？简洁易读：Python的语法简洁，代码易于理解，开发者可以专注于应用程序的逻辑而不是语法。跨平台：Python是跨
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
Python图形界面(GUI)Tkinter笔记（十四）：Entry与Button的碰撞（1）小叶肥辉 tkinter python gui tkinter
用功能按钮(Button)、单行文本输入框(Entry)、文本框内容读取(get)实现一个极简易的加法运算，及与其他控件的交互，提高体验，主要体现其人机交互的意义。因为Entry()文本输入框没有限制输入内容属性的参数，它是把所有的输入都视作它特有的一个类属性，所以用get()方法读取出来是一个字符串而这字符串可包括字母或其它符号。因此我们必须对其进行判断后再计算，若直接计算可能会出现不可预料的错
python ppt转pdf macos_如何在 macOS 上一键批量把 PPT 和 Word 文件转成 PDF weixin_39857792 python ppt转pdf macos
原标题：如何在macOS上一键批量把PPT和Word文件转成PDF相信不少人都有或曾经有过需要将多个PPT/Word文件转为PDF的需求，可能是一堆PPT课件为了方便批注，也可能是一些Word文档为了方便阅读。每次只能打开一个文档，选择「另存为」，选「PDF」，点「保存」，关掉，再打开下一个文档，文档数目一多，整个过程就会变得很令人沮丧。最近我研究了一下这个磨人的问题，制作了一个动作可以在不到2秒
python智能合约编程_技术指南 | Python智能合约开发？看这一篇就够了 weixin_39897127 python智能合约编程
01前言在之前的技术视点文章中，我们介绍了目前本体主网支持的智能合约体系以及相应的智能合约开发工具SmartX。很多小伙伴都想上手练一练。在本期的技术视点中，我们将正式开始讲述智能合约语法部分。本体的智能合约API分为7个模块，分别是Blockchain&BlockAPI、RuntimeAPI、StorageAPI、NativeAPI、UpgradeAPI、ExecutionEngineAPI以及
langchain chroma 与 chromadb笔记 phynikesi langchain 笔记 chromadb
chromadb可独立使用也可搭配langchain框架使用。环境：python3.9langchain=0.2.16chromadb=0.5.3chromadb使用示例importchromadbfromchromadb.configimportSettingsfromchromadb.utilsimportembedding_functions#加载embedding模型en_embeddin
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
python电脑怎么打开任务管理器_利用Python调用Windows API，实现任务管理器功能 weixin_39778400
任务管理器具体功能有：1、列出系统当前所有进程。2、列出隶属于该进程的所有线程。3、如果进程有窗口，可以显示和隐藏窗口。4、强行结束指定进程。通过Python调用WindowsAPI还是很实用的，能够结合Python的简洁和WindowsAPI的强大，写出各种各样的脚本。编码中的几个难点有：1、API的入参是结构体时，怎么解决？答：Python内手动建立结构体。详见：https://baijiah
Latex 插入图片或表格导致页面空白过多 (??(#?)???(???/ 论文阅读
如图所示：Latex插入图片或表格导致页面空白过多我们可以采用这个方式来减少空白。\documentclass{article}\usepackage{graphicx}%包含图形支持\usepackage{caption}%提供更多对caption的控制%设置标题上方和下方的间距\setlength{\abovecaptionskip}{0.cm}%上方\setlength{\belowcapt
目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
Python入门(函数) 高育良00003 python 开发语言
一.基础认识一种映射关系1.1什么是函数呢？概念函数是可以重复执行的语句块，可以重复调用作用用于封装语句块，提高代码的重用性1.2函数的定义语法：deffunction():#def为关键字，function为函数名#语句想要执行的操作returnre#re为返回值二.函数的调用函数名后+小括号()表示函数的执行2.1基本用法语法：函数名(实际调用的参数)2.2调用传参2.2.1位置传参最为常见，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
python本地连接minio 伶星37 python 网络服务器
在你浏览器能成功访问到你的minio网页，并且成功登录之后。接下来如果你想用python连接数据库，并且想用python连接minio，就可以用这个blog。连接代码client=Minio("localhost:9000",#9000是默认端口号access_key="admin",#你的账户secret_key="password",#你的密码secure=False,#这点我会详细说明)为什
Not enough information to list image symbols. Not enough information to list load addresses in ... Water_Sounds 学习笔记 keil mdk
除了绝大部分网上给的解决方法外：Notenoughinformationtolistimagesymbols.Notenoughinformationtolistloadaddressesin…我在向正点原子例程“输入捕获”中添加lcd驱动程序时，发现按照上述链接的做法填了路径什么的，还是报错，最后发现是这个.c文件文件没有添加进来导致这两句话一直是无定义，填进来就好了。
头歌实践教学平台 Python程序设计实训答案（三）学习的锅头哥实践教学平台实训答案 python
第七阶段文件实验一文本文件的读取第1关：学习-Python文件之文本文件的读取任务描述本关任务：使用open函数以只写的方式打开文件，打印文件的打开方式。相关知识为了完成本关任务，你需要掌握：文本文件；open函数及其参数；文件打开模式；文件对象常用属性；关闭文件close函数。#请在下面的Begin-End之间按照注释中给出的提示编写正确的代码##########Begin###########
python基础之--面相对象--OOP基本特性暴龙胡乱写博客 python 开发语言人工智能
python基础之–面相对象–OOP基本特性文章目录python基础之--面相对象--OOP基本特性一，OOP基本特性1.1封装1.2继承/派生1.2.1基础概念1.2.3继承实现1.3多态1.4对象对成员的操作（补充）1.5私有属性1.6重写魔术方法二，super函数2.1基本使用2.2super().\__init__()一，OOP基本特性OOP的四大基本特性是封装、继承、多态和抽象。1.1封
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

show-attend-and-tell-tensorflow源码解读：preprocess.py

你可能感兴趣的:(image,caption,python,tensorflow,深度学习,人工智能)