一棵___大树

【Python课程作业】食物数据的爬取及分析（详细介绍及分析）

食物数据爬取及分析

- 项目概述
- 网页爬取
- - 食物类别
  - 表头设置
  - 食物数据爬取保存
  - 运行结果
- 数据分析
- - CSV文件读取
  - 总体描述
  - 分类分析
  - 特定食物分析
  - 运行结果
项目资源

项目概述

日常生活中我们食用的各种食物具有很多营养属性，比如卡路里、蛋白质与脂肪含量和各种微量元素，通过分析不同食物的营养含量对我们日常生活的饮食健康有很大好处，同时网页中有很多开放的食物数据库，我们可以爬取网页数据保存到本地文件供我们分析。该项目即通过爬取网页食物数据，并进行分析与可视化，也便于后续进行个人饮食健康评估与健康饮食推荐的研究。

网页爬取

程序路径： foodData\GetData.py

通过对目标网页的观察，网页结构整齐，所以这里使用XPath的方法，同时为了实现访问一次就可以得到不同层次的数据，用下面的函数实现：

url:网页域名
xpathlist:数据类型为list，可包括不同层次的xpath路径

# 爬取数据
def getData(url, xpathList):
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/72.0.3626.109 Safari/537.36'}
    try:
        response = requests.get(url, headers=headers)
        response = lxml.etree.HTML(response.text)
        # print(response)
    except:
        print('打开网址失败！！！请检查！')
        return

    dataList = []
    for i in range(len(xpathList)):
        data = response.xpath(xpathList[i])
        if len(data) == 0:
            print(f"爬取数据为空！请检查xpath路径xpathList[{i}]!")
        # print(data)
        dataList.append(data)
    # 返回数据列表
    return dataList

食物类别

爬取数据网页的域名为：http://db.foodmate.net/yingyang/type_%s.html ，其中%s 为**‘1’～‘21’**表示不同食物种类，如下图所示，该页面为%s='1'时谷类食物页面。

通过观察，食物种类数据在xpath='//*[@id="top"]/a'中，值得注意的是页面缺失type_12、type_13、type_14的数据，通过手动输入域名我们可以发现这三个食物类别分别为：['鱼类', '婴儿食品类', '小吃类']，函数实现如下：

得到结果：['谷类', '薯类淀粉', ' 干豆类', '蔬菜类', '菌藻类', '水果类', '坚果种子', '畜肉类', '禽肉类', '乳类', '蛋类', '鱼类', '婴儿食品类', '小吃类', '速食食品', '软饮料', '酒精饮料', '糖蜜饯类', '油脂类', '调味品类', '药食及其它', 'xlfcnkvf']

# 爬取食物种类类别
def getFoodKind():
    url3 = f'http://db.foodmate.net/yingyang/type_1.html'
    xpathList3 = ['//*[@id="top"]/a']
    dataElem3 = getData(url3, xpathList3)
    kindfood_temp = ['鱼类', '婴儿食品类', '小吃类']
    kindFood = []
    i = 0
    sign = 0
    signList = [11, 12, 13]
    while i < len(dataElem3[0]):
        if sign in signList:
            kindFood.append(kindfood_temp[sign - 11])
            sign += 1
        else:
            kindFood.append(dataElem3[0][i].text)
            i += 1
            sign += 1
    return kindFood

表头设置

在食物种类页面，我们可以得到食物的名称，同时名称中包含食物的别名和特性，比如甘薯(红心)[山芋，红薯]，后面在数据爬取中我们将其分离，至此我们的表头可以手动设置为 headers = ['食物', '别名', '特征', '分类', 'Wiki百科']，每种食物的营养物质名称可以在特定食物页面中获得，这里爬取的为小麦网页页面，域名为： http://db.foodmate.net/yingyang/type_0%3A1%3A0_1.html。

xpath路径：'//*[@id="rightlist"]/div[@class="list"]//text()'

函数实现：

得到结果： ['食物', '别名', '特征', '分类', 'Wiki百科', '热量(千卡)', '硫胺素(毫克)', '钙(毫克)', '蛋白质(克)', '核黄素(毫克)', '镁(毫克)', '脂肪(克)', '烟酸(毫克)', '铁(毫克)', '碳水化合物(克)', '维生素C(毫克)', '锰(毫克)', '膳食纤维(克)', '维生素E(毫克)', '锌(毫克)', '维生素A(微克)', '胆固醇(毫克)', '铜(毫克)', '胡罗卜素(微克)', '钾(毫克)', '磷(毫克)', '视黄醇当量(微克)', '钠(毫克)', '硒(微克)', '备注']

# 爬取表头
def getCsvHeaders():
    headers = ['食物', '别名', '特征', '分类', 'Wiki百科']
    ur = 'http://db.foodmate.net/yingyang/type_0%3A1%3A0_1.html'
    xp = ['//*[@id="rightlist"]/div[@class="list"]//text()']
    da = getData(ur, xp)
    for i in range(len(da[0]) // 2):
        headers.append(da[0][2 * i])
    headers.append('备注')
    return headers

食物数据爬取保存

食物名称及详细页面链接

一类食物页面其中的每一个食物名称及其数据页面链接都在 xpath=//*[@id="dibu"]/li[@class="lie"]/a路径中，如下图

li[i]/a.text:食物名称
li[i]/a.attrib['href']:食物数据页面链接

上面我们提到食物名称中可能含有食物的别名('[ ]‘内容)和特征描述(’( )'内容)，这里我们用re正则匹配将食物名称中的别名与特征提取出来，如果没有别名或者特征描述，就设置为 'Empty'。

食物的详细数据获取

在上面爬取食物名称时，我们得到了一种食物数据页面的部分链接，所以一种食物数据页面的域名为 'http://db.foodmate.net/yingyang/' + li[i]/a.attrib['href']

如图进入数据页面我们发现我们所需数据的路径有两个：

//*[@id="rightlist"]/center/a.attrib['href']:Wiki食物百科链接
//*[@id="rightlist"]/div[i]//text():食物营养物质含量数据

数据写入csv文件

filename：文件保存路径
data：数据列表（二维）
headers：表头列表
isHeaders：是否写入表头（第一次写入数据）

# 数据写入csv文件
def dataWriteToCsv(filename, data, headers=None, isHeaders=False):
    if headers is None:
        headers = []
    try:
        with open(filename, 'a', encoding='utf-8', newline='') as f:
            writer = csv.writer(f)
            # 是否写入标题头
            if isHeaders:
                writer.writerow(headers)
            for i in range(len(data)):
                writer.writerow(data[i])
        print(f'数据写入成功{filename}中！')
    except:
        print('写入文件失败！！！')

函数实现

foodKindId：食物种类编号1～21
foodKind：食物种类列表
headers：表头设置列表

# 读取食物营养库一类食物数据并保存到csv文件中
def getFoodDataToCsv(foodKindId, foodKind, headers):
    # 食物名称及详细页面
    url0 = f'http://db.foodmate.net/yingyang/type_{foodKindId}.html'
    xpathList1 = ['/html/body/div[@id="main2"]/div/div[@id="leftcontent"]/div[@id="dibu"]/li[@class="lie"]/a']
    dataElem = getData(url0, xpathList1)
    # re正则匹配将食物名称中的别名与特征提取出来
    pattan1 = re.compile('\[.*?\]')
    pattan2 = re.compile('\(.*?\)')
    dataList = []
    for i in range(len(dataElem[0])):
        string_temp = dataElem[0][i].text
        # 提取名称中‘【】’的别名
        other_name = pattan1.search(string_temp)
        # 提取名称中‘（）’的特性
        features = pattan2.search(string_temp)
        if other_name is None:
            other_name = 'Empty'
        else:
            other_name = other_name.group()
            other_name = other_name.replace('[', '')
            other_name = other_name.replace(']', '')
        if features is None:
            features = 'Empty'
        else:
            features = features.group()
            features = features.replace('(', '')
            features = features.replace(')', '')
        # 将名称中的别名与特征去除
        f_Name = pattan1.sub('', string_temp)
        f_Name = pattan2.sub('', f_Name)
        # 写入data列表
        data = [f_Name, other_name, features, foodKind[foodKindId - 1]]
        # 一种食物的数据页面
        url1 = 'http://db.foodmate.net/yingyang/' + dataElem[0][i].attrib['href']
        xpathList2 = ['//*[@id="rightlist"]/div[@class="list"]//text()', '//*[@id="rightlist"]/center/a']
        data2Elem = getData(url1, xpathList2)
        try:
            data.append(data2Elem[1][0].attrib['href'])
        except:
            # Wiki食物百科不存在
            data.append('Empty')
        for j in range(len(headers) - 6):
            try:
                data.append(float(data2Elem[0][2 * j + 1]))
            # 数据为空设置为nan
            except:
                data.append(np.nan)
        # 备注设置为空
        data.append('Empty')
        dataList.append(data)
    # print(dataList)
    # 将数据写进csv文件
    dataWriteToCsv('Data\\food.csv', dataList, headers=headers, isHeaders=(foodKindId == 1))

运行结果

主函数

# 主函数
if __name__ == '__main__':
    # 爬取食物种类
    fK = getFoodKind()
    # print(fK)
    # 爬取表头
    header = getCsvHeaders()
    # print(header)
    # 爬取食物数据
    for num in range(20):
        getFoodDataToCsv(num + 1, fK, header)

csv文件部分数据如下

数据分析

程序路径：foodData\DataAnalysis.py
调用 import pandas as pd和 import numpy as np两个库进行数据分析；
调用 import matplotlib.pyplot as plt进行数据可视化；
平时我们饮食重点关注食物的热量，所以我们主要对食物热量进行分析；

CSV文件读取

调用 import pandas as pd读取：data = pd.read_csv('data\\food.csv')
调用 import csv读取，函数实现如下：
- filename:文件路径
- isDic=False:是否只读取某一列，默认为 False
- dicName='':若只读取某一列，该列列名，默认为空

# 读取csv文件
def dataReadFromCsv(filename, isDic=False, dicName=''):
    dataList = []
    try:
        with open(filename, 'r', encoding='utf-8') as f:
            # 全部读取
            if not isDic:
                reader = csv.reader(f)
                # 跳过标题
                next(reader)
                for data in reader:
                    dataList.append(data)
            # 按照标题查询
            else:
                reader = csv.DictReader(f)
                for data in reader:
                    try:
                        dataList.append(data[dicName])
                    except:
                        print('列名不存在！！')
                        return
            print(f'文件{filename}读取成功！')
            return dataList
    except:
        print('读取csv文件失败！！！')
        return

总体描述

RangeIndex: 1404 entries, 0 to 1403：共1404种食物数据；
Data columns (total 30 columns)：每种食物拥有30种属性；
dtypes: float64(24), object(6)：30个属性中24种数据类型为浮点型，剩下六种为字符串；
memory usage: 329.2+ KB：占用内存；

分类分析

首先得到文件中食物种类的起始索引等相关信息，函数实现如下：

得到结果： [(0, 87, 87, '谷类'), (87, 105, 18, '薯类淀粉'), (105, 177, 72, ' 干豆类'), (177, 377, 200, '蔬菜类'), (377, 412, 35, '菌藻类'), (412, 574, 162, '水果类'), (574, 618, 44, '坚果种子'), (618, 756, 138, '畜肉类'), (756, 815, 59, '禽肉类'), (815, 853, 38, '乳类'), (853, 874, 21, '蛋类'), (874, 1011, 137, '鱼类'), (1011, 1021, 10, '婴儿食品类'), (1021, 1104, 83, '小吃类'), (1104, 1140, 36, '速食食品'), (1140, 1194, 54, '软饮料'), (1194, 1250, 56, '酒精饮料'), (1250, 1283, 33, '糖蜜饯类'), (1283, 1309, 26, '油脂类'), (1309, 1404, 95, '调味品类')]

# 食物类别索引
def foodKindIndex():
    # 分类数据
    dataKind = dataReadFromCsv('data\\food.csv', dicName='分类', isDic=True)
    kindIndex = []
    temp = 0
    start = 0
    tempStr = dataKind[0]
    while temp < len(dataKind):
        temp += 1
        if temp == len(dataKind):
            kindIndex.append((start, temp, temp - start, tempStr))
            break
        if tempStr != dataKind[temp]:
            # 四元组(start,end,num,foodName)
            kindIndex.append((start, temp, temp - start, tempStr))
            tempStr = dataKind[temp]
            start = temp
    del dataKind
    return kindIndex

数量分析

foodKindNum: 20：共20种食物，柱状图如下：

热量分析

不同食物种类的平均热量
不同食物种类最高与最低热量

特定食物分析

查找目标食物

函数实现如下：

foodName:查找名称
dataA:食物数据

# 搜索特定食物
def searchFood(foodName, dataA):
    reIndex = []
    for i in range(len(dataA)):
        # 查找名称
        if re.search(foodName, dataA[i][0]) is not None:
            reIndex.append(i)
        # 查找别名
        elif re.search(foodName, dataA[i][1]) is not None:
            reIndex.append(i)
    # 返回查找结果索引
    return reIndex

生成热量柱状图

当结果个数为1时，输出该结果的所有数据信息；当结果大于25个时，只绘制前25个热量柱状图。函数实现如下：

dataIndex:结果索引列表
dataC:热量数据
dataA:食物数据
header:表头

# 特定食物生成热量柱状图
def specialDataToImage(dataIndex, dataC, dataA, header):
    print(f'查找到{len(dataIndex)}个结果。。。')
    if len(dataIndex) == 0:
        print('数据索引为空！！')
        return
    elif len(dataIndex) == 1:
        print('只查找到一项，信息如下：')
        print(f'名称：{dataA[dataIndex[0]][0]}\t别名：{dataA[dataIndex[0]][1]}\t特征：{dataA[dataIndex[0]][2]}')
        print('详细信息：')
        for i in range(3, len(header)):
            print(f'{header[i]}:{dataA[dataIndex[0]][i]}')
        return
    elif len(dataIndex) >= 25:
        print('查找结果大于25个，结果如下，只给出前10个结果热量柱状图：')
        print([f'{dataA[i][0]}({dataA[i][2]})' for i in dataIndex])
        dataIndex = dataIndex[0:25]
    # 指定默认字体
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    # 解决保存图像是负号'-'显示为方块的问题
    mpl.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(25, 10))
    name_list = []
    for i in dataIndex:
        name = dataA[i][0]
        if dataA[i][1] != 'Empty':
            name += f'\n[{dataA[i][1]}]'
        if dataA[i][2] != 'Empty':
            name += f'\n({dataA[i][2]})'
        name_list.append(name)
    num_list = [dataC[i] for i in dataIndex]
    plt.bar(range(len(num_list)), num_list, tick_label=name_list)
    for x, y in enumerate(num_list):
        plt.text(x, y, '%s' % y, ha='center', va='bottom')
    plt.title('食物热量比较')
    plt.xlabel('食物名称')
    plt.ylabel('热量(千卡/100g)')
    plt.show()

运行结果

主函数

# 主函数
if __name__ == '__main__':
    # data1 = pd.read_csv('data\\food.csv')
    data2, headers = dataReadFromCsv('data\\food.csv')
    # 数据概览
    # print(data1.info())
    # 热量数据
    dataCalorie = dataReadFromCsv('data\\food.csv', dicName='热量(千卡)', isDic=True)
    dataCalorie = [float(i) for i in dataCalorie]
    kindI = foodKindIndex()
    # 不同食物种类的数目柱状图
    # dataToImage2(kindI)
    # 不同食物种类的平均热量柱状图
    # dataToImage3(kindI, dataCalorie)
    # 不同食物种类最高与最低热量柱状图
    # dataToImage4(kindI, dataCalorie, data2)
    # 查找食物
    while 1:
        foodN = input('输入要查找食物的名称(退出请输入0)：')
        if foodN == '0':
            break
        reList = searchFood(foodN, data2)
        specialDataToImage(reList, dataCalorie, data2, headers)

查找：苹果

查找到22个结果。。。

查找：玉米

查找到11个结果。。。

查找：边鱼

查找到1个结果。。。

只查找到一项，信息如下：
名称：参鱼别名：蓝圆参，边鱼特征：Empty
详细信息：
['分类:鱼类', 'Wiki百科:http://www.foodbk.com/wiki/%E5%8F%82%E9%B1%BC', '热量(千卡):124.0', '硫胺素(毫克):0.06', '钙(毫克):55.0', '蛋白质(克):18.5', '核黄素(毫克):0.11', '镁(毫克):30.0', '脂肪(克):3.4', '烟酸(毫克):3.6', '铁(毫克):1.8', '碳水化合物(克):4.8', '维生素C(毫克):0.0', '锰(毫克):0.05', '膳食纤维(克):0.0', '维生素E(毫克):0.49', '锌(毫克):0.85', '维生素A(微克):1.0', '胆固醇(毫克):78.0', '铜(毫克):0.11', '胡罗卜素(微克):1.3', '钾(毫克):215.0', '磷(毫克):191.0', '视黄醇当量(微克):72.0', '钠(毫克):81.6', '硒(微克):24.89', '备注:Empty']

查找：鱼

查找到77个结果。。。

查找结果大于25个，结果如下，只给出前25个结果热量柱状图：

项目资源

已在CSDN发布资源
python食物数据爬取及分析（源码、爬取数据、数据可视化图表、报告）
GitHub项目传送门
https://github.com/A-BigTree/college_assignment

零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
Python 字符串操作 iteye_13776 Python Python C C++C#
Python截取字符串使用变量[头下标:尾下标]，就可以截取相应的字符串，其中下标是从0开始算起，可以是正数或负数，下标可以为空表示取到头或尾。#例1：字符串截取str='12345678'printstr[0:1]>>1#输出str位置0开始到位置1以前的字符printstr[1:6]>>23456#输出str位置1开始到位置6以前的字符num=18str='0000'+str(num)#合并字
Qt 串口类QSerialPort 使用笔记一对一答疑的编程作家朱文伟 qt qt 笔记开发语言
Qt串口类QSerialPort使用笔记虽然现在大多数的家用PC机上已经不提供RS232接口了。但是由于RS232串口操作简单、通讯可靠，在工业领域中仍然有大量的应用。Qt以前的版本中，没有提供官方的对RS232串口的支持，编写串口程序很不方便。现在好了，在Qt5.1中提供了QtSerialPort模块，方便编程人员快速的开发应用串口的应用程序。本文就简单的讲讲QtSerialPort模块的使用。
API身份验证使用JWT的.NET实现雨夜思绪~静谧思考 .net
API身份验证使用JWT的.NET实现在现代的应用程序开发中，API身份验证是一项至关重要的任务。JWT（JSONWebToken）是一种常用的身份验证机制，它使用JSON格式表示身份验证信息，并使用签名进行验证。在.NET平台上，我们可以使用一些库来实现JWT身份验证。本文将介绍如何使用.NET来进行API身份验证并使用JWT作为身份验证机制。引入依赖项首先，我们需要在我们的项目中引入相关的依赖
【Go语言圣经1.1】 Pyroyster golang 开发语言后端
目标学习Go的编译方式、包的组织方式以及工具链的统一调用方式概念与定义packageGo语言通过包来组织代码。包类似于其它语言的库librarries或模块modules，每个包通常对应一个目录，目录中的所有.go文件都属于同一个包。特殊的main包:当代码使用packagemain声明时，表示这是一个可独立执行的程序而非一个库。程序的执行入口就是main函数import通过import语句，编译
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
学习笔记10——并发编程2线程安全问题与同步机制码代码的小仙女高级开发必备技能 java知识学习笔记
线程安全问题与同步机制线程安全的本质问题线程安全问题源于多线程环境下对共享资源（数据或状态）的非原子性、非可见性、非有序性访问，导致程序行为不符合预期。主要表现如下：竞态条件（RaceCondition）：多个线程对同一资源进行非原子操作，导致结果依赖线程执行顺序。示例：两个线程同时执行count++（非原子操作，实际包含读-改-写三步）。内存可见性问题：线程修改共享变量后，其他线程无法立即看到最
暮然回首--再看C语言--常量与宏定义 812503533 蓦然回首---再看C语言 c语言
常量与宏定义在C语言中，常量和宏定义是非常重要的概念。它们有助于提高程序的可读性、可维护性，并且能够避免重复代码。常量是指在程序运行期间其值不发生变化的变量，而宏定义是一种预处理指令，用于定义常量或代码片段，在编译阶段进行替换。一、常量常量是指在程序执行过程中其值不可改变的量。在C语言中，我们可以使用const关键字来声明常量。常量分为以下几种类型：常量整数：例如constinta=5;常量浮点数
50 种不同编程语言的“Hello World”，你知多少？逗逗逗逗666 编程 hello world 编程语言
当我们学习一门编程语言时，都是从“Hello,World!”开始。所有程序员在其职业生涯中，都至少接触过一个经典的“Hello,World!”程序。通常程序员会使用多种编程语言，多的甚至实现了十几种。还有一种称为TTHW（Timeto“Hello,World!”）的方法，来衡量程序员创建一个新的“Hello,World!”程序的时间。你可以用多少种不同的语言编写一个“Hello,World!”程序
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
C++11之列表初始化 Octopus2077 c++学习笔记
发展历史C++11是C++的第⼆个主要版本，并且是从C++98起的最重要更新。它引⼊了⼤量更改，标准化了既有实践，并改进了对C++程序员可⽤的抽象。在它最终由ISO在2011年8⽉12⽇采纳前，⼈们曾使⽤名称“C++0x”，因为它曾被期待在2010年之前发布。C++03与C++11期间花了8年时间，故⽽这是迄今为⽌最⻓的版本间隔。从那时起，C++有规律地每3年更新⼀次。列表初始化（注意区分列表初始
Linux 提权藤原千花的败北权限提升网络安全 linux 运维网络安全
文章目录前言1.内核漏洞提权脏牛（CVE-2016-5195）2.不安全的系统配置项2.1SUID/SGID提权2.2sudo提权2.3定时任务提权2.4capabilities提权3.第三方软件提权TomcatmanagerNginx本地提权（CVE-2016-1247）Redis未授权4.参考前言Linux提权总结1.内核漏洞提权内核管理着组件（如系统上的内存）和应用程序之间的通信。这个关键作
QT显示网页控件QAxWidget、QWebEngineView及区别 AI+程序员在路上 QT&C++实战系列 qt 开发语言
一.QT种显示网页控件QAxWidget1.介绍QAxWidget属于QtAxContainer模块，ActiveX是微软提出的一种组件对象模型（COM）技术，允许不同的软件组件在Windows操作系统上进行交互和集成。QAxWidget为开发者提供了在Qt应用程序中使用ActiveX控件的能力，通过它可以将各种ActiveX控件嵌入到应用程序界面中。2.使用引入必要的模块在.pro文件中添加QT
四种主要的 API 架构风格：RPC、SOAP、REST、GRAPHQL 小马不敲代码系统设计架构 rpc graphql
讨论四种主要的API架构风格，比较它们的优缺点，并重点介绍每种情况下最适合的API架构风格。RPCSOAPRESTGRAPHQL两个单独的应用程序需要中介程序才能相互通信，因此，开发人员经常需要搭建桥梁——也就是应用程序编程接口（API），来允许一个系统访问另一个系统的信息或功能。为了快速、大规模地集成不同的应用程序，API使用协议或规范来定义那些通过网络传输的消息的语义和信息。这些规范构成了AP
06 - gldas水文模型数据处理 - 下载、matlab读取咋（za）说论文笔记笔记经验分享
gldas水文模型数据处理-下载、matlab读取0.引言1.GLDAS水文数据介绍2.GLDAS数据下载3.GLDAS数据读取的matlab程序0.引言根据水量平衡方程，陆地水储量变化(Δtws\DeltatwsΔtws
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
使用LangChain访问个人数据第一章-简介明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序正文在大数据时代，数据价值逐渐凸显，打造定制化、个性化服务，个人数据尤为重要。要开发一个具备较强服务能力、能够充分展现个性化智能的应用程序，大模型与个人数据的对齐是一个重要步骤。作为针对大模型开发应运而生的框
使用LangChain访问个人数据第八章-总结明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序本部分前几个章节请查看使用LangChain访问个人数据第一章-简介使用LangChain访问个人数据第二章-文档加载使用LangChain访问个人数据第三章-文档分割使用LangChain访问个人数据第四章
基于 LangChain 开发应用程序第一章-简介明志刘明大模型学习手册 langchain 人工智能
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分章节目录如下：基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出基于LangChain开发应用程序第三章-储存基于LangChain开发应用程序第四章-模型链基于LangChain开发应用程序第五章-基于文档的问答基于LangCh
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
matlab spmd,matlab并行计算命令其实我是老莫 matlab spmd
1.matlab仿真模型怎么并行计算以单台双核计算机为例。首先打开MATLAB命令窗口，输入matlabpoolopen就OK了。这样，就相当于将一台计算机的两个核心，当做两台机器用啦。接下来是编程序实现的方法。MATLAB并行计算的模式有几种？主要是两种：parfor模式和spmd模式。两种模式的应用都很简单。第一个中，parfor其实就是parallel+for简化而来，顾名思义啊，就是把原来
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
蓝桥杯冲击省一必刷题单(一) 小咖拉眯蓝桥杯蓝桥杯 java 算法数据结构
此题单为算法基础精选题单，包含蓝桥杯常考考点以及各种经典算法，可以帮助你打牢基础，查漏补缺。本题单目标是冲击蓝桥杯省一国一，团体程序天梯赛个人国三、XCPC区域赛铜/银奖前言本次题单重点关注日期问题，进制转换问题，排序问题，其中日期问题和进制转换问题，几乎是必考题，几乎每年蓝桥杯都能看到，大家需要重点掌握。日期问题：蓝桥杯热门考点，基本每年省赛必考。进制转换问题：与日期一样蓝桥杯热门考点，基本每年
程序员必看！DeepSeek隐藏用法大揭秘：从代码优化到多模态开发，这些技巧让你少熬三夜班后端
最近在程序员圈子里，有个同事老张的故事特别火。他原本每周要花20小时写接口文档，自从用上DeepSeek的代码补全功能，现在喝着咖啡看AI自动生成Swagger注释——这让我想起刚入行时，为了调通一个正则表达式熬夜到凌晨三点的自己。今天咱们不聊那些官方说明书，就说点真正能让键盘冒火星的实战技巧。藏在代码补全里的"作弊码"很多人以为DeepSeek就是个加强版搜索引擎，其实它对代码的理解远超想象。比
微信小程序将markdown内容转为pdf并下载蓝天星空编程 2025人工智能AI 微信小程序 pdf
要在微信小程序中将Markdown内容转换为PDF并下载，您可以使用以下方法：方法一：使用第三方API服务选择第三方API服务：可以选择像Pandoc、Markdown-PDF或PDFShift这样的服务，将Markdown转换为PDF。例如，PDFShift提供了一个API接口，可以将Markdown内容转换为PDF格式。调用API：在微信小程序中，您可以使用wx.request方法来调用第三方
基于HarmonyNext的ArkTS高级实战：构建高性能跨平台应用 harmonyos-next
基于HarmonyNext的ArkTS高级实战：构建高性能跨平台应用引言随着HarmonyOSNext的发布，ArkTS作为其核心开发语言，为开发者提供了更强大的工具和更高效的开发体验。ArkTS基于TypeScript，结合了HarmonyOS的分布式能力，使得开发者能够轻松构建高性能、跨平台的应用。本文将深入探讨如何使用ArkTS在HarmonyNext平台上进行高级开发，通过实战案例讲解如何
如何在 Dockerfile 中使用 if-else 条件表达式？ docker
Docker是容器化应用程序的必要工具，使它们可移植和隔离。Dockerfile是Docker生态系统中的一个关键组件，它允许开发人员指定他们的应用程序应该如何被容器化。通常在Dockerfiles中需要条件逻辑，就像您在编程脚本中发现的那样。但是Dockerfile语法不直接支持if-else条件表达式。在本文中，我们将探讨如何在Dockerfiles中有效地使用条件逻辑，特别是使用外部参数。A
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

【Python课程作业】食物数据的爬取及分析（详细介绍及分析）

食物数据爬取及分析

项目概述

网页爬取

食物类别

表头设置

食物数据爬取保存

运行结果

数据分析

CSV文件读取

总体描述

分类分析

特定食物分析

运行结果

项目资源

你可能感兴趣的:(Python,程序项目设计,python,爬虫,开发语言)