爱挠静香的下巴

基于VGG6的好莱坞明星识别-pytorch版本

说明

参考文章：

本文为365天深度学习训练营中的学习记录博客

参考文章：Pytorch实战 | 第P6周：好莱坞明星识别

原作者：K同学啊|接辅导、项目定制

与参考文章的不同

1.梯度下降由SGD换成了Adam
2.重构了VGG16的分类层，改动了神经元个数，drop比率并且增加了BN层
3.对学习率以及动态学习率稍作修改
有上述改动，能够从acc不到20%，增加到64%+
但是和之前用tf做的80%acc还有不小的差距

一、前期准备

1. 设置GPU

import torch
import torch.nn as nn
import torchvision
from torchvision import transforms, datasets
import torchvision.transforms as transforms

import os,PIL,pathlib,warnings

warnings.filterwarnings("ignore")             #忽略警告信息

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

2. 导入数据

import os,PIL,random,pathlib

data_dir = './data/mx_data/'
data_dir = pathlib.Path(data_dir)

data_paths  = list(data_dir.glob('*'))
classeNames = [str(path).split("\\")[2] for path in data_paths]
classeNames

[‘Angelina Jolie’,
‘Brad Pitt’,
‘Denzel Washington’,
‘Hugh Jackman’,
‘Jennifer Lawrence’,
‘Johnny Depp’,
‘Kate Winslet’,
‘Leonardo DiCaprio’,
‘Megan Fox’,
‘Natalie Portman’,
‘Nicole Kidman’,
‘Robert Downey Jr’,
‘Sandra Bullock’,
‘Scarlett Johansson’,
‘Tom Cruise’,
‘Tom Hanks’,
‘Will Smith’]

# 关于transforms.Compose的更多介绍可以参考：https://blog.csdn.net/qq_38251616/article/details/124878863
train_transforms = transforms.Compose([
    transforms.Resize([224, 224]),  # 将输入图片resize成统一尺寸
    # transforms.RandomHorizontalFlip(), # 随机水平翻转
    transforms.ToTensor(),          # 将PIL Image或numpy.ndarray转换为tensor，并归一化到[0,1]之间
    transforms.Normalize(           # 标准化处理-->转换为标准正太分布（高斯分布），使模型更容易收敛
        mean=[0.485, 0.456, 0.406], 
        std=[0.229, 0.224, 0.225])  # 其中 mean=[0.485,0.456,0.406]与std=[0.229,0.224,0.225] 从数据集中随机抽样计算得到的。
])

total_data = datasets.ImageFolder('./data/mx_data/',transform=train_transforms)
total_data

total_data.class_to_idx

{‘Angelina Jolie’: 0,
‘Brad Pitt’: 1,
‘Denzel Washington’: 2,
‘Hugh Jackman’: 3,
‘Jennifer Lawrence’: 4,
‘Johnny Depp’: 5,
‘Kate Winslet’: 6,
‘Leonardo DiCaprio’: 7,
‘Megan Fox’: 8,
‘Natalie Portman’: 9,
‘Nicole Kidman’: 10,
‘Robert Downey Jr’: 11,
‘Sandra Bullock’: 12,
‘Scarlett Johansson’: 13,
‘Tom Cruise’: 14,
‘Tom Hanks’: 15,
‘Will Smith’: 16}

3. 划分数据集

train_size = int(0.8 * len(total_data))
test_size  = len(total_data) - train_size
train_dataset, test_dataset = torch.utils.data.random_split(total_data, [train_size, test_size])
train_dataset, test_dataset

batch_size = 32

train_dl = torch.utils.data.DataLoader(train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True,
                                           num_workers=1)
test_dl = torch.utils.data.DataLoader(test_dataset,
                                          batch_size=batch_size,
                                          shuffle=True,
                                          num_workers=1)

for X, y in test_dl:
    print("Shape of X [N, C, H, W]: ", X.shape)
    print("Shape of y: ", y.shape, y.dtype)
    break

二、调用官方的VGG-16模型

from torchvision.models import vgg16

device = "cuda" if torch.cuda.is_available() else "cpu"
print("Using {} device".format(device))
    
# 加载预训练模型，并且对模型进行微调
model = vgg16(pretrained = True).to(device) # 加载预训练的vgg16模型

for param in model.parameters():
    param.requires_grad = False # 冻结模型的参数，这样子在训练的时候只训练最后一层的参数

# 修改classifier模块的第6层（即：(6): Linear(in_features=4096, out_features=2, bias=True)）
# 注意查看我们下方打印出来的模型
# model.classifier._modules['0'] = nn.Linear(512*7*7,1024) # 修改vgg16模型中最后一层全连接层，输出目标类别个
# model.classifier.add_module("2", nn.BatchNorm1d(1024))
# model.classifier._modules['3'] = nn.Linear(1024,128) # 修改vgg16模型中最后一层全连接层，输出目标类别个数
# model.classifier.add_module("5", nn.BatchNorm1d(128))
# model.classifier._modules['6'] = nn.Linear(128,len(classeNames)) # 修改vgg16模型中最后一层全连接层，输出目标类别个数

model.classifier = nn.Sequential(
    nn.Linear(512*7*7,1024),
    nn.BatchNorm1d(1024),
    nn.Dropout(0.4),
    nn.Linear(1024,128),
    nn.BatchNorm1d(128),
    nn.Dropout(0.4),
    nn.Linear(128,len(classeNames)),
    nn.Softmax()
)
model.to(device)  
model

Using cuda device VGG( (features): Sequential(
(0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(1): ReLU(inplace=True)
(2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(3): ReLU(inplace=True)
(4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(6): ReLU(inplace=True)
(7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(8): ReLU(inplace=True)
(9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(11): ReLU(inplace=True)
(12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(13): ReLU(inplace=True)
(14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(15): ReLU(inplace=True)
(16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(17): Conv2d(256, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(18): ReLU(inplace=True)
(19): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(20): ReLU(inplace=True)
(21): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(22): ReLU(inplace=True)
(23): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
(24): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(25): ReLU(inplace=True)
(26): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(27): ReLU(inplace=True)
(28): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
(29): ReLU(inplace=True)
(30): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False) ) (avgpool): AdaptiveAvgPool2d(output_size=(7,
7)) (classifier): Sequential(
(0): Linear(in_features=25088, out_features=1024, bias=True)
(1): BatchNorm1d(1024, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(2): Dropout(p=0.4, inplace=False)
(3): Linear(in_features=1024, out_features=128, bias=True)
(4): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(5): Dropout(p=0.4, inplace=False)
(6): Linear(in_features=128, out_features=17, bias=True)
(7): Softmax(dim=None) ) )

三、训练模型

1. 编写训练函数

# 训练循环
def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)  # 训练集的大小
    num_batches = len(dataloader)   # 批次数目, (size/batch_size，向上取整)

    train_loss, train_acc = 0, 0  # 初始化训练损失和正确率
    
    for X, y in dataloader:  # 获取图片及其标签
        X, y = X.to(device), y.to(device)
        
        # 计算预测误差
        pred = model(X)          # 网络输出
        loss = loss_fn(pred, y)  # 计算网络输出和真实值之间的差距，targets为真实值，计算二者差值即为损失
        
        # 反向传播
        optimizer.zero_grad()  # grad属性归零
        loss.backward()        # 反向传播
        optimizer.step()       # 每一步自动更新
        
        # 记录acc与loss
        train_acc  += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()
            
    train_acc  /= size
    train_loss /= num_batches

    return train_acc, train_loss

3. 编写测试函数

def test (dataloader, model, loss_fn):
    size        = len(dataloader.dataset)  # 测试集的大小
    num_batches = len(dataloader)          # 批次数目, (size/batch_size，向上取整)
    test_loss, test_acc = 0, 0
    
    # 当不进行训练时，停止梯度更新，节省计算内存消耗
    with torch.no_grad():
        for imgs, target in dataloader:
            imgs, target = imgs.to(device), target.to(device)
            
            # 计算loss
            target_pred = model(imgs)
            loss        = loss_fn(target_pred, target)
            
            test_loss += loss.item()
            test_acc  += (target_pred.argmax(1) == target).type(torch.float).sum().item()

    test_acc  /= size
    test_loss /= num_batches

    return test_acc, test_loss

3. 设置动态学习率

learn_rate = 1e-3 # 初始学习率
lambda1 = lambda epoch: 0.92 ** (epoch // 4)
optimizer = torch.optim.Adam(model.parameters(), lr=learn_rate)
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda1) #选定调整方法

4. 正式训练

import copy

loss_fn    = nn.CrossEntropyLoss() # 创建损失函数
epochs     = 40

train_loss = []
train_acc  = []
test_loss  = []
test_acc   = []

best_acc = 0    # 设置一个最佳准确率，作为最佳模型的判别指标

for epoch in range(epochs):
    # 更新学习率（使用自定义学习率时使用）
    # adjust_learning_rate(optimizer, epoch, learn_rate)
    
    model.train()
    epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, optimizer)
    scheduler.step() # 更新学习率（调用官方动态学习率接口时使用）
    
    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
    
    # 保存最佳模型到 best_model
    if epoch_test_acc > best_acc:
        best_acc   = epoch_test_acc
        best_model = copy.deepcopy(model)
    
    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)
    
    # 获取当前的学习率
    lr = optimizer.state_dict()['param_groups'][0]['lr']
    
    template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%, Test_loss:{:.3f}, Lr:{:.2E}')
    print(template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, 
                          epoch_test_acc*100, epoch_test_loss, lr))
    
# 保存最佳模型到文件中
PATH = './best_model.pth'  # 保存的参数文件名
torch.save(model.state_dict(), PATH)

print('Done')

Epoch: 1, Train_acc:23.8%, Train_loss:2.712, Test_acc:35.6%, Test_loss:2.584, Lr:1.00E-03
Epoch: 2, Train_acc:55.6%, Train_loss:2.457, Test_acc:48.3%, Test_loss:2.521, Lr:1.00E-03
Epoch: 3, Train_acc:80.6%, Train_loss:2.221, Test_acc:51.9%, Test_loss:2.499, Lr:1.00E-03
Epoch: 4, Train_acc:92.2%, Train_loss:2.079, Test_acc:57.5%, Test_loss:2.467, Lr:9.20E-04
Epoch: 5, Train_acc:97.5%, Train_loss:1.990, Test_acc:58.9%, Test_loss:2.432, Lr:9.20E-04
Epoch: 6, Train_acc:98.9%, Train_loss:1.959, Test_acc:58.9%, Test_loss:2.418, Lr:9.20E-04
Epoch: 7, Train_acc:99.2%, Train_loss:1.949, Test_acc:60.0%, Test_loss:2.417, Lr:9.20E-04
Epoch: 8, Train_acc:99.6%, Train_loss:1.941, Test_acc:60.8%, Test_loss:2.379, Lr:8.46E-04
Epoch: 9, Train_acc:99.7%, Train_loss:1.938, Test_acc:61.1%, Test_loss:2.377, Lr:8.46E-04
Epoch:10, Train_acc:99.8%, Train_loss:1.935, Test_acc:62.8%, Test_loss:2.386, Lr:8.46E-04
Epoch:11, Train_acc:99.9%, Train_loss:1.933, Test_acc:60.8%, Test_loss:2.376, Lr:8.46E-04
Epoch:12, Train_acc:99.9%, Train_loss:1.933, Test_acc:59.2%, Test_loss:2.400, Lr:7.79E-04
Epoch:13, Train_acc:100.0%, Train_loss:1.932, Test_acc:61.4%, Test_loss:2.388, Lr:7.79E-04
Epoch:14, Train_acc:100.0%, Train_loss:1.932, Test_acc:62.5%, Test_loss:2.389, Lr:7.79E-04
Epoch:15, Train_acc:100.0%, Train_loss:1.931, Test_acc:61.4%, Test_loss:2.383, Lr:7.79E-04
Epoch:16, Train_acc:100.0%, Train_loss:1.931, Test_acc:62.2%, Test_loss:2.388, Lr:7.16E-04
Epoch:17, Train_acc:100.0%, Train_loss:1.931, Test_acc:61.9%, Test_loss:2.383, Lr:7.16E-04
Epoch:18, Train_acc:100.0%, Train_loss:1.931, Test_acc:61.1%, Test_loss:2.385, Lr:7.16E-04
Epoch:19, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.9%, Test_loss:2.381, Lr:7.16E-04
Epoch:20, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.1%, Test_loss:2.381, Lr:6.59E-04
Epoch:21, Train_acc:100.0%, Train_loss:1.930, Test_acc:64.2%, Test_loss:2.362, Lr:6.59E-04
Epoch:22, Train_acc:100.0%, Train_loss:1.930, Test_acc:62.8%, Test_loss:2.388, Lr:6.59E-04
Epoch:23, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.4%, Test_loss:2.361, Lr:6.59E-04
Epoch:24, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.7%, Test_loss:2.376, Lr:6.06E-04
Epoch:25, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.7%, Test_loss:2.373, Lr:6.06E-04
Epoch:26, Train_acc:100.0%, Train_loss:1.930, Test_acc:63.1%, Test_loss:2.379, Lr:6.06E-04
Epoch:27, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.7%, Test_loss:2.373, Lr:6.06E-04
Epoch:28, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.1%, Test_loss:2.389, Lr:5.58E-04
Epoch:29, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.1%, Test_loss:2.371, Lr:5.58E-04
Epoch:30, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.9%, Test_loss:2.360, Lr:5.58E-04
Epoch:31, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.9%, Test_loss:2.372, Lr:5.58E-04
Epoch:32, Train_acc:100.0%, Train_loss:1.930, Test_acc:62.5%, Test_loss:2.372, Lr:5.13E-04
Epoch:33, Train_acc:100.0%, Train_loss:1.930, Test_acc:63.1%, Test_loss:2.353, Lr:5.13E-04
Epoch:34, Train_acc:100.0%, Train_loss:1.930, Test_acc:63.1%, Test_loss:2.365, Lr:5.13E-04
Epoch:35, Train_acc:100.0%, Train_loss:1.930, Test_acc:63.1%, Test_loss:2.355, Lr:5.13E-04
Epoch:36, Train_acc:100.0%, Train_loss:1.930, Test_acc:62.8%, Test_loss:2.369, Lr:4.72E-04
Epoch:37, Train_acc:100.0%, Train_loss:1.930, Test_acc:62.2%, Test_loss:2.366, Lr:4.72E-04
Epoch:38, Train_acc:100.0%, Train_loss:1.930, Test_acc:62.5%, Test_loss:2.365, Lr:4.72E-04
Epoch:39, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.1%, Test_loss:2.376, Lr:4.72E-04
Epoch:40, Train_acc:100.0%, Train_loss:1.930, Test_acc:61.9%, Test_loss:2.363, Lr:4.34E-04
Done

四、结果可视化

1. Loss与Accuracy图

import matplotlib.pyplot as plt
#隐藏警告
import warnings
warnings.filterwarnings("ignore")               #忽略警告信息
plt.rcParams['font.sans-serif']    = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False      # 用来正常显示负号
plt.rcParams['figure.dpi']         = 100        #分辨率

epochs_range = range(epochs)

plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)

plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

2. 指定图片进行预测

from PIL import Image 

classes = list(total_data.class_to_idx)

def predict_one_image(image_path, model, transform, classes):
    
    test_img = Image.open(image_path).convert('RGB')
    plt.imshow(test_img)  # 展示预测的图片

    test_img = transform(test_img)
    img = test_img.to(device).unsqueeze(0)
    
    model.eval()
    output = model(img)

    _,pred = torch.max(output,1)
    pred_class = classes[pred]
    print(f'预测结果是：{pred_class}')

predict_one_image(image_path='./data/mx_data/Johnny Depp/040_2e8934ea.jpg', 
                  model=model, 
                  transform=train_transforms, 
                  classes=classes)

# 
predict_one_image(image_path='./data/mx_data/Jennifer Lawrence/006_2d0dccd4.jpg', 
                  model=model, 
                  transform=train_transforms, 
                  classes=classes)

3. 模型评估

best_model.eval()
epoch_test_acc, epoch_test_loss = test(test_dl, best_model, loss_fn)
epoch_test_acc, epoch_test_loss

图灵python从入门到实践浮点数_Python编程从入门到实践-图灵出品-pdf 巴黎巨星岬太郎
封面简介本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分：首部分介绍用Python编程所必须了解的基本概念，包括matplotlib、NumPy和Pygal等强大的Python库和工具介绍，以及列表、字典、if语句、类、文件与异常、代码测试等内容；第二部分将理论付诸实践，讲解如何开发三个项目，包括简单的Python2D游戏开发，如何利用数据生成交互式的信息图，以及创建
python从菜鸟到高手电子书下载_PYTHON从菜鸟到高手清华大学出版社逐码追风
推荐序...1前言...3本书配套资源...5第一篇Python基础知识第1章初识Python.31.1Python简介...31.2搭建Python开发环境...81.3第一个Python程序...261.4调试Python程序...261.5小结...291.6实战与练习...29第2章Python语言基础...302.1Python程序中的基本要素...302.2数字...342.3获取用户
Python从入门到高手9.1节-Python中的字典类型大神薯条老师 Python从入门到高手 python 数据分析机器学习爬虫网络爬虫深度学习
目录9.1.1理解字典类型9.1.2字典的类型名9.1.3字典的定义9.1.4字典的主要性质9.1.5好好学习，天天向上9.1.1理解字典类型在日常生活中，我们常常会接触到“字典”这种数据类型，例如一本书籍的目录结构，在目录结构中，通过查找页码，就可以快速翻到指定的页面。如果没有这样的页码，那么我们必须从书籍的第一页开始，一页一页地查找。有了页码以后，直接翻到指定的页面。在Python中，可以通过
2022-02-25night 和佛陀去赏花
王冬冬，中原焦点团队讲师、心理咨询师，持续记录1539天（2022.2.25）晴农历正月廿五，壬寅虎年壬寅月初己酉日，雨水二候第2天。八九第4天。读书打卡第1329天：《惠此中国》朗诵记录第1330天：诵读第191第5天，《玄古遺秘》、绕口令练习、诗歌朗诵下班后去看看小侄女，小家伙生病了，连续两夜大人小孩都没睡好。见到娃，精神状态还好，小孩子还是能抗呀。不过晚饭后不多时，就开始有些没精神了。老妈说
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Github 2024-06-07开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目3C++项目3JavaScript项目2JupyterNotebook项目1TypeScript项目1Vue项目1比特币核心：开源比特币软件创建周期：4919天开发语言：C++协议类型：MITLicenseStar数量：76760个F
Webpack构建流程详解 TEN01Y webpack webpack 前端 node.js
Webpack的构建流程从一个或多个入口文件开始，递归分析项目中所有的依赖，最后将这些依赖打包成一个或多个输出文件。这个过程包括很多步骤，每个步骤都有特定的任务，Loader和Plugin可以插入到这些步骤中以完成文件转换或扩展功能。以下我会详细说明Webpack的整个构建流程，包括从初始化配置到生成最终的打包结果。1.初始化（Initialization）Webpack的打包流程从初始化开始，它
在游戏中学认颜色秦璐高实幼
形式新颖，颜色鲜艳丰富，过程耐玩有趣的玩教具不仅能够激发着孩子的探究兴趣和欲望，还能培养孩子的美感。用游戏的形式带孩子区分不同的颜色，是教孩子认识事物、发展智力，培养美感不可缺少的内容。通过观察发现，处于三岁这一年龄阶段的小班幼儿存在着无法区分颜色，无法认识颜色，或者知道这是什么颜色但是说不上来的情况。颜色对于他们来说还是一个抽象的词汇，那么怎样教孩子愉快的认识颜色，区分颜色，说出颜色呢？在《好吃
LangChain教程13：LangChain自定义会话管理和Retriever Cachel wood LLM和AIGC langchain jvm Imagen 人工智能 agent
文章目录如何自定义会话管理如何创建自定义Retriever如何自定义会话管理之前我们已经介绍了如何添加会话历史记录，但我们仍在手动更新对话历史并将其插入到每个输入中。在真正的问答应用程序中，我们希望有一种持久化对话历史的方式，并且有一种自动插入和更新它的方式。为此，我们可以使用：BaseChatMessageHistory:存储对话历史。RunnableWithMessageHistory:LCE
LangGraph 教程：初学者综合指南（1）背太阳的牧羊人 langgraph langchain langgraph
关键概念图结构LangGraph设计的核心是基于图形的应用程序工作流程表示。该图包含两个主要元素：节点-工作的构建块：LangGraph中的每个节点代表应用程序中的一个不同的工作或操作单元。这些节点本质上是封装特定任务的Python函数。此任务可能涉及多种操作，例如：与LLM直接沟通，进行文本生成、摘要或其他基于语言的任务。与外部工具和API交互以获取数据或在现实世界中执行操作。通过格式化、过滤或
[设计模式]C++单例模式的几种写法以及通用模板不愧是你呀 C++开发语言 c++单例模式个人开发
之前在这篇文章中简单的介绍了一下单例模式的作用和应用C++中单例模式详解_c++单例模式的作用-CSDN博客，今天我将在在本文梳理单例模式从C++98到C++11及以后的演变过程，探讨其不同实现方式的优劣，并介绍在现代C++中的最佳实践。什么是单例模式？简单来说，单例模式（SingletonPattern）是一种设计模式，它能保证一个类在整个程序运行期间，只有一个实例存在。这种唯一性的保证在特定场
day16|与自我辩驳：如何突破防御型思维的操控威Sir漫话
见如实描述所看到现象、内容、观点。感记录下思想变化，看到这个观点前怎么想，看到后怎么想，找到中间落差上周五和几个小伙伴聊起了自卑，大家聊完发现，自卑原来发生在很多人的身上。现场有一位很优秀的创业者，拿到了四百万的融资，还有一个非常具有凝聚力的小团队，可以说事业蒸蒸日上。令我们感到惊讶的是，自卑这个话题正是他先打开的。像这么一位优秀的创业者，怎么会有自卑情绪呢？聊完后发现，原来他经常参加一些常人眼中
HTTP1-HTTP2-HTTP3简要概述 lvchaoq 网络网络协议 http
文章目录HTTP1.xHTTP1.0HTTP1.1HTTP2.0http3.0HTTP1.xHTTP1.0HTTP1.0浏览器与服务器只保持短暂的连接，每次请求都需要与服务器建立一个TCP连接。服务器完成请求处理后立即断开TCP连接，服务器不跟踪每个客户也不记录过去的请求。HTTP1.1在HTTP1.1中，默认支持长连接（Connection:keep-alive），即在一个TCP连接上可以传送多
LangGraph教程6：LangGraph工作流人机交互 Cachel wood LLM和AIGC 人机交互 java 前端 langchain langgraph 开发语言数据库
文章目录Human-in-the-loop(人机交互)interruptWarningHuman-in-the-loop(人机交互)人机交互（或称“在循环中”）工作流将人类输入整合到自动化过程中，在关键阶段允许决策、验证或修正。这在基于LLM的应用中尤其有用，因为基础模型可能会产生偶尔的不准确性。在合规、决策或内容生成等低误差容忍场景中，人类的参与通过允许审查、修正或覆盖模型输出来确保可靠性。使用
Python 应用程序分发全指南：从基础到高级工具与实践面朝大海，春不暖，花不开 Python基础 python 开发语言
文章大纲引言在现代软件开发中，Python因其简洁的语法和强大的生态系统而广受欢迎。然而，将Python应用程序从开发者手中传递给最终用户并非总是简单的过程。分发Python应用程序涉及到诸多挑战，例如依赖管理、跨平台兼容性以及用户环境的多样性。如果分发不当，用户可能面临安装失败或运行错误等问题，从而影响软件的使用体验。本文将深入探讨Python应用程序分发的各种方法，从最基础的源代码分享到现代标
webpack将组件vue进行编译混淆，并能正常使用编译之后的文件 web前端神器 vue.js 前端 javascript
介绍：我们在开发的过程中有很多组件都需要复用，特别是我们耗费了好几天时间写出来的组件，比如自己写的表格组件，流程图组件等。总之都是自己不断测试，不断编写耗费了大把的精力写的。直接用到自己的项目中倒是无所谓，如果是把自己写的组件给别人，这里就涉及到自己的劳动成功了，特别是项目尾款还没到账的情况下，代码都给别人了对自己是很不利的。所以这节课的内容很重要，教大家如何将自己的写的vue组件用webpack
3月8日，第②期"教育行走一起写吧"挑战300天活动第220天文章汇总小尘老师
3月8日，第②期"教育行走一起写吧"挑战300天活动第220天。我们的任务:每天一记录(500字以上自由写作)，每月一精品(2000字以上主题作文)我们的标准动作:写文（推荐）+挑战群中接龙（字数、题目+链接）+“教育行走一起写吧”小打卡圈打卡(字数、标题、内容)。每月精品文还需要登记在腾讯文档(链接入口查看群公告)2022年3月份主题文：“公益”(2000字以上精品文)特别提醒:打卡和接龙要求加
DHCP与DHCP中继--原理与配置--华为实验--配置接口模式、全局模式以及中继模式
文章目录一、DHCP1.概述2.优点3.应用4.交互过程5.配置方法5.1接口模式5.2全局模式二、DHCP中继1.应用场景2.工作原理3.配置DHCP中继服务器4.配置DHCP服务器三、接口模式配置拓扑图R1PC四、全局模式拓扑图R1PC五、中继模式拓扑图R1R2R3PC一、DHCP1.概述DHCP(DynamicHostConfigurationProtocol,动态主机配置协议)是一个局域网
轻松拿捏Anaconda安装，Python开发快人一步奔跑吧邓邓子必备核心技能 python 开发语言 Anaconda 科学计算
目录一、Anaconda是什么1.1包管理与环境管理1.2预装丰富的科学计算库二、为什么选择Anaconda2.1简化依赖管理2.2避免版本冲突2.3丰富的库资源2.4适合的应用场景三、安装前准备3.1确认系统要求3.2下载安装包四、Windows系统安装步骤4.1运行安装程序4.2许可协议4.3选择安装类型4.4选择安装路径4.5高级选项4.6安装完成五、MacOS系统安装步骤5.1下载安装包5
BGP服务器该如何处理不同的路由策略？ wanhengidc 服务器运维
BGP（边界网关协议）是现在互联网社会中的重要基石，主要功能是在不同的自治系统之间交换路由信息，为了能够保障数据流畅稳定的传输，BGP服务器需要对于各种路由策略进行灵活的处理，那么对于不同的路由策略BGP服务器该怎样进行处理呢？BGP服务器在运行的过程中，在选择最佳的路由路径时会考虑到多个属性，BGP会优先选择具有最高本地优先级的路由，当多个路由都具有相同的优先级，则会优先选择经过最少自治系统的路
与艾滋有关大自然不会徒劳地做任何事情
海报设计：韩磊剧场与牟森的实验戏剧焦洱1前两年曾给一个德国朋友画过一张北京的剧场分布图。在画图的过程中我有些吃惊地发现，北京的剧场，至少是大部分在北京当代话剧演出史上扮演过重要⻆色的剧场，竟然主要聚集在从⻓安街到平安大道南北跨度不超过五公里、东⻄狭长的区域之内。我甚至觉得我可以这样说:北京的话剧(包括小剧场运动)从上个世纪80年代中期到新世纪初这二十年由衰而盛再由盛而衰的整个过程，大体上是在这个狭
mavlink python 彩云的笔记 linux 无人驾驶 mavlink
frompymavlinkimportmavutil#Createtheconnectionm=mavutil.mavlink_connection('udpin:0.0.0.0:14550')dir(m.mav)['_MAVLink__callbacks','_MAVLink__parse_char_legacy','_MAVLink__parse_char_native','__class__
0504小确幸懒惰的妮子
文／5109妮子看了多本致用类的书，写了好长时间的清单，感觉自己都不会也写不好其他文章了。慢下来，记录一下生活中让自己感觉幸福的瞬间吧！1.上次休假回来，跟妈妈一起种向日葵、甜瓜。洋洋非得一起种，然后，就变成了妈妈努力种植，我和洋洋捣乱的情况。洋洋挥舞着自己的小铲子，脸上尽是认真的神色，挖好小洞之后，背着自己的水枪浇水，每个坑都被他浇太多水，半天水都渗不下去。等到能放种子的时候，他又要自己来，一下
《用上位机控制无人机：Python+MAVLink协议飞行实验》欧振芳 python
1.实验目标-通过Python编写的上位机程序，基于MAVLink协议控制无人机（如PX4/ArduPilot固件的无人机）。-实现基础飞行指令：解锁、起飞、悬停、降落。-探索MAVLink消息的构造与解析机制。2.实验环境准备硬件-无人机硬件：支持MAVLink协议的飞控（如Pixhawk系列）。-通信链路：USB直连、数传电台（3DRRadio）或WiFi（如通过UDP）。-安全环境：空旷无干
一次Python与STK12.2联合仿真
（一）软件准备：STK12.2是在某宝上花钱买的。我个人在安装软件上，更偏向于能用钱解决的就用钱解决，无论是商家远程安装还是自己按照商家的步骤安装，效率都更高，而自己从网上找免费的渠道安装软件费时费力还不一定能成功。Python是自己按照版本对应关系下载的，我使用的Python版本是3.10.9。我是在PycharmCommunityEdition2023.1.1上进行编程。（二）STK12与Py
《Python 项目 CI/CD 实战指南：从零构建自动化部署流水线》清水白石008 课程教程学习笔记开发语言 python ci/cd 自动化
《Python项目CI/CD实战指南：从零构建自动化部署流水线》一、引言：为什么Python项目需要CI/CD？在现代软件开发中，CI/CD（持续集成/持续部署）已成为不可或缺的工程实践。它不仅提升了开发效率，还显著降低了部署风险。对于Python项目而言，CI/CD的价值尤为突出：✅自动化测试确保代码质量✅快速部署加速产品迭代✅与云平台、容器技术无缝集成✅支持多版本、多环境的灵活发布Python
使用python调用STK12.2并实现霍曼转移 AndyVictory python 开发语言
使用STK的PythonAPI和Astrogator模块来创建一个简单的霍曼转移轨道场景（从近地轨道转移到地球同步轨道）:1、创建一个新的场景并添加一个卫星。2、定义卫星的初始状态（近地轨道的参数）。3、传播近地轨道。4、使用目标序列和DV1机动将卫星转移到转移椭圆轨道。5、传播转移椭圆轨道到远地点。6、使用目标序列和DV2机动将卫星转移到外部轨道（地球同步轨道）。7、传播外部轨道。8、运行任务控
对话新希望CDO李旭昶：立足核心诉求，积极拥抱人工智能
“转型焕新，希望无限。”整理|王娴编辑|云舒出品｜极新4月12日，在「2024飞书先进生产力峰会|成都站」活动中，新希望首席数字官李旭昶先生做了主题为“转型焕新，希望无限”的分享。上次见他是4个月前，当时我们聊了1个多小时，内容涉及数字化转型、人工智能、管理、技术商业等话题。今天顺着他分享的内容，将这篇对话分享出来。随着信息科技的发展，我国传统企业在过去几年中逐步进行数字化转型，利用先进的科学技术
基于STM32单片机车牌识别系统摄像头图像处理设计的论文 weixin_112233 单片机单片机 stm32 图像处理
摘要本设计提出了一种基于32单片机的车牌识别系统摄像头图像处理方案。该系统主要由STM32F103RCT6单片机核心板、2.8寸TFT液晶屏显示、摄像头图像采集OV7670、蜂鸣器以及LED电路组成。在车牌识别过程中，STM32F103RCT6单片机核心板发挥着关键的控制作用。摄像头图像采集OV7670负责获取车辆的图像信息，能够清晰地捕捉车牌区域。采集到的图像数据传输至单片机进行处理，通过一系列
二维码：理解二维码 / 生成二维码 / 小程序支持哪种类型的二维码 / 小程序识别GS1码快雪时晴-初晴融雪前端前端
一、理解二维码1.1、概念二维码（2-dimensionalbarcode），又称二维条码，最早发源于日本，它是用某种特定的几何图形按一定规律在平面（二维方向上）分布的黑白相间的图形记录数据符号信息的；在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念，使用若干个与二进制相对应的几何形体来表示文字数值信息，通过图象输入设备或光电扫描设备自动识读以实现信息自动处理。它具有条码技
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(