程序_丸

【机器学习项目】使用 PyTorch 预测汽车价格（详细报告+代码详解）

【机器学习项目】使用 PyTorch 预测汽车价格（详细报告）

一、实验背景
二、模型介绍
三、数据集介绍
四、使用 PyTorch 预测汽车价格
- 1. 导入库
- 2. 读取数据集
- 3. 数据处理
- 4. 数据准备
- 5. 创建 PyTorch 模型
- 6. 训练模型
- 7. 使用模型预测汽车价格

一、实验背景

随着机器学习和人工智能的迅速发展，预测模型在各个领域的应用变得越来越广泛。其中，预测汽车价格是一个重要且实用的应用领域。准确地预测汽车价格对于汽车制造商、经销商和消费者来说都具有重要意义。
传统的汽车定价模型通常基于经验公式和统计方法，而现代的机器学习方法则提供了更强大的工具来进行汽车价格预测。PyTorch是一个流行的开源深度学习框架，它提供了丰富的工具和功能，可以用于构建和训练各种类型的神经网络模型。
本实验旨在使用PyTorch构建一个预测汽车价格的模型。通过训练一个深度神经网络模型，我们可以利用汽车的各种特征（如品牌、型号、年份、里程数等）来预测汽车的价格。这将为汽车制造商和消费者提供一个有价值的工具，帮助他们做出更准确的定价和购买决策。

二、模型介绍

PyTorch是一个开源的Python机器学习框架，由Facebook的人工智能研究团队开发和维护。它提供了丰富的工具和库，用于构建深度学习模型并进行高效的训练。
下面是PyTorch的一些重要特点和概念：

动态计算图：PyTorch使用动态计算图，这意味着计算图是在运行时动态生成的。这使得PyTorch更加灵活，可以通过简单的Python控制流语句进行模型定义和操作。与静态计算图相比（如TensorFlow），动态计算图使得调试和模型迭代更加直观和容易。
张量操作：PyTorch提供了一套丰富的张量操作函数，类似于NumPy数组操作。张量是PyTorch的核心数据结构，类似于多维数组，可以存储和处理数字数据。通过PyTorch的张量操作，可以执行各种数学运算、索引和切片操作，以及与其他张量之间的运算。
自动求导：PyTorch的自动求导机制是其重要的特性之一。通过设置requires_grad属性，可以跟踪张量上的操作，并自动计算梯度。这使得在训练神经网络时，可以方便地计算损失函数相对于模型参数的梯度，从而进行反向传播和优化。
神经网络模块：PyTorch提供了一个模块化和可扩展的接口，用于构建神经网络模型。可以通过继承torch.nn.Module类来定义自己的模型，并在其中定义前向传播函数。这个接口简化了模型的定义和组织，并提供了许多内置的层和函数，如卷积层、全连接层、激活函数等。
数据加载和预处理：PyTorch提供了一系列用于加载和处理数据的工具。torchvision库提供了常用的计算机视觉数据集的加载和预处理函数，而torchtext库则专注于自然语言处理任务的数据处理。此外，PyTorch还提供了DataLoader类，用于批量加载和迭代数据，方便进行训练和验证。
分布式训练支持：PyTorch支持分布式训练，允许在多个GPU或多台机器上进行模型的并行训练。它提供了用于多进程和多线程训练的工具，并通过torch.nn.DataParallel和torch.nn.DistributedDataParallel模块简化了模型的并行化。
丰富的生态系统：PyTorch拥有庞大而活跃的社区，提供了各种扩展和库，用于模型压缩、模型解释性、迁移学习等领域。此外，PyTorch还与其他流行的Python库（如NumPy和SciPy）以及深度学习框架（如TensorFlow）之间有良好的互操作性。

PyTorch是一个灵活而强大的深度学习框架，它结合了动态计算图、自动求导和丰富的工具集，使得构建和训练深度学习模型变得简单而高效。

三、数据集介绍

本实验采用一个二手汽车的数据集，这个数据集包含了二手汽车的信息。该实验数据集可点击该百度网盘链接获取：数据集链接。该数据集有 258 行和 9 列，每一行代表一辆汽车，每一列代表不同的属性。以下是每列的属性说明：

• Car_Name: 汽车的名称或型号
• Year: 汽车的制造年份
• Selling_Price: 汽车的销售价格（单位：万卢比）
• Present_Price: 汽车的当前价格（新车价格，单位：万卢比）
• Kms_Driven: 汽车已行驶的公里数
• Fuel_Type: 汽车的燃料类型（如汽油、柴油、CNG等）
• Seller_Type: 卖家类型（个人或经销商）
• Transmission: 汽车的变速器类型（手动或自动）
• Owner: 汽车的所有者数量

其中"Selling_Price"是目标变量。通过对这些特征进行分析，可以了解二手汽车市场的趋势、不同特征与销售价格之间的关系以及其他相关信息。

四、使用 PyTorch 预测汽车价格

1. 导入库

import torch
import jovian
import torch.nn as nn
import pandas as pd
import matplotlib.pyplot as plt
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset, random_split

代码解释：
这段代码导入了一些常用的Python库和模块，并且提供了一些数据处理和机器学习的功能。下面是对每行代码的详细解释：

import torch: 导入PyTorch库，PyTorch是一个用于机器学习的开源深度学习框架。
import jovian: 导入Jovian库，Jovian是一个用于记录和分享机器学习实验的库。
import torch.nn as nn: 导入PyTorch中的nn模块，该模块提供了构建神经网络的类和函数。
import pandas as pd: 导入Pandas库，Pandas是一个用于数据分析和处理的库。
import matplotlib.pyplot as plt: 导入Matplotlib库，Matplotlib是一个用于绘制图表和可视化数据的库。
import torch.nn.functional as F: 导入PyTorch中的functional模块，该模块提供了一些常用的函数，如激活函数。
from torch.utils.data import DataLoader, TensorDataset, random_split: 从PyTorch的utils.data模块中导入DataLoader、TensorDataset和random_split类。DataLoader用于加载数据集，TensorDataset用于创建包含输入和目标张量的数据集，random_split用于将数据集随机划分为训练集和验证集。

2. 读取数据集

现在，让我们读取数据：

dataframe_raw = pd.read_csv( "car_data.csv")
dataframe_raw.head()

运行结果如下：

代码解释：

pd.read_csv("car_data.csv") 使用 Pandas 库的 read_csv() 函数读取名为 “car_data.csv” 的CSV文件，并将文件中的数据解析为一个 DataFrame 对象。DataFrame 是 Pandas 中用于存储和操作表格数据的数据结构。
dataframe_raw.head() 显示 DataFrame 对象 dataframe_raw 的前几行数据，默认显示前5行。这个方法可以帮助你快速查看数据的结构和内容。

这段代码读取名为 “car_data.csv” 的CSV文件，并将其内容存储在 dataframe_raw 变量中，然后显示数据的前几行。

3. 数据处理

your_name = "ChengxuWan" # at least 5 characters
def customize_dataset(dataframe_raw, rand_str):
    dataframe = dataframe_raw.copy(deep=True)
    # drop some rows
    dataframe = dataframe.sample(int(0.95*len(dataframe)), random_state=int(ord(rand_str[0])))
    # scale input
    dataframe.Year = dataframe.Year * ord(rand_str[1])/100.
    # scale target
    dataframe.Selling_Price = dataframe.Selling_Price * ord(rand_str[2])/100.
    # drop column
    if ord(rand_str[3]) % 2 == 1:
        dataframe = dataframe.drop(['Car_Name'], axis=1)
    return dataframe

dataframe = customize_dataset(dataframe_raw, your_name)
dataframe.head()

运行结果如下：

代码解释：
这段代码定义了一个名为 customize_dataset 的函数，该函数根据输入的 dataframe_raw 和 rand_str 参数进行数据处理和定制，然后返回处理后的数据。
以下是对每行代码的详细解释：

your_name = "ChengxuWan"：定义了一个名为 your_name 的变量，并将其设置为字符串 “ChengxuWan”。此变量用于作为处理数据集的随机种子。
def customize_dataset(dataframe_raw, rand_str):：定义了一个名为 customize_dataset 的函数，该函数接受两个参数 dataframe_raw 和 rand_str，用于进行数据集的处理和定制。
dataframe = dataframe_raw.copy(deep=True)：创建了一个名为 dataframe 的变量，将 dataframe_raw 的副本复制给它。这样做是为了避免直接修改原始数据。
dataframe = dataframe.sample(int(0.95*len(dataframe)), random_state=int(ord(rand_str[0])))：通过使用 sample() 方法从数据集中随机选择一部分数据进行采样。采样数量为原始数据集长度的 95%（即抽取 95% 的数据），并使用 random_state 参数设置随机种子为 ord(rand_str[0]) 的 ASCII 值。
dataframe.Year = dataframe.Year * ord(rand_str[1])/100.：对 dataframe 中的 “Year” 列进行缩放处理，将其乘以 ord(rand_str[1]) 的 ASCII 值除以 100。
dataframe.Selling_Price = dataframe.Selling_Price * ord(rand_str[2])/100.：对 dataframe 中的 “Selling_Price” 列进行缩放处理，将其乘以 ord(rand_str[2]) 的 ASCII 值除以 100。
if ord(rand_str[3]) % 2 == 1:：根据 ord(rand_str[3]) 的 ASCII 值是否为奇数，判断是否执行以下代码块。
dataframe = dataframe.drop(['Car_Name'], axis=1)：从 dataframe 中删除 “Car_Name” 列，axis=1 表示删除的是列而不是行。
return dataframe：返回处理后的数据集 dataframe。
dataframe = customize_dataset(dataframe_raw, your_name)：调用 customize_dataset 函数，并将 dataframe_raw 和 your_name 作为参数传递给它，将返回的处理后的数据集赋值给 dataframe。
dataframe.head()：显示 dataframe 的前几行数据，用于查看处理后的数据集的结构和内容。

在上面的这个函数中，我们删除对预测没有帮助的列，这里我们删除汽车名称。同时我们看到它需要一个词作为随机字符串来随机排序数据，我使用我的名字作为随机字符串。之后我们可以使用自定义数据集，为简单起见，我们可以创建包含行数、列数的变量和包含数字、分类或输出列的变量：

input_cols = ["Year","Present_Price","Kms_Driven","Owner"] 
categorical_cols = ["Fuel_Type","Seller_Type","Transmission"] 
output_cols = ["Selling_Price"]

4. 数据准备

我们将使用 PyTorch 通过机器学习预测汽车价格，因此要使用数据进行训练，我们需要将其从数据帧转换为 PyTorch 张量，第一步是转换为 NumPy 数组：

def dataframe_to_arrays(dataframe):
    # Make a copy of the original dataframe
    dataframe1 = dataframe.copy(deep=True)
    # Convert non-numeric categorical columns to numbers
    for col in categorical_cols:
        dataframe1[col] = dataframe1[col].astype('category').cat.codes
    # Extract input & outupts as numpy arrays
    inputs_array = dataframe1[input_cols].to_numpy()
    targets_array = dataframe1[output_cols].to_numpy()
    return inputs_array, targets_array

代码解释：
这段代码定义了一个名为 dataframe_to_arrays 的函数，这个函数的作用是将数据集中的非数值型分类列转换为数字编码，并将输入特征和目标列提取为 NumPy 数组，以便于后续的数据处理和模型训练。以下是对每行代码的详细解释：

def dataframe_to_arrays(dataframe):：定义了一个名为 dataframe_to_arrays 的函数，该函数接受一个参数 dataframe，表示输入的数据集。
dataframe1 = dataframe.copy(deep=True)：创建了一个名为 dataframe1 的变量，将输入的数据集 dataframe 的副本复制给它。这样做是为了避免直接修改原始数据。
for col in categorical_cols:：对于分类特征列表 categorical_cols 中的每一列名 col，执行以下代码块。
dataframe1[col] = dataframe1[col].astype('category').cat.codes：将数据集中的非数值型分类列转换为数字编码。首先，使用 astype('category') 将列的数据类型转换为 Pandas 中的 categorical 类型，然后使用 cat.codes 将每个分类值映射为相应的数字编码。这样可以将非数值型的分类数据转换为数值型，便于后续处理。
inputs_array = dataframe1[input_cols].to_numpy()：将经过转换后的输入特征列提取为一个 NumPy 数组，赋值给 inputs_array。input_cols 列表指定了要提取的输入特征列。
targets_array = dataframe1[output_cols].to_numpy()：将经过转换后的目标列提取为一个 NumPy 数组，赋值给 targets_array。output_cols 列表指定了要提取的目标列。
return inputs_array, targets_array：返回转换后的输入特征数组 inputs_array 和目标数组 targets_array。

inputs_array, targets_array = dataframe_to_arrays(dataframe)
inputs_array, targets_array

运行结果如下：

代码解释：
这段代码调用了 dataframe_to_arrays 函数，并将返回的输入特征数组赋值给 inputs_array，目标数组赋值给 targets_array。然后，通过打印 inputs_array 和 targets_array，我们可以查看转换后的输入特征数组和目标数组的内容。

现在有了这些数组，我们可以将它们转换为 PyTorch 张量，并使用这些张量创建包含它们的可变数据集：

inputs = torch.Tensor(inputs_array)
targets = torch.Tensor(targets_array)

dataset = TensorDataset(inputs, targets)
train_ds, val_ds = random_split(dataset, [228, 57])
batch_size = 128

train_loader = DataLoader(train_ds, batch_size, shuffle=True)
val_loader = DataLoader(val_ds, batch_size)

代码解释：
这段代码使用转换后的输入特征数组 inputs_array 和目标数组 targets_array 创建了一个 PyTorch 的数据集对象 dataset。以下是对每行代码的详细解释：

inputs = torch.Tensor(inputs_array)：将输入特征数组 inputs_array 转换为 PyTorch 的张量对象 inputs。torch.Tensor() 函数用于将数据转换为张量对象，以便在 PyTorch 中进行处理。
targets = torch.Tensor(targets_array)：将目标数组 targets_array 转换为 PyTorch 的张量对象 targets，同样使用 torch.Tensor() 函数进行转换。
dataset = TensorDataset(inputs, targets)：使用转换后的输入特征张量 inputs 和目标张量 targets 创建了一个名为 dataset 的 PyTorch 数据集对象 TensorDataset。TensorDataset 可以用于在训练和验证过程中批量加载数据。
train_ds, val_ds = random_split(dataset, [228, 57])：使用 random_split() 函数将 dataset 数据集随机划分为训练集和验证集。参数 [228, 57] 表示划分比例，其中训练集占比 228/(228+57)，验证集占比 57/(228+57)。返回的 train_ds 和 val_ds 分别表示划分后的训练集和验证集。
batch_size = 128：定义了批量训练的批次大小，即每次从数据加载器中获取的样本数。
train_loader = DataLoader(train_ds, batch_size, shuffle=True)：创建了一个训练集的数据加载器 train_loader。数据加载器用于按照批次加载训练数据。train_ds 表示要加载的训练集数据，batch_size 表示每个批次的样本数，shuffle=True 表示在每个 epoch 开始时随机打乱数据顺序。
val_loader = DataLoader(val_ds, batch_size)：创建了一个验证集的数据加载器 val_loader。与训练集的数据加载器类似，用于按照批次加载验证数据。val_ds 表示要加载的验证集数据，batch_size 表示每个批次的样本数。

通过以上步骤，您已经将转换后的数据集划分为训练集和验证集，并创建了相应的数据加载器，以便在模型训练过程中使用批量数据进行训练和验证。

5. 创建 PyTorch 模型

现在，我们将使用 PyTorch 创建一个线性回归模型来预测汽车价格：

input_size = len(input_cols)
output_size = len(output_cols)

class CarsModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(input_size, output_size)                
        
    def forward(self, xb):
        out = self.linear(xb)                          
        return out
    
    def training_step(self, batch):
        inputs, targets = batch 
        # Generate predictions
        out = self(inputs)          
        # Calcuate loss
        loss = F.l1_loss(out, targets)                         
        return loss
    
    def validation_step(self, batch):
        inputs, targets = batch
        # Generate predictions
        out = self(inputs)
        # Calculate loss
        loss = F.l1_loss(out, targets)                          
        return {'val_loss': loss.detach()}
        
    def validation_epoch_end(self, outputs):
        batch_losses = [x['val_loss'] for x in outputs]
        epoch_loss = torch.stack(batch_losses).mean()  
        return {'val_loss': epoch_loss.item()}
    
    def epoch_end(self, epoch, result, num_epochs):
        # Print result every 20th epoch
        if (epoch+1) % 20 == 0 or epoch == num_epochs-1:
            print("Epoch [{}], val_loss: {:.4f}".format(epoch+1, result['val_loss']))

model = CarsModel()
list(model.parameters())

运行结果如下：

代码解释：
这段代码定义了一个名为 CarsModel 的类，它是一个继承自 nn.Module 的神经网络模型。以下是对每行代码的详细解释：

input_size = len(input_cols)：通过使用 len(input_cols)，获取输入特征列表 input_cols 的长度，即输入特征的数量。len() 函数用于计算列表中元素的数量。
output_size = len(output_cols)：通过使用 len(output_cols)，获取输出列列表 output_cols 的长度，即输出列的数量。
class CarsModel(nn.Module):：定义了一个名为 CarsModel 的类，它继承自 nn.Module 类，表示这是一个神经网络模型。
def __init__(self):：定义了 CarsModel 类的构造函数。在构造函数中进行模型的初始化操作。
super().__init__()：调用父类 nn.Module 的构造函数，以确保正确地初始化模型。
self.linear = nn.Linear(input_size, output_size)：定义了模型中的线性层 self.linear，它是一个全连接层 (nn.Linear)，输入大小为 input_size，输出大小为 output_size。这一层用于将输入特征映射到输出列。
def forward(self, xb):：定义了模型的前向传播函数。xb 表示输入数据的批量，通过该函数将输入数据传递到模型中进行计算。
out = self.linear(xb)：在前向传播函数中，通过调用线性层 self.linear 将输入数据 xb 进行线性变换和激活函数操作，得到输出 out。
def training_step(self, batch):：定义了模型的训练步函数。batch 表示一个批次的训练数据。
inputs, targets = batch：从训练数据批次中获取输入特征和目标值。
out = self(inputs)：通过调用 self(inputs) 执行模型的前向传播，得到模型的预测结果。
loss = F.l1_loss(out, targets)：使用平均绝对误差损失函数 (F.l1_loss) 计算模型的训练损失。
def validation_step(self, batch):：定义了模型的验证步函数。batch 表示一个批次的验证数据。
inputs, targets = batch：从验证数据批次中获取输入特征和目标值。
out = self(inputs)：通过调用 self(inputs) 执行模型的前向传播，得到模型的预测结果。
loss = F.l1_loss(out, targets)：使用平均绝对误差损失函数 (F.l1_loss) 计算模型的验证损失。
def validation_epoch_end(self, outputs):：定义了模型的验证轮结束函数。outputs 是一个列表，包含每个验证步函数返回的损失。
batch_losses = [x['val_loss'] for x in outputs]：从输出列表中提取每个验证步函数返回的损失值。
epoch_loss = torch.stack(batch_losses).mean()：计算所有批次的平均损失，将每个批次的损失堆叠为张量，然后计算其均值。
return {'val_loss': epoch_loss.item()}：返回包含验证损失的字典。
def epoch_end(self, epoch, result, num_epochs):：定义了模型的轮结束函数。epoch 表示当前轮数，result 是包含验证损失的字典，num_epochs 表示总轮数。
(epoch+1) % 20 == 0 or epoch == num_epochs-1：判断是否是每 20 轮或最后一轮，用于控制输出的频率。
print("Epoch [{}], val_loss: {:.4f}".format(epoch+1, result['val_loss']))：打印当前轮数和验证损失。
model = CarsModel()：创建一个 CarsModel 类的实例，即实例化一个神经网络模型对象。
list(model.parameters())：返回模型中所有可学习参数的列表。这些参数将在模型训练过程中更新以优化模型的性能。

在上述函数中，我使用了nn.Linear函数，它允许我们使用线性回归，现在我们可以使用F.l1_loss函数计算预测和损失，可以看到权重参数和偏置参数。通过这个模型，我们可以得到预测值，但仍需要进行训练。

6. 训练模型

现在我们需要评估损失并查看损失有多少，并在进行训练后查看损失随着训练减少了多少：

# Eval algorithm
def evaluate(model, val_loader):
    outputs = [model.validation_step(batch) for batch in val_loader]
    return model.validation_epoch_end(outputs)

# Fitting algorithm
def fit(epochs, lr, model, train_loader, val_loader, opt_func=torch.optim.SGD):
    history = []
    optimizer = opt_func(model.parameters(), lr)
    for epoch in range(epochs):
        # Training Phase 
        for batch in train_loader:
            loss = model.training_step(batch)
            loss.backward()
            optimizer.step()
            optimizer.zero_grad()
        # Validation phase
        result = evaluate(model, val_loader)
        model.epoch_end(epoch, result, epochs)
        history.append(result)
    return history

# Check the initial value that val_loss have
result = evaluate(model, val_loader)
print(result)

运行结果如下：

代码解释：
首先，这段代码定义了两个函数：evaluate 和 fit，用于评估和训练模型。然后，它调用了 evaluate 函数来计算模型在验证集上的初始性能。

def evaluate(model, val_loader):：定义了评估函数 evaluate，接受一个模型和一个验证数据加载器作为输入。
outputs = [model.validation_step(batch) for batch in val_loader]：通过迭代验证数据加载器中的每个批次，调用模型的 validation_step 函数，计算每个批次的验证损失，并将结果存储在列表 outputs 中。
return model.validation_epoch_end(outputs)：调用模型的 validation_epoch_end 函数，传递验证步的结果列表 outputs，该函数计算验证损失的平均值，并返回包含验证损失的字典。

接下来，定义了训练函数 fit，用于执行模型的训练过程。

def fit(epochs, lr, model, train_loader, val_loader, opt_func=torch.optim.SGD):：定义了训练函数 fit，接受训练轮数 epochs、学习率 lr、模型 model、训练数据加载器 train_loader、验证数据加载器 val_loader 和优化器函数 opt_func（默认为随机梯度下降优化器 torch.optim.SGD）作为输入。
history = []：创建一个空列表 history，用于存储训练过程中的验证结果。
optimizer = opt_func(model.parameters(), lr)：使用给定的优化器函数 opt_func 和学习率 lr 初始化优化器 optimizer，将模型的可学习参数 model.parameters() 传递给优化器。
for epoch in range(epochs):：迭代每个训练轮数。
for batch in train_loader:：迭代训练数据加载器中的每个批次。
loss = model.training_step(batch)：调用模型的 training_step 函数，计算训练损失。
loss.backward()：执行反向传播，计算损失相对于模型参数的梯度。
optimizer.step()：使用优化器更新模型参数，优化模型的性能。
optimizer.zero_grad()：清零模型参数的梯度，以便下一轮的反向传播。
result = evaluate(model, val_loader)：在每个训练轮结束后，调用评估函数 evaluate，计算模型在验证集上的性能。
model.epoch_end(epoch, result, epochs)：在每个训练轮结束后，调用模型的 epoch_end 函数，打印当前轮数和验证损失。
history.append(result)：将验证结果添加到历史记录列表 history 中。
return history：返回历史记录列表。

最后，检查模型在初始状态下的验证损失。

result = evaluate(model, val_loader)：调用 evaluate 函数，计算模型在验证集上的性能，并将结果存储在 result 中。
print(result)：打印初始验证损失，结果为 {'val_loss': 10644.4658203125}。

这段代码定义了评估和训练函数，用于评估模型在验证集上的性能和训练模型的参数。它通过迭代训练数据的批次来更新模型参数，并在每个训练轮结束后计算模型在验证集上的损失。

# Start with the Fitting
epochs = 4000
lr = 1e-8
history1 = fit(epochs, lr, model, train_loader, val_loader)

运行结果如下：

代码解释：
在这段代码中，我们定义了训练的轮数 epochs 为4000，学习率 lr 为 1e-8，并调用了 fit 函数来执行模型的训练过程。

history1 = fit(epochs, lr, model, train_loader, val_loader)：调用 fit 函数开始训练过程，并将训练轮数 epochs、学习率 lr、模型 model、训练数据加载器 train_loader 和验证数据加载器 val_loader 传递给函数。训练过程的结果将存储在 history1 列表中。

在训练过程中，每经过 20 轮训练，或者是最后一轮训练时，会打印出当前轮数和验证损失。

model.epoch_end(epoch, result, epochs)：在每个训练轮结束后，调用模型的 epoch_end 函数，打印当前轮数和验证损失。

这些结果表明随着训练的进行，模型在验证集上的性能逐渐提升，验证损失逐渐减小。最终的验证损失为33.0937，这是模型在最后一轮训练结束时在验证集上的性能评估。值得注意的是，验证损失的具体值取决于数据集的特性和模型的复杂性。较低的验证损失表示模型能够更好地拟合训练数据，并在未见过的验证数据上进行准确的预测。

# Train repeatdly until have a 'good' val_loss
epochs = 20
lr = 1e-9
history1 = fit(epochs, lr, model, train_loader, val_loader)

运行结果如下：

代码解释：
在这段代码中，我们增加了训练的轮数 epochs 为 20，降低了学习率 lr 为 1e-9，并调用了 fit 函数来执行模型的训练过程。

history1 = fit(epochs, lr, model, train_loader, val_loader)：调用 fit 函数开始训练过程，并将训练轮数 epochs、学习率 lr、模型 model、训练数据加载器 train_loader 和验证数据加载器 val_loader 传递给函数。训练过程的结果将存储在 history1 列表中。

在训练过程中，每经过 20 轮训练，或者是最后一轮训练时，会打印出当前轮数和验证损失。根据运行结果，我们可以看到在第 20 轮训练结束时，验证损失进一步降低至 2.1855。这表明通过增加训练轮数并降低学习率，模型在验证集上的性能有所改善，验证损失进一步减小。

7. 使用模型预测汽车价格

最后，我们需要用特定的数据来测试模型：

# Prediction Algorithm
def predict_single(input, target, model):
    inputs = input.unsqueeze(0)
    predictions = model(inputs)                # fill this
    prediction = predictions[0].detach()
    print("Input:", input)
    print("Target:", target)
    print("Prediction:", prediction)

# Testing the model with some samples
input, target = val_ds[0]
predict_single(input, target, model)

运行结果如下：

代码解释：
给上面代码中，我们有一个用于预测的算法 predict_single，它接受输入、目标和模型作为参数，并打印出输入、目标和预测结果。以下是代码的详细解释：

def predict_single(input, target, model): 定义了一个函数 predict_single，该函数接受输入、目标和模型作为参数。
inputs = input.unsqueeze(0): 将输入张量 input 进行维度扩展，使其成为一个大小为 (1, input_size) 的张量，以适应模型的输入要求。
predictions = model(inputs): 将扩展后的输入张量 inputs 输入到模型中进行预测。模型会生成预测值。
prediction = predictions[0].detach(): 从预测结果张量 predictions 中提取出第一个预测值，并使用 .detach() 方法将其从计算图中分离出来，以便打印和后续处理。
print("Input:", input): 打印输入张量的值，显示原始输入数据。
print("Target:", target): 打印目标张量的值，显示真实目标数据。
print("Prediction:", prediction): 打印预测值，显示模型对输入的预测结果。
input, target = val_ds[0]: 从验证数据集 val_ds 中获取第一个样本的输入和目标。
predict_single(input, target, model): 调用 predict_single 函数，传递输入、目标和模型作为参数，进行预测并打印结果。

如您所见，预测非常接近预期目标，虽然不准确，但与预期相似。有了这个现在可以测试不同的结果，看看模型的性能：

input, target = val_ds[10]
predict_single(input, target, model)

运行结果如下：

代码解释：
让我们详细解释上面的代码：

input, target = val_ds[10]：这行代码从验证数据集 val_ds 中获取索引为 10 的样本，并将其分配给 input 和 target 变量。这将使我们能够获取指定索引处的输入和目标数据。
predict_single(input, target, model)：这行代码调用了名为 predict_single 的函数，传递了 input、target 和 model 作为参数。这个函数用于对给定的输入样本进行预测并打印出输入、目标和预测结果。

然后，函数 predict_single 将被执行，根据传入的参数进行预测并打印结果。

以上为实验的所有内容，想要获取更多机器学习项目实战，记得关注博主！

往期CSDN机器学习项目文章推荐：
1.【机器学习/数据分析大项目】黑色星期五销售预测（详细报告+代码详解）
2.【机器学习项目】使用机器学习算法预测航班价格（详细报告+代码详解）

你可能感兴趣的:(机器学习项目,机器学习,pytorch,深度学习)

Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
【ai】mocap：conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision 等风来不如迎风去 AI入门与实战人工智能 ubuntu conda
MotionCapubuntu18.04不知道为啥会依赖于ffmpeg、xorg渲染？安装pytorch就是会带上cudacudnn啥的pytorch【ai】tx2nx：安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的，还涉及到rapidjson所以python的环境隔离很重要。核心库-cudatoolkit=11.3-pytor
Pytorch使用手册—扩展 TorchScript 使用自定义 C++ 操作符（专题五十三） AI专题精讲 Pytorch入门到精通 pytorch c++人工智能
提示本教程自PyTorch2.4起已弃用。有关PyTorch自定义操作符的最新指南，请参阅PyTorch自定义操作符。PyTorch1.0版本引入了一种名为TorchScript的新编程模型。TorchScript是Python编程语言的一个子集，可以被TorchScript编译器解析、编译和优化。此外，编译后的TorchScript模型可以选择序列化为磁盘文件格式，随后你可以从纯C++（以及Py
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
部分标签数据集生成与过滤特定标签方法阳光明媚大男孩机器学习人工智能
完整代码总结这段代码的目的是通过构建一个部分标签学习（PartialLabelLearning,PLL）框架来生成一个包含部分标签的数据集，并且支持根据给定的标签列表对数据集进行筛选和过滤。代码包含了多个类和函数，主要分为以下几部分：数据预处理与加载：使用PyTorch和torchvision来加载CIFAR-10数据集，并对其进行标准化处理。部分标签数据集的生成：为每个样本生成多个候选标签，并模
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
模型部署实战：PyTorch生产化指南小诸葛IT课堂 pytorch 人工智能 python
‌一、为什么要做模型部署？‌模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程。‌二、模型转换：TorchScript与ONNX‌‌1.准备预训练模型importtorchimporttorchvision#加载预训练模型model=torc
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不