白白兮兮

锂离子电池生产参数调控及生产温度预测挑战赛学习记录

赛题介绍

赛事任务

初赛任务：初赛提供了电炉17个温区的实际生产数据，分别是电炉上部17组加热棒设定温度T1-1~T1-17，电炉下部17组加热棒设定温度T2-1~T2-17，底部17组进气口的设定进气流量V1-V17，选手需要根据提供的数据样本构建模型，预测电炉上下部空间17个测温点的测量温度值。

数据说明

初赛为参赛选手提供了5类数据：1）加热棒上部温度设定值、2）加热棒下部温度设定值、3）进气流量、4）上部空间测量温度、5）下部空间测量温度。出于数据安全保证的考虑，所有数据均为脱敏处理后的数据。训练集及测试集每行均含有5类数据。选手需要建立上部加热棒设定温度、下部加热棒设定温度、进气流量与上部空间测量温度、下部空间测量温度之间的模型。

评估指标

初赛考核办法采用测试集各行数据的加热棒上部温度设定值、加热棒下部温度设定值、进气流量3类数据作为输入，选手分别预测上部空间测量温度、下部空间测量温度。将选手预测的上部空间测量温度、下部空间测量温度与测试集数据的测量值进行比较。采用MAE平均绝对误差作为评价指标。

赛题分析

本赛题的背景是锂离子电池的生产过程，涉及到电炉的温度控制和温度预测，这是一个具有实际意义和工业价值的问题。
本赛题的难点可能在于如何利用有限的数据样本，建立一个准确和稳定的回归模型，同时考虑到电炉的空间分布和时序变化。
本赛题的特点是数据集较小，这意味着模型可能容易过拟合或欠拟合，需要进行合适的特征工程和模型选择。
本赛题的思路可能有以下几种：
- 基于传统的机器学习方法，如线性回归、岭回归、支持向量机、决策树、随机森林等，对每个目标变量单独建立一个回归模型，然后将所有模型的预测结果汇总。这种方法简单易实现，但可能忽略了不同目标变量之间的相关性和影响因素。
- 基于深度学习方法，如多层感知机、卷积神经网络、循环神经网络、长短期记忆网络、注意力机制等，对所有目标变量建立一个统一的回归模型，然后输出一个34维的向量作为预测结果。这种方法可以利用深度学习的强大表达能力，同时考虑到电炉的空间结构和时序特征，但可能需要更多的数据和计算资源，以及更多的调参和优化。
- 基于集成学习方法，如梯度提升树、XGBoost、LightGBM、CatBoost等，对每个目标变量单独或同时建立一个回归模型，然后将所有模型的预测结果加权平均或投票。这种方法可以结合多个弱学习器的优势，提高模型的准确性和鲁棒性，同时可以进行特征重要性分析和参数调优。

LightGBM模型

模型概况

LightGBM模型是一个基于梯度提升决策树（GBDT）的机器学习框架，它可以用于回归、分类、排序等任务。

数据预处理
切分训练集与验证集
训练模型
生成最后的预测结果

一般步骤

读入数据，划分训练集、验证集和测试集，转换为LightGBM的Dataset格式。
定义模型的超参数，如任务类型、提升方法、目标函数、树的深度、叶子数、学习率等。
使用LightGBM的train函数训练模型，可以使用回调函数（callback）来实现早停（early stopping）、日志记录（log evaluation）等功能。
使用LightGBM的predict函数预测测试集的结果，评估模型的性能，如均方误差（MSE）、平均绝对误差（MAE）、平均绝对百分比误差（MAPE）等指标。
对模型进行优化，如调整目标函数和评估函数，使用网格搜索（Grid Search）或贝叶斯优化（Bayesian Optimization）等方法寻找最优的超参数组合。

Baseline代码

教程Baseline网址【来自Datawhale七月AI夏令营】

科大讯飞锂离子电池生产参数调控及生产温度预测挑战赛_Baseline - 飞桨AI Studio本项目为科大讯飞锂离子电池温度预测赛道Baseline，可一键运行~~ - 飞桨AI Studiohttps://aistudio.baidu.com/aistudio/projectdetail/6512066?sUid=2554132&shared=1&ts=1689841007106

教程Baseline代码【来自Datawhale七月AI夏令营】

# 导入所需的库
import pandas as pd # 读取和处理csv文件的数据
# 用于处理数据的工具，常用于数据加载、数据清洗和数据预处理
import lightgbm as lgb # 机器学习模型 LightGBM
# 构建梯度提升树模型，是一种高效的机器学习算法
from sklearn.metrics import mean_absolute_error # 评分 MAE 的计算函数
# 从sklearn.metrics模块中导入评分函数
# 平均绝对误差（MAE），是用于回归问题的一个评价指标
from sklearn.model_selection import train_test_split # 拆分训练集与验证集工具
# 用于将数据集拆分为训练集和验证集，以便进行模型训练和评估
# sklearn.model_selection对机器学习模型进行参数调优、数据集拆分、交叉验证和性能评估等任务
# train_test_split函数，将数据集划分为训练集和测试集，并且可以灵活地设置拆分比例和随机种子
from tqdm import tqdm # 显示循环的进度条工具
# 循环过程显示进度条，方便查看代码执行进度

# 数据准备
train_dataset = pd.read_csv("./data/train.csv") # 原始训练数据。
test_dataset = pd.read_csv("./data/test.csv") # 原始测试数据（用于提交）。

submit = pd.DataFrame() # 定义提交的最终数据。
submit["序号"] = test_dataset["序号"] # 对齐测试数据的序号，确保与原测试数据的一致性

MAE_scores = dict() # 定义评分项。

# 模型训练
pred_labels = list(train_dataset.columns[-34:]) # 需要预测的标签。
# 训练数据集的最后34列是需要预测的目标变量
train_set, valid_set = train_test_split(train_dataset, test_size=0.2) # 拆分数据集。

# 设定 LightGBM 训练参，查阅参数意义：https://lightgbm.readthedocs.io/en/latest/Parameters.html
lgb_params = {
        'boosting_type': 'gbdt',
        'objective': 'regression',
        'metric': 'mae',
        'min_child_weight': 5,
        'num_leaves': 2 ** 5,
        'lambda_l2': 10,
        'feature_fraction': 0.8,
        'bagging_fraction': 0.8,
        'bagging_freq': 4,
        'learning_rate': 0.05,
        'seed': 2023,
        'nthread' : 16,
        'verbose' : -1,
    }
# 调整参数是优化模型性能的重要手段

no_info = lgb.callback.log_evaluation(period=-1) # 回调函数no_info，禁用训练日志输出。
# LightGBM通常会输出一些训练过程的信息，通过回调函数可以避免输出这些信息，使得训练过程更简洁

def time_feature(data: pd.DataFrame, pred_labels: list=None) -> pd.DataFrame:
    """提取数据中的时间特征。

    输入: 
        data: Pandas.DataFrame
            需要提取时间特征的数据。

        pred_labels: list, 默认值: None
            需要预测的标签的列表。如果是测试集，不需要填入。
    
    输出: data: Pandas.DataFrame
            提取时间特征后的数据。
    """
    
    data = data.copy() # 复制数据，避免后续影响原始数据。
    data = data.drop(columns=["序号"]) # 去掉”序号“特征。
    
    data["时间"] = pd.to_datetime(data["时间"]) # 将”时间“特征的文本内容转换为 Pandas 可处理的格式。
    data["month"] = data["时间"].dt.month # 添加新特征“month”，代表”当前月份“。
    data["day"] = data["时间"].dt.day # 添加新特征“day”，代表”当前日期“。
    data["hour"] = data["时间"].dt.hour # 添加新特征“hour”，代表”当前小时“。
    data["minute"] = data["时间"].dt.minute # 添加新特征“minute”，代表”当前分钟“。
    data["weekofyear"] = data["时间"].dt.isocalendar().week.astype(int) # 添加新特征“weekofyear”，代表”当年第几周“，并转换成 int，否则 LightGBM 无法处理。
    # 转换成int整数类型，否则LightGBM无法处理
    data["dayofyear"] = data["时间"].dt.dayofyear # 添加新特征“dayofyear”，代表”当年第几日“。
    data["dayofweek"] = data["时间"].dt.dayofweek # 添加新特征“dayofweek”，代表”当周第几日“。
    data["is_weekend"] = data["时间"].dt.dayofweek // 6 # 添加新特征“is_weekend”，代表”是否是周末“，1 代表是周末，0 代表不是周末。

    data = data.drop(columns=["时间"]) # LightGBM 无法处理这个特征，它已体现在其他特征中，故丢弃。

    if pred_labels: # 如果提供了 pred_labels 参数，则执行该代码块。
        data = data.drop(columns=[*pred_labels]) # 去掉所有待预测的标签。
    
    return data # 返回最后处理的数据。

test_features = time_feature(test_dataset) # 处理测试集的时间特征，无需 pred_labels。


# 从所有待预测特征中依次取出标签进行训练与预测。
for pred_label in tqdm(pred_labels):
    train_features = time_feature(train_set, pred_labels=pred_labels) # 处理训练集的时间特征。
    train_labels = train_set[pred_label] # 训练集的标签数据。
    train_data = lgb.Dataset(train_features, label=train_labels) # 将训练集转换为 LightGBM 可处理的类型。

    valid_features = time_feature(valid_set, pred_labels=pred_labels) # 处理验证集的时间特征。
    valid_labels = valid_set[pred_label] # 验证集的标签数据。
    valid_data = lgb.Dataset(valid_features, label=valid_labels) # 将验证集转换为 LightGBM 可处理的类型。

    # 训练模型，参数依次为：导入模型设定参数、导入训练集、设定模型迭代次数（200）、导入验证集、禁止输出日志
    model = lgb.train(lgb_params, train_data, 200, valid_sets=valid_data, callbacks=[no_info])

    valid_pred = model.predict(valid_features, num_iteration=model.best_iteration) # 选择效果最好的模型进行验证集预测。
    test_pred = model.predict(test_features, num_iteration=model.best_iteration) # 选择效果最好的模型进行测试集预测。
    MAE_score = mean_absolute_error(valid_pred, valid_labels) # 计算验证集预测数据与真实数据的 MAE。
    MAE_scores[pred_label] = MAE_score # 将对应标签的 MAE 值 存入评分项中。

    submit[pred_label] = test_pred # 将测试集预测数据存入最终提交数据中。
     
submit.to_csv('submit_result.csv', index=False) # 保存最后的预测结果到 submit_result.csv。
print(MAE_scores) # 查看各项的 MAE 值。

代码解析

from sklearn.metrics import mean_absolute_error # 评分 MAE 的计算函数
from sklearn.model_selection import train_test_split # 拆分训练集与验证集工具
from tqdm import tqdm # 显示循环的进度条工具

pip install scikit-learn

【sklearn模块的导入】

pred_labels 是一个列表，包含了 34 个需要预测的标签的列名，这些标签可能是分类或者回归的目标变量。
train_test_split 是一个函数，用来将数据集随机分成两部分，一部分作为训练集，一部分作为验证集。test_size=0.2 表示验证集占总数据集的 20%。
train_set 和 valid_set 是两个数据框，分别存储了训练集和验证集的数据，包括特征和标签。
train_dataset.columns 是一个索引对象，包含了数据框的所有列名。
[-34:] 是一个切片操作，表示从倒数第 34 列开始到最后一列结束的所有列。
list() 是一个函数，用来将索引对象转换成一个列表，方便后续操作。
train_test_split 是一个函数，来自于 sklearn.model_selection 模块，用于数据集的拆分。
train_dataset 是一个数据框，作为函数的第一个参数，表示要拆分的数据集。
test_size=0.2 是一个关键字参数，表示验证集占总数据集的比例，可以是一个浮点数或者一个整数。

通过调参的过程来寻找最佳的参数组合，可以使用网格搜索、随机搜索、贝叶斯优化等方法来进行。
一般来说，可以先固定一些不太敏感的参数，然后调整一些比较重要的参数，比如 num_leaves、learning_rate、feature_fraction 等，观察模型的表现，然后再细化调整其他参数。
调参的目标是在保证模型的泛化能力的同时，提高模型的准确性和效率。

LightGBM的数学原理

XGBoost

传统集成学习中，两类典型的集成学习框架：

Boosting系列算法的基学习器往往是串行形成
- 例如有n个学习器，第n个学习器，是基于上一轮的学习器去进行一个迭代式的优化生成
  - AdaBoost：这是一种最经典的boosting算法，它通过调整训练数据的权重分布，使得每个弱分类器都关注上一轮分类错误的样本，然后通过加权投票的方式将弱分类器组合起来。AdaBoost可以用于二分类或多分类问题。【侧重于数据而非特征】
  - GBDT：这是一种基于梯度提升的boosting算法，它通过使用损失函数的负梯度作为残差来拟合每个弱分类器，从而不断减少整体的损失。GBDT可以用于回归或分类问题。
  - XGBoost：这是一种优化的GBDT算法，它在GBDT的基础上引入了正则化项，以防止过拟合，同时使用了并行计算和剪枝等技术来提高效率和性能。XGBoost也可以用于回归或分类问题。
Bagging系列算法（例如随机森林）往往是并行形成
- 学习器和学习器之间没有必然的联系，并行生成学习器
Boosting算法与决策树结合，如何更好的将特征融入进去
2017年陈天奇提出XGBoost，成为当时监督学习任务的SOTA方法（最好方法）

集成学习的本质将若干个学习器组合起来，进行投票

决策树是一种基于树结构的分类和回归算法，它可以根据一组特征和规则，将数据集划分为不同的类别或者预测输出值。决策树有三种主要的算法：ID3、C4.5和CART。它们的区别和特点如下：
- ID3算法是最早提出的决策树算法，它使用信息增益作为特征选择的标准，选择信息增益最大的特征作为分裂节点。ID3算法的优点是简单直观，缺点是容易过拟合，没有考虑连续特征和缺失值，对取值多的特征有偏好。
- C4.5算法是在ID3算法的基础上进行了改进，它使用信息增益率作为特征选择的标准，以克服信息增益对取值多的特征的偏好。C4.5算法还引入了悲观剪枝策略，可以对生成的决策树进行后剪枝，以减少过拟合的风险。C4.5算法还可以处理连续特征和缺失值。
- CART算法是另一种流行的决策树算法，它使用基尼系数作为特征选择的标准，选择基尼系数最小的特征作为分裂节点。CART算法生成的是二叉树，每个节点只有两个分支，这样可以简化决策树的规模和计算量。CART算法既可以用于分类问题，也可以用于回归问题。【CART学习器使用的最多】【既可以做分类，也可以做回归】

一个集成系统，有k个基学习器， $f_{k}$ 表示每一个基学习器， $f_{k}$ 针对输入的自变量 $x_{i}$ 做分类，将个学习器集成起来，是最终投票的一个结果
根据树的分支规则，给出一个评分函数 $\omega$ ， $\omega$ 是树上不同节点的权重分数

提升集成学习模型的性能

误差优化：给定一个数据分布的情况下，无论多么好的函数或者模型去进行拟合，总会产生一个误差

$y=\hat{y}+\varepsilon$ ，以往是让预测值 $\hat{y}$ 不断逼近，但可以考虑对残差 $\varepsilon$ 进行优化，将其看作一个凸优化问题，求最小值 $min\varepsilon$

回归与误差本质可以相互转化

梯度与偏导、导数本质上是互通的

贪心搜索：每一轮迭代，误差都是最小的
启发式搜索：智能优化的一些算法，例如遗传算法或者粒子群算法

XGBoost是机器学习的一个里程碑：

优化梯度，提升准确度
自主处理数据缺失，削弱预处理困难
自主感知数据稀疏，减少人工降维工作量

造成数据稀疏原因：

缺失值
特定常数的频繁出现（比如大量0）
某些特征工程手段（比如独热编码，一列变多列，大大扩充了数据的维度）

XGBoost优点：【以层为单位】

二阶泰勒展开提高精度
正则化方法更稳健
借鉴随机森林方法，其中因入列抽样，降低过拟合
稀疏自主感知
对Cache使用进行优化，数据块大小提高读写速度
近似分支算法（level-wise)支持并行化训练

XGBoost问题：

精确贪心算法需要反复迭代反复遍历，计算量和内存消耗都很大
level-wise策略增长可能带来很多不必要的叶子节点
尽管cache感知，但仍有大量cache missing，造成页面调度空间过大

LightGBM

LightGBM主要优化点：【以节点为单位】

基于Histogram（直方图）的决策树算法
带深度限制的（防止过深、过拟合）的Leaf-wise（特点节点为单位）的叶子生长策略
直方图做差加速
直接支持类别特征（不需要独热编码）
Cache命中率优化（进一步提升运算速度和可并行性）
基于直方图的系数特征优化
多线程优化

LightGBM主要方法：

直方图算法
数据并行与特征并行
GOSS梯度采样
EFB方法

直方图算法

先对特征值做装箱处理，本质上是一个分段函数（对每个特征的取值做个分段函数，将所有样板在该特征上的取值划分到某一段bin中）。最终把特征取值从连续值转化成了离散值。遍历数据时，根据离散化后的值作为索引在直方图中累计统计量。当遍历一次数据后，直方图累积了需要的统计量，然后根据直方图的离散值，遍历寻找最优的分割点【连续值变离散，模糊化的处理】

例如，一列0~1的浮点数，将其分段，[0,0.3) $\to$ 0，[0,3,1) $\to$ 1，即将连续值改写成离散值0和1，即为装箱

行数乘以列数优化到区段数乘以特征数

数据并行与特征并行

数据决定上限，模型逼近上限，特征往往不会冗余，数据会冗余

GOSS（单边）梯度采样

EFB方法

并行方式

LightGBM实操

不论是决策树还是集成学习，或者梯度提升的框架，一颗树的节点表示的是分割的规则，阈值划分，给出规则形式，以及叶子节点的权重分数（本质上贪心过程）

学习笔记之debian的thonny开发（尚未验证）--从stm32裸机到linux嵌入式系统 sjh2100 嵌入式硬件硬件工程 linux stm32 debian
这应该算stm32裸机用户转linux嵌入式系统的入门学习笔记。【鲁班猫】39-vnc远程桌面连接鲁班猫_哔哩哔哩_bilibili本集的鲁班猫的视频介绍中，没有清晰明确指出需要linux开发板接入网络，接入网络可以使用有线网口或者wifi路由，有些提示信息是来自开发板还是win电脑屏幕并不是很明确。stm32开发需要win+keil+stlink+开发板。linux嵌入式系统应用开发需要：lin
【LLM】大模型基础--大规模预训练语言模型的开源教程笔记 Langchain 笔记人工智能 langchain llama 大模型产品经理大模型基础
1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看，LM（languagemodle）可以简单的分为：自回归模型非自回归模型特点逐字生成文本，每个词的生成都依赖于上文，关联性好一次性生成整个文本序列，不捕捉上文信息优点内容质量高生成速度快
【含文档+PPT+源码】基于微信小程序的乡村振兴民宿管理系统小咕聊编程微信小程序小程序
项目介绍本课程演示的是一款基于微信小程序的乡村振兴民宿管理系统，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用民宿管理系统的重要核心功能包括用户管理、客房管理、客房评价管理、订单管理、首页轮播图管理和商家管理等，以下为项目功能模块图：技术栈
从热搜趋势到交易策略：Level2逐笔成交数据的应用之道银河金融数据库 level2逐笔成交逐笔委托区块链金融数据库 python
从热搜趋势到交易策略：Level2逐笔成交数据的应用之道为了促进学习和研究，我们在此分享一部分匿名处理的股票level2逐笔委托逐笔成交历史行情数据集。股票level2逐笔委托逐笔成交历史行情数据集链接:https://pan.baidu.com/s/1jSeHGNOs8akYsFfjs9WMSw?pwd=crfj提取码:crfj请注意，分享这些数据的目的是为了教育和研究，不构成任何投资建议。关键
Matlab 机器人雅可比矩阵 CodingAlgo 算法
===工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（四）——雅可比矩阵_staubli机器人正逆向运动学实例验证matlab-CSDN博客===matlab求雅可比矩阵_六轴机械臂矢量积法求解雅可比矩阵-CSDN博客===(63封私信/80条消息)MATLAB机器人工具箱中机器人逆解是如何求出来的？-知乎===https://zhuanlan.zhihu.com/p/638
【AI日记】24.10.30 做项目的一些前期准备工作 AI完全体 AI日记人工智能机器学习自然语言处理 langchain 日记读书学习资源
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】工作工作1内容：看AI大佬访谈B站地址：SamAltman最新5月播客长篇访谈|@All-In播客2024.5.11时间：1.5小时评估：继续工作2内容：思考如何开始自己的RAG项目时间：0.5小时决定：采用搭积木的方法来做自己的RAG项目。从最基础的开始，不断学习各种RAG和NLP相关的技术，然后不断加入到自己的项目中，而不
计算机视觉如何快速入门? Frunze软件开发日常问题回答开发语言计算机视觉工业异常检测论文
目录1.明确研究方向2.学习基础知识3.掌握核心算法4.实践项目5.阅读文献6.复现经典论文7.改进与创新总结计算机视觉（ComputerVision）是一个复杂且广泛的领域，尤其是工业异常检测这种特定方向，需要结合理论知识和实践技能。以下是一些具体的、可操作的建议，也是个人实际路径的一个总结，希望可以帮助到你快速入门并完成一篇论文。1.明确研究方向-工业异常检测的核心是识别图像或视频中的异常区域
强化学习在连续动作空间的应用：DDPG与TD3 AI天才研究院计算 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA 计算 AI大模型应用
1.背景介绍1.1强化学习简介强化学习（ReinforcementLearning，简称RL）是一种机器学习方法，它通过让智能体（Agent）在环境（Environment）中与环境进行交互，学习如何根据观察到的状态（State）选择动作（Action），以最大化某种长期累积奖励（Reward）的方法。强化学习的核心问题是学习一个策略（Policy），即在给定状态下选择动作的映射关系。1.2连续动
书籍-《机器学习的秘密：它是如何工作的以及它对你的意义》机器学习深度学习人工智能
书籍：SecretsOfMachineLearning:HowItWorksAndWhatItMeansForYou作者：TomKohn出版：WorldScientificPublishingCoPteLtd编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《机器学习的秘密：它是如何工作的以及它对你的意义》01书籍介绍在众多关于机器学习和人工智能的技术文献及充满恐慌的书籍中，《机器学习的秘密》犹
C#学习笔记——StringBuilder类 oyqho C#官方文档学习笔记 c#游戏 unity
在C#中，有一个非常实用的创建字符型数据的类——StringBuilder类，使用StringBuilder，可以创建出字符串，并且StringBuilder中封装的有许多对字符串进行操作的方法（这一点很方便）。比如说字符串是固定长度的，但是通过StringBuilder类中的Append()方法就可以改变字符串的长度。StringBuilder类的使用需要在前面加上System.Text。代码如
ROS2软件架构全面解析-学习如何设计通信中间件框架 chinamaoge ROS2 DDS 通信中间件 ROS2 ROS 通信中间件
前言ROS（RobotOperatingSystem）2是一个用于开发机器人应用的软件平台，也称为机器人软件开发工具包(SDK)。ROS2是ROS1的迭代升级版本，最主要的升级点是引入DDS（DataDistributionService）为基础的底层通信系统。为解决ROS1存在主要几个缺陷：为解决一个主节点通信故障(ROSMaster)，需要对所有现有的Client库进行单独的补丁处理，并且每个
C++调用CPLEX踩过的小坑~ blackms1023 c++
最近在使用VisualStudio2015调用CPLEX进行一些基础问题的求解，初学小白，完全没经验，遇到N多问题，踩了好多坑，在此分享一下！希望可以给后其他研究者提供一neinei学习的经验！1.关于CPLEX中默认变量的问题CPLEX中默认变量为非负值，故在实际编码过程中如若不为变量指定下界为负无穷，且变量存在负值情况，则会出现计算数据错误的情况。具体解决方法就是在初始化的过程中，为其指定一个
一键启动多个软件，开启高效办公新时代 KJ-拾荒者生活职场和发展性能优化经验分享安全
在快节奏的现代生活中，我们的电脑上安装了各种各样的软件，从办公软件到娱乐软件，从社交软件到学习软件。然而，每次打开电脑后，逐一启动这些软件不仅浪费时间，还会影响我们的心情和工作效率。今天，我要为大家介绍一款能够解决这一问题的神奇软件——一键启动多个软件，它将彻底改变你的电脑使用体验。一、高效便捷，一键启动这款软件的最大亮点就是它的高效便捷性。你可以将常用的软件添加到启动列表中，然后只需轻轻一点，就
学C++还是学Java？做软件研发还需掌握哪些知识和技能？_c+ 2401_84160087 程序员 c++java c语言
1.1、Java和C++都很有前途1.2、Java的应用领域与使用场景1.3、C++的应用领域与使用场景1.4、如何选择2、需要掌握的知识和技能2.1、掌握一些基础的网络知识2.2、熟悉一些常用的SQL语句2.3、了解Linux系统，掌握常用的Linux命令2.4、学习汇编语言相关的内容2.5、学习一些其他的专业课程3、最后最近和一些高校的学生朋友交流，他们打算毕业后从事软件研发的工作，但目前有些
python小白的word转excel W~J~L python python
大概流程为：一、首先导入docx库以及xlwt库二、需要用到的文档的名称三、设置一个函数来写入excel，转为可识别通用的“utf8”，然后创建一个表格来将文档里的内容写入到表里去四、利用for循坏来设置表里多少个为一行五、在最后设置表的保存路径以及提示是否创建成功importdocximportxlwtdocFile="青年大学习.docx"defwrite_excel(path):doc=do
基于C语言的单向链表按“索引”插入或者删除某节点实现張三600 c语言链表数据结构
正文在学习学堂在线西安科技大学的数据结构与算法课程后，我基于课程的伪代码实现了单向链表的插入和删除操作。以下代码展示了如何建立一个带有一个空数据头结点和五个数据节点的单向链表，以及如何在链表的指定索引位置插入和删除节点。以下是完整的代码实现：#include#include//结构体声明typedefstructLNode{intdata;//链表节点数据域structLNode*next;//链
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
揭秘！考 BDA 所需强度指南东总学长同济预备研0 数据分析信息可视化 python 求职招聘
宝子们，初级BDA我已顺利拿下～迫不及待来和大家分享热乎乎的备考历程，希望能给正在备考或打算考的小伙伴一些参考。我选择BDA数据分析师证书，是因为它由中国信息协会市场研究业分会&中经数（北京）数据应用技术研究院联合认证，对想进入数据分析行业、提升专业水平的人超有帮助！下面给大家分享我的学习攻略：业务知识（1周左右）深入了解业务知识，能为数据分析提供更深层次支持。推荐书籍《深入浅出数据分析》《精益数
翻译Deep Learning and the Game of Go（14）第十二章采用actor-critic方法的强化学习 idol_watch 围棋与深度学习
本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和训练Keras的多输出神经网络如果你正在学习下围棋，最好的改进方法之一是让一个水平更高的棋手给你复盘。有时候，最有用的反馈只是指出你在哪里赢棋或输棋。复盘的人可能会给出这样的评论，“你下了30步后已经远远落后了”或“在下了110步后，你有一个获胜的局面，但你的对手在130时扭转了局面。”为什么这种反馈是有帮助
PHP语法完全入门指南：从零开始掌握动态网页生信天地 php 开发语言
本文专为零基础新手设计，通过5000字详细讲解带你系统学习PHP语法。包含环境搭建、基础语法、实战案例，并附20+代码示例。阅读后你将能独立开发简单动态网页！一、PHP开发环境搭建（新手必看）1.1为什么需要搭建环境？PHP是服务器端脚本语言，需要运行在服务器环境中。推荐使用集成环境一键安装：Windows用户：下载PHPStudy（文献1）Mac用户：推荐MAMP通用选择：XAMPP（文献1）安
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
Ajax基础学习喜欢代码的新之助 ajax 学习 okhttp
AJAX浏览器本身就具备网络通信的能力，但在早期浏览器并没有把这个能力开放给JS最早是微软在IE浏览器中把这一能力向JS开放，让JS可以在代码中实现发送请求，这项技术在2005年被正式命名为AJAX（AsynchronousJavascriptAndXML）这套API主要依靠一个构造函数完成；该构造函数的名称为XMLHttpRequest，简称为XHR由于XHRAPI有着诸多缺陷，在HTML5和E
【漫话机器学习系列】041.信息丢失（dropout） IT古董漫话机器学习系列专辑机器学习人工智能深度学习
信息丢失（Dropout）Dropout是一种广泛应用于神经网络训练中的正则化技术，旨在减少过拟合（overfitting），提高模型的泛化能力。虽然"信息丢失"（dropout）这个术语在某些情况下可能引起误解，指的并非是数据的丢失，而是训练过程中故意“丢弃”神经网络中的部分神经元。这种做法可以避免模型过于依赖于某些特定的神经元，从而提高模型在新数据上的表现。Dropout的工作原理在神经网络的
PySide6 GUI 学习笔记——常用类及控件使用方法（常用类尺寸QSize） Humbunklung PySide6 学习笔记学习笔记 python pyqt
尺寸类之——QSizeQSize类通过整数形式定义一个二维对象的尺寸，包括宽width()和高height()。QSize官方文档方法概述def__init__()def__reduce__()def__repr__()defboundedTo()defexpandedTo()defgrownBy()defheight()defisEmpty()defisNull()defisValid()def
第二章：12.3 建立表现基准望云山190 基准性能水平人工智能机器学习
背景介绍语音识别是一种常见的机器学习应用，用户通过语音输入代替键盘输入，系统需要将语音转换为文本。在这个过程中，算法的性能可以通过训练误差和交叉验证误差来评估。误差定义训练误差（Jtrain）：指算法在训练数据集上无法正确转录的音频片段的百分比。在这个例子中，训练误差是10.8%，意味着算法在训练数据上犯了10.8%的错误。交叉验证误差（Jcv）：指算法在未见过的数据（交叉验证集）上无法正确转录的
第二章：12.4 学习曲线望云山190 深度学习机器学习人工智能
学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着训练数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现，以及模型是否过拟合或欠拟合。二阶模型的学习曲线交叉验证错误（Jcv）：这条绿色曲线表示模型在未见过的数据上的表现。它反映了模型的泛化能力，即模型对新数据的预测能力。训练错误（Jtrain）：这条红色曲线表示模型在训练数据上的表现。它反映了模型对训练数据的拟合程度。学习曲
Pytorch官方文档英语翻译 yanzhiwen2 深度学习Pyrotch pytorch 机器学习 python 人工智能深度学习
深度学习Pytorch-Pytorch官方文档英语翻译1.a-e1.1span跨度1.2blended混合的1.3criterion标准1.4deprecated弃用的1.5clamp钳制1.6arbitraryshapes任意形状1.7explodinggradients梯度爆炸1.8converge收敛1.9approximate近似1.10arg参数1.11argument参数1.12con
【探索C++】友元祐言QAQ 探索C++编程开发语言 c++linux java https 网络
(꒪ꇴ꒪)，Hello我是祐言QAQ我的博客主页：C/C++语言，数据结构，Linux基础，ARM开发板，网络编程等领域UP快上，一起学习，让我们成为一个强大的攻城狮！送给自己和读者的一句鸡汤：集中起来的意志可以击穿顽石!作者水平很有限，如果发现错误，请在评论区指正，感谢在C++中，友元（friend）是一种特殊的关系，它允许一个类或函数访问另一个类的私有成员。通过友元关系，一个类可以将其他类或函
嵌入式工程师全攻略：岗位职责与技能要求详解 Nebula嵌入式嵌入式科普嵌入式
文章目录一、前言二、**硬件架构中最常用的有哪几种**三、嵌入式的岗位及技能要求3.1嵌入式硬件3.1.1主要职责3.1.2技能要求3.1.3学习建议3.2嵌入式单片机3.2.1主要职责3.2.2技能要求3.2.3学习建议3.3嵌入式linux3.3.1主要职责3.3.2技能要求3.3.3学习建议一、前言这是根据我个人和网上的一些资料编写的，可能有不对的地方请及时提醒。二、硬件架构中最常用的有哪几
图论- Dijkstra算法左灯右行的爱情图论算法 python
Dijkstra算法前言概念BFS基础模版DijkstraDijkstra函数签名State类distTo记录最短路径伪代码模版第一个问题解答第二个问题解答第三个问题解答前言学习这个算法之间,必须要对BFS遍历比较熟悉,它的本质就是一个特殊改造过的BFS算法.概念Dijkstra算法是一种计算图中单源最短路径算法,本质上是一个经过特殊改造的BFS算法,改造点有两个:使用优先队列,而不是普通队列进行
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/