提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
目录
一、面试补充
1、什么是过拟合与欠拟合并且如何解决过拟合与过拟合
二、LeetCode
1.移除元素
2.有序数组的平方
3.长度最小的子数组
在模型评估过程中,过拟合和欠拟合具体指什么现象
过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现好,但是在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好。用模型在数据上的偏差和方差指标来表示就是:欠拟合时候,偏差比较大;而过拟合时,偏差较小但方差较大。
降低过拟合和欠拟合的方法
降低过拟合的方法:
1.特征-减少不必要的特征
1)根据特征的重要性,直接删除稀疏特征;
2)通过收集更多的数据,或者用数据增广的方法,产生更多的训练数据;从而阻止模型 学习不相关的特征。
2.模型复杂度-降低模型复杂度
1)神经网络,减少网络层数和神经元个数
2)决策树模型中降低树的深度,进行剪枝
3.正则化-加入正则化项并提高正则化项的系数
1)对复杂模型和系数比较大的模型进行惩罚,使得算法倾向于训练简单的模
4.多模型决策
1)采用Bagging或者Stacking 的集成方法;将多个模型融合起来共同决策;以减少模型预测 的variance.
5.模型训练
1)训练模型时采用早停策略或采用知识蒸馏方法进行训练
6.数据目标-平滑目标
1)比如用于分类任务的标签平滑方法,即在One- thot表示的ground true 标签里面,将 值为1那一位上的一小部分值减掉,均分到其他值为0的位值降低欠拟合的方法。
降低欠拟合的方法:
1.特征-添加新特征
1)比如上下文特征,ID类特征,组合特征等等
2.模型复杂度-增加模型复杂度
1) 比如在线性模型中添加高次项; .
2)在神经网络模型中增加网络层数或者神经元个数。
3.正则化-减少正则化项的系数
力扣题目链接(opens new window)
给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。
不要使用额外的数组空间,你必须仅使用 O(1) 额外空间并原地修改输入数组。
元素的顺序可以改变。你不需要考虑数组中超出新长度后面的元素。
示例 1: 给定 nums = [3,2,2,3], val = 3, 函数应该返回新的长度 2, 并且 nums 中的前两个元素均为 2。 你不需要考虑数组中超出新长度后面的元素。
示例 2: 给定 nums = [0,1,2,2,3,0,4,2], val = 2, 函数应该返回新的长度 5, 并且 nums 中的前五个元素为 0, 1, 3, 0, 4。
你不需要考虑数组中超出新长度后面的元素。
class Solution {
public:
int removeElement(vector& nums, int val) {
int left = 0;
for(int right=0; right < nums.size(); right++){
if(nums[right] != val){
nums[left++] = nums[right];
}
}
return left;
}
};
力扣题目链接(opens new window)
给你一个按 非递减顺序 排序的整数数组 nums,返回 每个数字的平方 组成的新数组,要求也按 非递减顺序 排序。
示例 1: 输入:nums = [-4,-1,0,3,10] 输出:[0,1,9,16,100] 解释:平方后,数组变为 [16,1,0,9,100],排序后,数组变为 [0,1,9,16,100]
示例 2: 输入:nums = [-7,-3,2,3,11] 输出:[4,9,9,49,121]
class Solution {
public:
vector<int> sortedSquares(vector<int>& nums) {
int index = nums.size()-1;
vector<int> result(nums.size(),0);
int left = 0, right = nums.size() - 1;
while(left <= right){
if(nums[left]*nums[left] >= nums[right]*nums[right]){
result[index--] = nums[left]*nums[left];
left += 1;
}else{
result[index--] = nums[right]*nums[right];
right -= 1;
}
}
return result;
}
};
力扣题目链接(opens new window)
给定一个含有 n 个正整数的数组和一个正整数 s ,找出该数组中满足其和 ≥ s 的长度最小的 连续 子数组,并返回其长度。如果不存在符合条件的子数组,返回 0。
示例:
输入:s = 7, nums = [2,3,1,2,4,3] 输出:2 解释:子数组 [4,3] 是该条件下的长度最小的子数组。
class Solution {
public:
int minSubArrayLen(int target, vector<int>& nums) {
int left = 0;
int sumTemp = 0;
int subLen = INT32_MAX;
for(int right=0; right< nums.size(); right++){
sumTemp += nums[right];
while(sumTemp >= target){
subLen = subLen > right-left+1 ? right-left+1 : subLen;
sumTemp -= nums[left++];
}
}
return subLen == INT32_MAX ? 0 : subLen;
}
};