数学工具构造器

百面机器学习

文章目录

数学与智力题
- 线性代数
- - 行列式
  - 矩阵运算
- 概率论与数理统计
- - 排列组合
  - 概率计算
  - 数理统计
- 智力题
1. 特征工程
- 归一化
- 类别特征编码
- 高维组合特征的处理
- 组合特征
- 文本表示模型
- Word2Vec
2. 模型评估
- RMSE
- P R
- $F_{\beta}$
- Micro-Macro Average
- ROC-AUC
- 余弦距离
- 余弦距离是否是一个严格定义的距离？
- 模型评估的方法
- 超参数调优
- 过拟合和欠拟合
机器学习基础
- 偏差方差分解
- 理论和定理
- - PAC学习理论
  - 没有免费午餐定理
  - 奥卡姆剃刀原理
  - 归纳偏置
3. 经典算法
- 线性回归
- - 闭式解
  - 最大似然估计 MLE
  - 最大后验估计 MAP
- LR
- SVM
- 决策树
4. 降维
- PCA
5. 非监督学习
6. 概率图模型
7. 优化算法
- 损失函数
- 经典的优化算法
- L1正则化与稀疏性
8. 采样
9. 前向神经网络
10. 循环神经网络
12. 集成学习

数学与智力题

线性代数

如何直观理解矩阵和线性代数？

行列式

行列式的本质是什么？

矩阵运算

关于矩阵的知识点梳理

大佬的矩阵求导合集

深度神经网络中的BP算法矩阵求导

线性回归与Logistic回归的矩阵求导

线性回归与Logistic回归的矩阵求导（续）

概率论与数理统计

排列组合

概率计算

一根绳子被切两刀能组成一个三角形的概率

列方程与约束条件，几何概型

$\frac{1}{4}$

一段绳子切n刀，组成n+1边型

考虑无法组成（某段长度> $\frac{1}{2}$ ）

$1-\frac{n+1}{2^n}$

抛硬币多少次才连续两次正面朝上

几何分布期望的泛化

$E(p)=\frac{1}{p}+\frac{1}{p^2}+\cdots$

圆上取3点组成锐角三角形

测度法。1个锐角三角形对应3个钝角，所以是 $\frac{1}{1+3}$
积分法。固定两点然后 $\int_{0}^{\pi}\frac{\alpha}{2\pi}\cdot\frac{1}{\pi}d\alpha=\frac{1}{4}$

分配白球和红球，取到红球概率
递归求期望
地区每天下雨的概率是0.8，天气预报准确性为0.8
在一个球面任取4个点，请问这4个点构成的4面体会经过球心的概率

$\frac{1}{8}$

一个半径为1的圆周上有三个点，求三个点构成的图形的面积的期望值？

$\frac{3}{2\pi}$

字节跳动面试题.个人玩抛硬币的游戏，谁先抛到正面就获胜。那么先抛的人获胜概率为？

数理统计

常见分布：

https://blog.csdn.net/Ga4ra/article/details/78935537

期望与方差的推导：

https://zhuanlan.zhihu.com/p/30496723

智力题

博弈论

取物游戏的必胜策略

1. 特征工程

归一化

MinMax

Z-Score

x1x2更新速度变得一致，更容易找到梯度下降的最优解

需要归一化：线性回归、 逻辑回归、 支持向量机、 神经网络
不需要归一化：决策树模型

决策树在进行节点分裂时主要
依据数据集D关于特征x的信息增益比（详见第3章第3节），而信息增益比跟特征
是否经过归一化是无关的

类别特征编码

序号编码（ Ordinal Encoding）、独热编码（ One-hot Encoding）、二进制编码
（ Binary Encoding）

高维组合特征的处理

会把一阶离散特征两两组合，构成高阶组合特征。

一种行之有效的方法是将用户和物品分别用k维的低维向量表示（ k<

组合特征

怎样有效地找到组合特征？

基于决策树的特征组合寻找方法

文本表示模型

词袋模型（ Bag of Words）
TF-IDF（ Term Frequency-Inverse Document Frequency）
主题模型（ Topic Model）
词嵌入模型（ Word Embedding）

词嵌入是一类将词向量化的模型的统称，核心思想是将每个词都映射成低维空间（通常K=50～300维）上的一个稠密向量（ Dense Vector）。

Word2Vec

Word2Vec实际是一种浅层的神经网络模型，它有两种网络结构，分别是CBOW（ Continues Bagof Words）和Skip-gram。

Word2Vec是如何工作的？它和LDA有什么区别与联系？

CBOW的目标是根据上下文出现的词语来预测当前词的生成概率
而Skip-gram是根据当前词来预测上下文中各词的生成概率

LDA是利用文档中单词的共现关系来对单词按主题聚类，也可以理解为对“文档-单词”矩阵进行分解，得到“文档-主题”和“主题-单词”两个概率分布。

而Word2Vec其实是对“上下文-单词”矩阵进行学习，其中上下文由周围的几个单词组成，由此得到的词向量表示更多地融入了上下文共现的特征。

2. 模型评估

RMSE

很好地反映回归模型预测值与真实值的偏离程度。但在实际问题中，如果存在个别偏离程度非常大的离群点（ Outlier）时，即使离群点数量非常少，也会让RMSE指标变得很差。

MAPE相当于对误差进行了归一化，降低了个别离群点带来的绝对误差影响

P R

精确率与召回率的权衡。

hulu视频精确率与召回率的平衡

如果相关结果有100个，即使Precision@5达到了100%， Recall@5也仅仅是5%。

模型的P-R（ PrecisionRecall）曲线

F1是两者的调和平均（harmonic mean）

$F_{\beta}$

https://en.wikipedia.org/wiki/F-score

Two commonly used values for β are 2, which weighs recall higher than precision, and 0.5, which weighs recall lower than precision.

$\beta$ 越大（如2），recall越重要。 $\beta$ 越小（如0.5），precision越重要。

Micro-Macro Average

宏平均的计算方法独立于不同类别，将每个类别的 P、R、F 值单独计算出来，然后将所有类别的度量值直接平均，因此它将各个类别平等对待。
而微平均会结合不同类别的贡献大小来计算平均值。

所以，在多分类问题中，如果存在数据不均衡问题，则使用微平均得到的效果会更加可信！

Micro Average vs Macro average Performance in a Multiclass classification setting

ROC-AUC

ROC曲线是Receiver Operating Characteristic Curve的简称

横坐标为假阳性率（ False Positive Rate， FPR）；纵坐标为真阳性率（ True Positive Rate， TPR）。

为什么ROC曲线不受样本不均衡问题的影响

TPR考虑的是第一行，实际都是正例，FPR考虑的是第二行，实际都是负例。因此，在正负样本数量不均衡的时候，比如负样本的数量增加到原来的10倍，那TPR不受影响，FPR的各项也是成比例的增加，并不会有太大的变化。因此，在样本不均衡的情况下，同样ROC曲线仍然能较好地评价分类器的性能，这是ROC的一个优良特性。

更直观地绘制ROC曲线的方法

根据样本标签统计出正负样本的数量，假设正样本数量为P，负样本数量为N；

把横轴的刻度间隔设置为1/N，纵轴的刻度间隔设置为1/P；再根据模型输出的预测概率对样本进行排序（从高到低）；

依次遍历样本，同时从零点开始绘制ROC曲线，每遇到一个正样本就沿纵轴方向绘制一个刻度间隔的曲线，每遇到一个负样本就沿横轴方向绘制一个刻度间隔的曲线，直到遍历完所有样本，曲线最终停在（ 1,1）这个点，整个ROC曲线绘制完成。

AUC值只需要沿着ROC横轴做积分就可以了。

AUC越大，说明分类器越可能把真正的正样本排在前面，分类性能越好。

ROC曲线有一个特点，当正负样本的分布发生变化时， ROC曲线的形状能够基本保持不变，而P-R曲线的形状一般会发生较剧烈的变化。

ROC曲线能够尽量降低不同测试集带来的干扰，更加客观地衡量模型本身的性能。

有效计算ROC-AUC的方法

import numpy as np
from sklearn.metrics import roc_auc_score

def auc(labels, probs):
    n_samples = len(labels)
    pos_cnt = sum(labels)
    neg_cnt = n_samples - pos_cnt
    
    total_comb = pos_cnt * neg_cnt #组合数
    
    pos_index = np.where(labels==1)[0] #找出正例的索引
    neg_index = np.where(labels==0)[0] # 找出负例的索引
    
    cnt = 0
    for pos_i in pos_index:
        for neg_j in neg_index:
            if probs[pos_i] > probs[neg_j]:
                cnt += 1
            elif probs[pos_i] == probs[neg_j]:
                cnt += 0.5
            else:
                cnt += 0
    auc = cnt / total_comb
    return auc

labels = np.array([1,1,0,0,1,1,0])
probs= np.array([0.8,0.7,0.5,0.5,0.5,0.5,0.3])
print('ours:', auc(labels,probs))
print('sklearn:', roc_auc_score(labels,probs))

余弦距离

如果希望得到类似于距离的表示，将1减去余弦相似度即为余弦距离。因此，余弦距离的取值范围为[0,2]，相同的两个向量余弦距离为0。

在一些场景，例如Word2Vec中，其向量的模长是经过归一化的，此时欧氏距离与余弦距离有着单调的关系，即

随便推一下就知道了

在此场景下，使用余弦相似度和欧氏距离的结果是相同的。

欧氏距离体现数值上的绝对差异，而余弦距离体现方向上的相对差异。

余弦距离是否是一个严格定义的距离？

正定性

余弦距离的取值范围是[0, 2]

对称性

三角不等式

KL距离不满足三角不等式

模型评估的方法

超参数调优

贝叶斯优化算法则充分利用了之前的信息。贝叶斯优化算法通过对目标函数形状进行学习，找到使目标函数向全局最优值提升的参数。

具体来说，它学习目标函数形状的方法是，首先根据先验分布，假设一个采集函数；然后，每一次使用新的采样点来测试目标函数时， 利用这个信息来更新目标函数的先验分布；最后，算法测试由后验分布给出的全局最值最可能出现的位置的点。

过拟合和欠拟合

过拟合就是学习噪声

降低过拟合的方法：

获取更多的训练数据
降低模型复杂度
正则化方法
集成学习方法

降低欠拟合的方法：

添加新特征（FM， GBDT， DeepCrossing）
增加模型复杂度
减少正则化系数

机器学习基础

偏差方差分解

偏差	方差
不同训练集上的平均性能与最优模型的差异	一个模型在不同训练集上的差异
模型的拟合能力	模型是否容易过拟合

集成模型，即通过多个高方差模型的平均来降低方差

1、bias与variance的含义，并结合ensemble method问哪种方法降低bias，哪种方法降低variance

机器学习中的 Bias（偏差）、Error（误差）、Variance（方差）有什么区别和联系？

bias描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距
varience描述的是样本上训练出来的模型在测试集上的表现

而generalization error又可以细分为Bias和Variance两个部分。
Bias是 “用所有可能的训练数据集训练出的所有模型的输出的平均值” 与 “真实模型”的输出值之间的差异；
Variance则是“不同的训练数据集训练出的模型”的输出值之间的差异。

为什么说bagging是减少variance，而boosting是减少bias?

bagging
- 由于 $E[\frac{\Sigma{X}}{n}]=E[X]$ ，所以bagging后的bias和单个子模型的接近，一般来说不能显著降低bias。
- 另一方面，若各子模型独立，则有 $\operatorname{Var}\left(\frac{\sum X_{i}}{n}\right)=\frac{\operatorname{Var}\left(X_{i}\right)}{n}$ ，此时可以显著降低variance。
boosting
- 各个基模型是强相关的，所以variance不变

结合Ensemble Method谈谈Bias和Variance的含义

理论和定理

PAC学习理论

可能近似正确（ProbablyApproximately Correct，PAC）学习理论．

因为训练样本有限，所以希望从有限样本中学习到期望错误为0的fx是不切实际的。因此，需要降低对学习算法能力的期望，只要求学习算法可以以一定的概率学习到一个近似正确的假设，即PAC学习（PAC Learning）．

一个PAC可学习（PAC-Learnable）的算法是指该学习算法能够在多项式时间内从合理数量的训练数据中学习到一个近似正确的()．

TODO：看懂

没有免费午餐定理

任何算法都有局限性．必须要“具体问题具体分析”．

奥卡姆剃刀原理

TODO：学习 最小描述长度 原则

丑小鸭定理

归纳偏置

在机器学习中，很多学习算法经常会对学习的问题做一些假设，这些假设就称为归纳偏置（Inductive Bias）

最近邻分类器中，我们会假设在特征空间中，一个小的局部区域中的大部分样本同属一类．
在朴素贝叶斯分类器中，我们会假设每个特征的条件概率是互相独立的．

在贝叶斯学习中也经常称为先验（Prior）．

3. 经典算法

线性回归

※ 线性回归面经总结——from 牛客

闭式解

「05」回归的诱惑：一文读懂线性回归

如果问L对w的导数是多少？w的close form解是多少？首先想到这个：

右边是误差，左边是Xw对X求导

然后稍微算一下就知道w的闭式解是多少了

如果特征间存在共线性，或者特征数>样本数，会导致上式的 $X^TX$ 不可逆

不可逆的情况下会存在很多解 $w$

还有一种解决方案是加L1正则，满秩，行列式不为0

最大似然估计 MLE

线性回归损失函数为什么要用平方形式

在误差服从正态分布的前提下，与极大似然估计的思想在本质上是相同。

理解：频率派角度-误差复合高斯分布的最大似然估计

最大似然估计：从概率角度理解线性回归的优化目标

求法：

误差服从 $N(0,\sigma)$ => y服从 $N(wx,\sigma)$
用高斯概率密度函数表示出y，然后进行极大似然估计

用高斯概率密度函数表示出y的分布 (当前xw取值下y的概率，误差越小概率越大)

前面的推导中发现，最小二乘与最大似然的公式几乎一样。直观上来说，最小二乘法是在寻找观测数据与回归超平面之间的误差距离最小的参数。最大似然估计是最大化观测数据发生的概率。当我们假设误差是正态分布的，所有误差项越接近均值0，概率越大。正态分布是在均值两侧对称的，误差项接近均值的过程等同于距离最小化的过程。

最大似然估计是机器学习中最常用的参数估计方法之一，逻辑回归、深度神经网络等模型都会使用最大似然估计。我们需要一个似然函数来描述真实数据在不同模型参数下发生的概率，似然函数是关于模型参数的函数。最大似然估计就是寻找最优参数，使得观测数据发生的概率最大、统计模型与真实数据最相似。

如何通俗地理解概率论中的「极大似然估计法」?

这种通过事实，反过来猜测硬币的情况，就是似然。

$W=\left(X^{T} X\right)^{-1} X^{T} Y$

$W=(X^{T} X+\lambda I)^{-1} X^{T} Y$

从两个角度理解：

频率角度：维度太大无法求逆矩阵，且容易过拟合，给w加上约束: $(X^{T} X+\lambda I)^{-1}$ 是半正定，不一定可逆， $(X^{T}X+\lambda I)^{-1}$ 为半正定加单位矩阵，是正定的，可逆
贝叶斯角度（最大后验）：参数符合laplace分布>L1正则，符合高斯分布>L2岭回归

最大后验估计 MAP

为了避免过拟合，我们可以给参数加上一些先验知识

贝叶斯估计是一种参数的区间估计，即参数在一个区间上的分布

希望得到一个最优的参数值（即点估计），可以使用最大后验估计．

LR

SVM

决策树

决策树有哪些常用的启发函数？

ID3 最大信息增益
C4.5 最大信息增益比
CART 基尼指数

剪枝方法

预剪枝
- 树达到一定深度的时候，停止树的生长
- 某结点样本数量小于阈值
- 信息增益的提升
后剪枝
- CCP 代价复杂度剪枝 Cost Complexity Pruning

4. 降维

PCA

PCA旨在找到数据中的主成分，并利用这些主成分表征原始数据，从而达到降维的目的。

可以从最小平方误差和最大方差的角度进行解释。

5. 非监督学习

6. 概率图模型

贝叶斯网络（ Bayesian Network）：有向图模型，CRF

马尔可夫网络（ Markov Network）：无向图模型，HMM

有空看下喆神的推导

解释朴素贝叶斯模型的原理，并给出概率图模型表示

后验概率 $P(X|y_i)$ 决定了分类的结果

和上面的贝叶斯网络对比一下，就知道了

解释最大熵模型的原理，并给出概率图模型表示。

有空看一下

7. 优化算法

Momentum引入了动量v，以指数衰减的形式累计历史梯度，以此来解决Hessian矩阵病态问题

Nesterov是对Momentum的变种。与Momentum不同的是，Nesterov先更新参数，再计算梯度

每个参数有不同的学习率：
- AdaGrad 学习率逐参数的除以历史梯度平方和的平方根
- RMSProp 历史梯度平方和 $\rightarrow$ 指数衰减的移动平均,以此丢弃遥远的过去历史。
- Adam Adam算法可以看做是修正后的Momentum+RMSProp算法

从 SGD 到 Adam —— 深度学习优化算法概览(一)
Adam 究竟还有什么问题 —— 深度学习优化算法概览(二)

有空看看这个，有些结论：

Deep Learning 最优化方法之SGD

损失函数

经典的优化算法

L1正则化与稀疏性

8. 采样

9. 前向神经网络

10. 循环神经网络

12. 集成学习

2、lr与svm的区别与联系

LR和SVM的联系区别

3、gbdt与adaboost的区别与联系
4、手推svm，svm麻雀虽小五脏俱全
5、pca与lda的区别与联系，并推导
6、白化的原理与作用
7、给一个算法，例如lr，问这个算法的model、evaluation、optimization分别是啥

设计模式(策略，工厂，单例，享元，门面)+模板方法 sakoba 设计模式数据库 java
文章目录前提策略模式思想实现如何拓展模板方法存在的问题思想实现如何拓展工厂模式实现问题及解决(解耦)配置文件方式使用注解单例模式实现方式1,懒汉式(线程不安全)2,懒汉式(线程安全)3,饿汉式4,双重校验锁机制(面)5,静态内部类6,枚举体现享元模式门面模式前提假设做一个需求，从文件中拿到数据并存在数据库中，文档有多种不同的类型，比如json,excel,csv等等。在做这个去求得在过程中，如何让
hexo php推送百度,Hexo站点主动推送百度-基于Flow.ci 数数科技 hexo php推送百度
写在前面：下面是链接提交方式的对比：如何选择链接提交方式1、主动推送：最为快速的提交方式，推荐您将站点当天新产出链接立即通过此方式推送给百度，以保证新链接可以及时被百度收录。2、自动推送：最为便捷的提交方式，请将自动推送的JS代码部署在站点的每一个页面源代码中，部署代码的页面在每次被浏览时，链接会被自动推送给百度。可以与主动推送配合使用。3、sitemap：您可以定期将网站链接放到sitemap中
baidusitemap.php,生成百度sitemap站点地图的php类墨墨张
简介：/**SiteMap接口类*/classSitemapActionextendsAction{privatestatic$baseURL='';//URL地址privatestatic$askMobileUrl='http://m.xxx.cn/ask/';//问答移动版地址privatestatic$askPcUrl="http://www.xxx.cn/ask/";//问答pc地址pri
从决策树到随机森林：Python机器学习里的“树形家族“深度实战与原理拆解小张在编程机器学习决策树随机森林
引言在机器学习的算法森林中，有一对"树形兄弟"始终占据着C位——决策树像个逻辑清晰的"老教授"，用可视化的树状结构把复杂决策过程拆解成"是/否"的简单判断；而它的进阶版随机森林更像一支"精英军团"，通过多棵决策树的"投票表决"，在准确性与抗过拟合能力上实现了质的飞跃。无论是医疗诊断中的疾病预测，还是金融风控里的违约判别，这对组合都用强大的适应性证明着自己的"算法常青树"地位。今天，我们就从原理到实
BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件独立开发者阿乐原创 javascript 云计算自动化大数据数据分析
文章目录BaiduSitemap-Typecho站点地图生成与多搜索引擎推送插件✨功能特点插件架构核心模块文件结构安装方法方法一：手动安装方法二：Git克隆⚙️配置说明站点地图基本设置搜索引擎配置百度搜索引擎必应（Bing）搜索引擎谷歌（Google）搜索引擎使用指南站点地图访问手动操作站点地图包含内容高级功能图片索引优化推送状态监控技术实现详解站点地图生成流程搜索引擎推送机制缓存机制❓常见问题站
深入详解：随机森林算法——概念、原理、实现与应用场景猿享天开算法随机森林机器学习
深入详解：随机森林算法——概念、原理、实现与应用场景随机森林（RandomForest,RF）是一种经典的集成学习算法，广泛应用于机器学习任务。本文将通过图文结合的方式，全面解析随机森林的核心原理、实现细节和应用实践，帮助读者建立系统认知。1.核心概念与直观理解1.1什么是随机森林？随机森林是一种基于决策树的集成学习算法，通过构建多棵决策树进行协同预测。其核心思想是"三个臭皮匠，顶个诸葛亮"——多
车联网网络安全渗透测试：深度解析与实践 ke0hly web安全网络安全物联网安全架构安全威胁分析
引言随着汽车智能化、网联化程度的不断深入，车联网（IoV）已成为连接人、车、路、云的关键枢纽。然而，技术进步的同时也带来了前所未有的网络安全挑战。从车载系统到云端平台，从车内通信到V2X通信，车联网的每一个环节都可能成为潜在的攻击面，一旦被恶意利用，将直接威胁到驾乘人员的生命财产安全，甚至影响国家安全和公共秩序。因此，构建一套全面、深入、实战化的车联网网络安全渗透测试流程和方法，对于保障车联网的健
python ks值计算_风控模型中的K-S理解以及python实现 weixin_39747293 python ks值计算
笔者在工作中计算单变量的ks值时，发现几个分布不同的变量好y计算的ks值相同，凭借统计直觉，发现一定存在问题，笔者从数据和计算ks代码两个方向进行排除。最后定位到计算使用stats.ks_2samp()函数计算ks值时，如果变量存在缺失值，计算得到ks值有误，下面笔者就来好好梳理一下ks值的前世今生。ks检验介绍笔者刚入门机器学习开始做的例子就是金融场景下风控模型。那时评价模型的好坏就用传统的机器
**双生“基尼”**：跨越世纪的术语撞车与学科分野
在学术的宇宙中，“基尼”（Gini）这个名字如同一个奇特的星标，闪耀在两个看似毫不相关的领域：衡量社会贫富差距的经济学与驱动人工智能的机器学习。然而，当人们在这两个领域都遇到“基尼指数”或“基尼系数”时，困惑油然而生——它们为何如此不同？又为何共享同一个名字？这不是某个“傻逼”的随意命名，而是一场跨越学科与世纪的“术语交通事故”，其背后是学术传承与概念抽象的交织。本文由「大千AI助手」原创发布，专
【第二章:机器学习与神经网络概述】03.类算法理论与实践-(3)决策树分类器 IT古董人工智能课程机器学习算法神经网络
第二章:机器学习与神经网络概述第三部分：类算法理论与实践第三节：决策树分类器内容：信息增益、剪枝技术、过拟合与泛化能力。决策树是一种常用于分类和回归的树状结构模型，它通过一系列特征判断进行决策，有良好的可解释性。一、基本概念节点（Node）：表示特征判断条件边（Branch）：表示特征判断的结果路径叶子节点（Leaf）：表示分类结果二、划分准则：信息增益（InformationGain）信息增益衡
RDKit：药物化学和分子数据处理的强大工具库碳酸的唐机器学习人工智能
引言在药物研发、化学信息学和分子设计领域，高效处理和分析分子数据是至关重要的。RDKit作为一个开源的化学信息学和机器学习工具包，为研究人员和数据科学家提供了丰富的功能，包括分子操作、描述符计算、指纹生成、相似性比较、子结构搜索和分子可视化等。本文将详细介绍RDKit的主要功能、应用场景以及实际操作示例，展示这一强大工具在分子数据处理中的核心价值。RDKit简介RDKit是一个由C++和Pytho
机器学习中的数学：数学建模常用知识点-1 数字化与智能化机器学习中的数学机器学习凸函数泰勒公式 Jensen 不等式
一、凸函数1、凸函数讲解设函数f(x)是定义在区间X上的函数，若对于区间上任意两点x1、x2和任意实数��∈(0,1)，总有如下表达式成立：则称为f(x)是X上的凸函数；反之，如果下式成立：则称为f(x)在X上的凹函数。如图所示：Python实现凸函数：importnumpyasnpimportmatplotlib.pyplotasplt#定义凸函数defconvex_function(x):re
ToolsSet之：颜色混合 BinField ToolsSet Windows应用 windows microsoft
ToolsSet是微软商店中的一款包含数十种实用工具数百种细分功能的工具集合应用，应用基本功能介绍可以查看以下文章：Windows应用ToolsSet介绍https://blog.csdn.net/BinField/article/details/145898264其中Media菜单中的ColorBlender是一个颜色混合工具，可以将两个或多个颜色混合并查看混合后的结果。工具左侧用于选择初始颜色
微软商店中的工具合集应用 BinField windows microsoft
ToolsSet是微软商店中的一款包含近百种实用工具的工具集合应用，细分功能达到数百种，详细功能列表及使用方法可以查看以下链接：Windows应用ToolsSet介绍https://iceskydev.github.io/AppDoc/tools/zh/ToolsSet.html工具主要分为六类：数值类、文本类、日期类、媒体类、其他类、在线工具数值类数值类功能包括：进制转换、数字和文本互转、单位转
腾讯社招前端面经（成都）
本人经验是1.8年，拉钩投递，分享面经用于学习，大家可供参考~面试流程电话面同事面组长面部长面电话面首先会接到一个面试官的电话，问一些简单的问题，简单确认是否水平真实，没有录音，记不到什么了~过了才有线下面试机会(网上说这个只是来简单判断简历是否有水分，所以如果经历正常下能过滴～)。自我介绍上家公司业务、规模项目中遇到的最大挑战react与vue的区别离职原因同事面电话面过了的话，差不多三个工作日
航天VR赋能，无人机总测实验舱开启高效新篇 ykjhr_3d vr 无人机
(一)沉浸式培训体验在传统的无人机培训中，操作人员主要通过理论学习和简单的模拟操作来掌握技能。但这种方式存在很大局限性，难以让操作人员真正感受无人机在复杂环境下的运行状态。而航天VR技术引入到VR无人机总测实验舱后，彻底改变了这一局面。操作人员戴上VR设备，就能瞬间“置身”于VR无人机总测实验舱的虚拟场景中，这里的一切都无比逼真，仿佛真实存在。在虚拟场景里，操作人员可以全方位、多角度地观察无人机的
理解不同层的表示（layer representations）科学禅道高维表示人工智能深度学习
在机器学习和深度学习领域，特别是在处理音频和自然语言处理（NLP）任务时，"层的表示"（layerrepresentations）通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的不同层次的信息。1.层的表示（layerrepresentations）为了更好地理解这一概念，我们可以从以下几个方面进行解释：1.深度神经网络结构深度神经网络（DNN）通常由多个层组成，每
基于机器学习的人形机器人电池健康状态预测方法 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据机器学习机器人人工智能 ai
基于机器学习的人形机器人电池健康状态预测方法：从理论到实践的系统解析关键词电池健康状态（SOH）、剩余使用寿命（RUL）、人形机器人、机器学习、时序数据建模、多模态特征融合、边缘计算部署摘要本报告系统解析基于机器学习的人形机器人电池健康状态预测方法，覆盖从理论框架到工程实现的全链路。首先界定人形机器人场景下电池健康状态的核心指标（SOH/RUL/RC），梳理从电化学模型到数据驱动方法的技术演进；其
电脑上温度符号℃摄氏度怎么打? l550725541 生活技巧
摄氏度的含义是指在1标准大气压下，纯净的冰水混合物的温度为0摄氏度，水的沸点为100摄氏度，用符号℃表示，是世界上使用较为广泛的温标之一。那么电脑上温度符号℃摄氏度怎么打？1.将电脑的输入切换为拼音输入法（搜狗拼音、百度拼音或者QQ拼音都可以）；2.输入『摄氏度』的中文拼音『sheshidu』，选择第5项，即可打出『℃』.
谁来定义未来座舱？新一代车载显示「C位」之战开启高工智能汽车 c语言人工智能开发语言
在汽车智能网联化转型过程中，车载显示屏幕作为人车交互的重要载体，已经站上了迅猛发展的新起点。一方面，伴随着汽车智能化的加速渗透与发展，传统中控屏与仪表显示屏的单一显示模式已经难以匹配智能化交互需求，车载显示屏正在朝着大屏化、多屏化，以及更灵活的放置方式发展。在此背景下，HUD、副驾显示屏、后排娱乐显示屏等创新产品的出现，正加速获得市场青睐。高工智能汽车研究院监测数据显示，2024年1-12月，中国
source insight project window项目窗口显示不出问题 darling_user IDE
1、点击projectwindow项目窗口快捷键或者勾选view–>projectwindow，projectwindow项目窗口仍是显示不出来，只看到整个窗口闪了一下2、解决版本：找到安装目录，删除GLOBAL.CF3重新打开SI后，界面布局是默认的，之前设置的字体大小也还原了。百度搜索下修改SI字体大小即可
【AI大模型】26、算力受限下的模型工程：从LoRA到弹性智能系统的优化实践无心水 AI大模型人工智能搜索引擎 LoRA 大语言模型微调模型压缩知识蒸馏量化技术
引言：算力瓶颈与模型工程的突围之路在人工智能领域，大语言模型的发展正呈现出参数规模爆炸式增长的趋势。从GPT-3的1750亿参数到PaLM的5400亿参数，模型能力的提升往往伴随着对算力资源的极度渴求。然而，对于大多数企业和研究者而言，动辄数百GB的显存需求、数十万块GPU的训练集群显然是难以企及的"算力鸿沟"。当面对"无米之炊"的困境时，模型工程技术成为突破算力瓶颈的核心路径——通过算法创新而非
这份「零基础」机器学习实战课程，帮你彻底搞懂AI不再迷茫！——深度解析ML-For-Beginners wylee 人工智能机器学习
引言：告别迷茫，拥抱AI未来在当今科技浪潮之巅，人工智能（AI）无疑是最璀璨的明星。机器学习（MachineLearning），作为AI的核心驱动力，正以前所未有的速度渗透到我们生活的方方面面：从智能推荐系统到自动驾驶，从疾病诊断到金融风控，其应用场景几乎无处不在。然而，对于无数渴望投身AI领域的学习者而言，机器学习的门槛似乎一直高不可攀。你是否也曾有过这样的困惑：面对海量的在线课程和资料，眼花缭
word表格后面空白页怎么删除 w怀瑾握瑜 word
一、万能法（把空白页段落标记设置的非常小就OK）（我这边百用百灵）1、首先选中空白页的这个段落标记2、然后点击段落的这个小框3、然后4、大功告成可以看到空白页的那个段落标记已经变得非常小，挤在表格下面，已经不会多占一页了
面试官是怎么筛选简历的慕慕涵雪月光白算法
在互联网行业工作十几年，管理过团队，做过经理、总监，看过几千份简历，面试过几百位程序员，包括前端、后端、客户端，也面试过其他岗位，比如产品、设计、运营等。这个过程中最耗时的就是筛简历了，现在一个岗位放出去能收到几百份简历，人力资源会筛掉9成，到我这又会筛掉剩下的9成，最终能进入面试环节的可能就3~5个人。这中间最重要的就是简历，它的质量跟你的求职成功率强相关。所以我想从面试官的角度来说一说写简历要
【机器学习&深度学习】前馈神经网络（单隐藏层）一叶千舟深度学习【理论】机器学习深度学习神经网络
目录一、什么是前馈神经网络？二、数学表达式是什么？三、为什么需要“非线性函数”？四、NumPy实现前馈神经网络代码示例五、运行结果六、代码解析6.1初始化部分6.2前向传播6.3计算损失（Loss）6.4反向传播（手动）6.5更新参数（梯度下降）6.6循环训练七、训练过程可视化（思维图）八、关键问题答疑Q1：为什么需要隐藏层？Q2：ReLU是干嘛的？Q3：学习率怎么选？九、总结学习建议在机器学习中
《三生原理》如何优化注意力机制？
AI辅助创作：《三生原理》通过融合《周易》哲学的数理模型，对注意力机制进行了多维度优化，主要体现在动态计算重构、位置编码革新与训练效率提升三方面，具体路径如下：‌一、动态筛网替代传统注意力计算‌‌三级筛网分层过滤‌‌初级筛网‌：基于素数参数化公式（p=3(2n+1)+2(2n+m+1)）预判无效特征交互，压缩注意力计算范围，减少多头冗余计算45%。‌中级判据‌：引入五行属性权重动态分配机制，依据模
Bagel: 开源协作式AI数据管理平台的使用指南 llzwxh888 人工智能 python
Bagel:开源协作式AI数据管理平台的使用指南引言在人工智能和机器学习领域，高质量的数据集对于模型训练和推理至关重要。Bagel作为一个开源的协作式AI数据管理平台，为开发者和研究人员提供了一个强大的工具，用于创建、共享和管理推理数据集。本文将深入探讨Bagel的特性、安装方法以及如何使用它来处理和管理向量数据。Bagel简介Bagel（OpenInferenceplatformforAI）可以
通过网络api获取日期对应的节假日信息白衫长发时光与她 QT 网络 qt
网络接口获取链接：免费节假日API_原百度节假日APIHolidayJudge.h#pragmaonce#include#include"ui_HolidayJudge.h"enumDATESTATE{WORK=0,//工作日DAYOFF,//休息日HOLIDAY//节假日};classHolidayJudge:publicQWidget{Q_OBJECTpublic:HolidayJudge(Q
.net core 定时任务香煎三文鱼 C#.net core .net core定时任务
这篇文章过来讲个小东西，也是大家在日常开发中也经常需要面临的问题：后台定时任务处理。估计大家看到这句就已经联想到QuartZ等类似第三方类库了，不好意思，后边的事情和它们没有关系。考虑到简单灵活,满足要求就够的编程风格.还是打算自己弄一个.当然这篇文章里不牵扯到具体的持久化,这个需要按照自己的项目需求去配置.关于IHostedService和BackgroundService需要自己百度一下.相关
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一