dili8870

机器学习---一个完整的机器学习目录

一.问题建模

1.评价指标

1.1分类指标

二分类
- 精确率
  - P=TP/(TP+FP)
- 召回率
  - R=TP/(TP+FN)
- F1值
  - 2PR/(P+R)
- P-R曲线
  - 横轴是召回率0-1,纵轴为对应的召回率下的精确率
- ROC曲线
  - 横轴为假正率FPF=FP/(FP+TN),纵轴为真正率TPR=TP/(TP+FN)
- AUC
  - 直接计算ROC曲线下的面积
    Wilcoxon-Mann-Witney Test:测试任意给一个正类样本和一个负类样本,正类样本的score有多大概率大于负类样本的score.
  - 两种计算方法：
    O(M * N)：统计一下所有的M*N个正负样本对中,有多少个组中的正样本中的score大于负样本的socre,然后除以MN,M/N为正/负样本的个数
    O(M + N)：首先对score从大到小排序，然后令最大score对应的sample 的rank为n，第二大score对应sample的rank为n-1，以此类推。然后把所有的正类样本的rank相加，再减去M-1种两个正样本组合的情况。得到的就是所有的样本中有多少对正类样本的score大于负类样本的score。然后再除以M×N。
- 对数损失
  - -log(P(Y|X))
多分类
- 准确率
  - (TP+TN)/ALL
- 错误率
  - (FP+FN)/ALL

1.2回归指标

平均绝对误差MAE
- 也叫L1范数损失
- 加权平均绝对误差WMAE
平均绝对百分误差MAPR
均分根误差RMSE
- 均方根对数误差RMSLE

1.3聚类指标

1.4排序指标

平均准确率MAP
NDCG归一化贴现累计收益

2.样本选择

2.1好处

缩短模型的时间;具体问题不需要全部信息;去除噪声数据

2.2数据噪声

特征值缺失
特征值超出值域范围
误标注：二分类正样本标注为负样本
- 集成过滤法(Ensembel filter,EF)
- 交叉验证委员会过滤法(Cross-validated committees filter,CVCF)
- 迭代分割过滤法(Iterative partitioning filter,IPF)
清洗爬虫数据
过滤无效曝光样本

2.3采样

好处
- 克服高维特征以及大量数据导致的问题,有助于降低成本,缩短时间甚至提升效果
采样方法：
- 无放回的简单抽样：每条样本被采到的概率相等且都为1/N
- 有放回的简单抽样：每条样本可能多次被选中
- 平衡采样,考虑正负比例
  - 上采样
    - SMOTE
    - ADASYN
  - 下采样
- 整体采样
  - 先将数据集T中的数据分组成G个互斥的簇,然后再从G个簇中简单随机采样s个簇作为样本集.
- 分层采样
  - 数据集T划分成不同的层,然后在每层内部进行简单随机抽样,最后汇总成样本集合S.该方法也常用于不平衡分类问题中,对每个类别进行采样,能使每个类别在样本集S中的分布和数据集T中的分布更为一致.

2.4原型选择

基于实例的方法,在样本选择过程中不需要训练模型,而是选取相似度或距离度量标准来找到分类精度和数据量最佳的训练集,多数采用KNN算法
根据从数据集T中选择样本集S的方法分类
- 递增法
- 递增法
- 批量法
- 混合法
- 固定法
根据选择样本的策略进行分类
- 包装法：根据模型的目标函数,一般是模型预测结果来进行样本选择
- 过滤法：样本的选择标准不基于模型
根据选择的样本进行分类
- condensation：保留决策边界处样本
- Edition：删除边界的异常点,使得边界更平滑
- Hybrid：尝试找到最小的样本集S,能够保持甚至提升测试集上的泛化精度

2.5训练集选择

构建预测模型来进行样本选择,比如决策树、ANN和SVM

3.交叉验证

3.1留出法

将数据集随机划分为互斥的训练集和测试集
缺点：训练集和测试集的划分验证影响最终结果
适用场景：数据有明显的时间序列因素,即线上数据的时间都在离线数据集之后
多次留出法：考虑到单词留出法得到的结论往往不靠谱,我们进行多次留出法,每次随机划分,最终将多次得到的实验结论进行平均.

3.2K折交叉验证

比如分成5份,每次用其他的4份作为训练集,用该份进行验证;可以训练5次
K值太小实验稳定性偏低,K值太大有可能导致实验成本高,常用K为5,10
留一法=N折交叉验证
- K=N时,就是留一法(Leave-one-out,LLO)即每一条样本当测试集,其余数据作训练
- 训练N个模型,每个模型都基本用到了全部的数据,得到的模型和全部数据D得到的模型更相似,并且不再受随机样本划分方式的影响,因为划分方式只有一种了.但是当数据量N很大时,计算成本非常高,当数据稀疏时,LOO很适用.
分层K折交叉验证(stratified K-Fold)

3.3自助法Boostraping

n个样本的样本集,重复有放回采样取n次,分成训练集和测试集
缺点：自助法改变了初始数据集的分布,会引入估计偏差

总结

数据量足够时,一般采用留出法和交叉验证法;
数据量较小时,并且难以有效区分训练集和测试集时,自助法很有用.

二.特征工程

数据和特征决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限而已.

1.特征提取

1.1探索性的数据分析（Exploratory Data Analysis）

发现内部数据的规律、检测异常值.
可视化技术：箱型图/直方图/多变量图/链图/帕累托图/散点图/茎叶图
定量技术：均值/方差/分位数/峰度/偏度

1.2数值特征

截断
- 连续型的数值进行截断或者对长尾数据进行对数后截断(保留重要信息的前提下对特征进行截断,截断后的特征也可以看作是类别特征)
二值化
- 如网站每天的访问量、餐厅的评论数、用户对一首歌的播放次数.大数据时代,计算可以非常快地增加,处理计算特征时,首先要考虑,保留为原始计数还是转换为二值变量来标识是否存在或者进行分桶操作.
分桶
- 均匀分桶：如商品的评论次数、年龄
- 分位数分桶：如果数值变量的取值存在很大间隔时,有些桶里没有数据,可以基于数据的分布进行分桶,例如利用聚类将特征分为多个类别.
缩放
- 标准化缩放(Z缩放)
- 最大最小值缩放
- 最大绝对值缩放
- 范数归一化：如使用L1范数、L2范数将数值向量的范数变为1
- 平方根缩放、对数缩放
  - 对数缩放适用于处理长尾分且取值为正数的数值变量
  - 二者都是方差稳定的变换,幂变换的特例
  - Box-Cox转换仅对取值为正数的特征起作用
  - 对于有异常点的数据,可以使用更加健壮的缩放,与一般的标准化基于标准差进行缩放不同的是,健壮的缩放使用中位数而不是均值,基于分位数而不是方差.
缺失值处理
- 补均值、中位数
- 使用模型预测缺失值
- 直接忽略,即将缺失作为一种信息进行编码喂给模型让其进行学习,现在有一些模型可以直接处理缺失值,如Xgboost模型可以处理缺失特征
特征交叉
- 针对两个数值特征做加减乘除,可以通过特征选择方法(如统计检验或者模型的特征重要性)来选择有用的交叉组合.有些特征交叉组合,虽然没有直观的解释,但有可能对于模型效果有很大的提升
- 自动进行特征交叉组合,如FM/FFM,特征交叉可以在线性模型中引入非线性模型,提升模型的表达能力.
非线性编码
- 线性模型往往很难学习到数据中的非线性关系,除特征交叉之外,也可以通过非线性编码来提升线性模型的效果.例如使用多项式核,高斯核等
- 将随机森林模型的叶节点进行编码喂给线性模型,这样线性模型的特征包含了复杂的非线性信息
- 基因算法/局部线性嵌入/谱嵌入/t-SNE等
行统计量
- 统计行向量中空值的个数、0的个数、正值或负值的个数
- 均值、方差、最大值、最小值、偏度、峰度

1.3类别特征

自然数编码
- 含有大小关系的数据,比如学生考试成绩,分为高中低三档,1表示高,2表示中,3表示低
独热编码
- 处理不具有大小关系的特征
- 缺点：
  - 会生成稀疏向量；
  - KNN在高纬度下两点之间的距离很难进行有效的衡量,在LR模型中,参数的数量会随着维度的增高而增加,任意引起过拟合现象.
分层编码
- 如邮政编码、身份证等,可以取不同维数进行分层,然后按层次进行自然数编码
散列编码
- 取值特别多的类别特征,使用独热编码得到的特征矩阵非常稀疏,因此在进行独热编码之前可以先对类别进行散列编码,可以避免特征矩阵过于稀疏
- 缺点：可能会导致特征取值冲突,这种冲突通常会削弱模型的效果,自然数编码和分层编码可以看作散列编码的特例.
计数编码
- 将类别特征用其对应的计数来代替,这对线性和非线性模型都有效.
- 缺点：对异常值比较敏感,特征取值有可能冲突.
计数排名编码
- 利用计数的排名对类别特征进行编码,这对线性和非线性模型都有效
- 缺点：对异常值不敏感,类别特征取值不会冲突
目标编码
- 基于目标变量对类别特征进行编码,对于基数(类别变量所有可能不同取值的个数)很大的离散特征,例如IP地址、网站域名、城市名、家庭地址、街道、产品编号等,用自然数编码,简单模型任意欠拟合,而复杂模型任意过拟合;对于独热编码,得到的特征矩阵太稀疏.对于高基数类别变量,有效方式是基于目标变量对类别特征进行编码,即有监督的编码方式,适用于分类和回归问题.
- 分类:采用交叉验证的方式,即将原本划分为5份,针对其中每一份数据,计算离散特征每个取值在另外4份数据中每个类别的比例.为了避免过拟合,也可以采用嵌套的交叉验证划分方法;回归问题同样采用交叉验证的方式计算目标变量均值对类别变量编码.
- 目标编码对于基数较低的离散变量通常很有效,但对于基数特别高的离散数量,可能会有过拟合的风险,对于很多类别特征的取值样本个数太少,不具有统计意义.这种情况,通常采用贝叶斯方式,即对统计特征进行贝叶斯平滑,如拉普拉斯平滑或者先验概率和后验概率加权平均的方式.
类别特征之间交叉组合
- 两个类别特征进行笛卡尔积操作：适用于两个(或多个)类别特征的基数较小的情况.
- 基于统计的组合
  - 如针对城市ID和商品ID两个类别特征,可以计算某个城市有多少不同的商品ID以及当前ID出现次数的分布,从而得到新的数值特征,或计算某个城市出现次数最多的商品ID,从而得到一个新的类别特征.
  - 对于多个类别特征也可以,如针对年龄、性别、产品ID三个类别特征,可以计算某个年龄段不同性别的人购买过多少产品或者对当前产品ID购买次数的分布等.
类别特征和数值特征之间交叉组合
- 通常是在某个类别中计算数值特征的一些统计量,如针对用户ID,统计过去一段时间内在网站上的浏览次数、购买次数、以及购买价格的统计量,如均值、中位数、标准差、最大值和最小值等;针对产品,统计用户对产品的评分、评价次数、购买次数、浏览次数等.
- 例如统计产品在某个区域的销量、产品的价格、或者当前产品的价格跟产品所在区域内的平均价格的差价等.

1.4时间特征

单个时间变量
- 年、月、日、时、分、秒、星期几、年的第多少天、一天过了多少分钟、季度、是否闰年、是否季度初、是否季度末、是否周末、是否营业时间、是否节假日
两个时间变量之间
- 计算产品上线到现在经过了多少时间、顾客上次借款距离现在的时间间隔、两个事件间隔是否包含节假日或其他特殊日期等.
时间序列相关的特征
- 如股票价格、天气温度、降雨量、订单量等
- 若问题是利用历史数据预测未来,则对于t时刻,可以将t-1、t-2和t-3时刻的值也作为特征使用,若问题可以考虑未来信息,则t+1、t+2、t+3时刻的值也可以作为特征使用【时间窗口宽度为1】
基于滑动窗口统计特征
- 如计算前n个值的均值(回归问题),或者前n个值中每个类别的分布(分类问题),时间窗口的选取可以有多种方式,上面提到的滞后特征是滑动窗口统计的一种特例,另一种常用的窗口设置包含所有历史数据,称为扩展窗口统计.

1.5空间特征

经纬度
- 做散列处理,从而对空间区域进行分块,得到一个类别特征
- 可以通过坐标拾取系统获得当前位置的行政区ID、街道ID、城市ID等类别特征,从而进行类别特征的处理方式进行特征预处理.
计算两个位置之间的距离
- 如用户到超市或者电影院、餐厅的距离.距离的计算方式有很多种,例如可以计算欧氏距离、球面距离、曼哈顿距离,也可以是真实的街道距离.

1.6文本特征

预处理
- 将字符转化为小写、分词、去除无用字符、提取词根、词干提取、标点符号编码、文档特征、实体插入和提取、word2vec、文本相似性、去除停用词、去除稀有词、TF-IDF、LDA、LSA等
语料构建
- 构建一个由文档或短语组成的矩阵,矩阵的每一行为文档,可以理解为对产品的描述,每一列为单词,通常,文档的个数与样本的个数一致
文本清洗
- 如果数据通过网页抓取,首先提出文本中的HTML标记;
- 停用词只用于语句的构建,但不包含任何真实的信息,因此需要剔除,
- 为了避免文本中的大小写差异,整个文本通常转换为小写形式;
- 统一编码;去除标点符号;去除数字;去除空格;还原为词根.
- 但是在某些情况下,文本不一定需要进行清洗,这取决于具体的应用场景.例如考虑某编辑员对某物品的描述,如果我们关心的对象是物品,则需要去除噪声,保留关键信息,但如果我们关心的对象是编辑员,则噪声信息一定程度上反映了此编辑员的水平.
分词
- 词性标注
  - 名词、动词、形容词;词性标注可以帮助我们了解语言的内在结构
- 词形还原和词干提取
  - 词性还原可以任何形式的语言还原为一般形式(能完整表达语义)
  - 词干提取是抽取词的词干和词根形式(不一定能表达完整语义)
- 文本统计特征
  - 不需要考虑词序信息,包括计算文本的长度、单词个数、数字个数、字母个数、大小写单词个数、大小写字母个数、标点符号个数、特殊字符个数等,数字占比、字母占比、特殊字符占比等,以及名词个数、动词个数等.
- N-Gram模型
  - 将文本转换为连续序列,序列的每一项包含n个元素(可以是单词),这种想法是将一个或者两个甚至多个单词同时出现的信息喂给模型.3-Gram是常用的选择
Skip-Gram模型
- 词集模型
  - 将文本转换为实数或实向量;在词集模型中,向量中的每个分量的取值为0和1,代表单词是否在文档汇总出现,向量空间模型没有考虑词序信息
- 词袋模型
  - 向量的每个分量的取值为单词在文档中的词频,为了避免向量维度太大,通常会过滤掉在文档集合中词频很小的单词.
- TF-IDF
  - TF(Term Frequency,词频)
  - IDF(Inverese Document Frequency逆文档频率),用于评估单词对于文件集或语料库中的其中一份文件的重要程度.
  - 单词或短语的重要性随着它在文档中出现的次数成正比增加,同时随着它在语料库中出现的频率成反比下降.
  - 可以基于文档的TF-IDF向量表示计算文档之间的相似度,但不能很好地表示特别长的文档,而且这种向量表示也没有考虑词序信息.基于TF-IDF和词袋模型得到的表示文本的向量往往维度非常大,因此实际应用中一般需要降维处理.
余弦相似度
- 计算检索词q和文档d之间的相关性.如将检索词和文档都表示为向量,计算两个向量之间的余弦相似度.
Jaccard相似度
- 两个文档中相交的单词个数除以两个文档出现单词的总和.
Levenshtein(编辑距离)
- 指两个字符串由一个转成另外一个所需要的最少编辑操作(如插入、删除、替换)次数,它也是衡量两个字符串相似度的指标
隐性语义分析
- 把高维的向量空间模型表示的文档映射到低维的潜在语义空间中,即采用将文档或词矩阵进行SVD分解,由于SVD分解本身是对文档特征进行排序,我们可以通过限制奇异值的个数对数据进行降噪和降维.一般而言,文档和文档或者文档和查询之间的相似性在简化的潜在语义空间的表达更为可靠.
Word2Vec
- 即将单词所在的空间映射到一个低维的向量空间中,这样每个单词对应一个向量,通过计算向量之间的余弦相似度就可以得到某个单词的同义词.

2.特征选择

2.1目的

简化模型；提高性能,减少内存和计算开销;改善通用性、降低过拟合

2.2前提

训练数据中包含许多冗余或者无关的特征,移除这些特征并不会导致丢失信息

2.3过程

特征产生过程
评价函数
- 衡量特征或特征子集的重要性或者好坏程度,因此需要量化特征变量和目标变量之间的联系以及特征之间的相互关系.为了避免过拟合,一般采用交叉验证的方式来评估特征的好坏
- 停止准则
  - 为了减少计算复杂度,可以设定一个阈值,当评价指标达到阈值后搜索停止
- 验证过程
  - 在验证集上验证选出来的特征子集的有效性

2.4方法

2.4.1过滤法

单变量
- 覆盖率
  - 如果特征的覆盖率低,则可以剔除
- 皮尔森相关系数
  - 计算两个特征之间的线性相关性
- Fisher得分
  - 对于分类问题,Fisher得分越高,则特征在不同类别间的差异性越大,在同类别中的差异性越小,则特征越重要
- 假设检验
  - 假设特征变量和目标变量之间相互独立,将其作为H0假设,选择适当检验方法计算统计量,然后根据统计量确定P值做出统计推断;卡方统计值越大,特征相关性越高
  - 特征变量=类别变量,目标变量=连续变量
    - 方差分析(Analysis of Variance,ANOVA)
  - 特征变量=连续变量,目标变量=连续变量
    - 皮尔森卡方检验
- 互信息(或KL散度/相对熵)
  - 度量两个变量之间的相关性,互信息越大表明两个变量相关性越高;互信息为0,两个变量越独立.
由于单变量过滤方法只考虑了单特征变量与目标变量之间的相关性,因此选择的特征子集可能过于冗余.
多变量
- 最小冗余最大相关性(mRMR)
  - 考虑到了特征之间的冗余性,具体做法是对跟已选择特征的相关性较高的冗余特征进行惩罚.
  - 不足：没有考虑到特征之间的组合可能与目标变量比较相关,某个特征一旦被选择了,在后续的步骤中不会被删除,
- QPFS
  - 通过二次规划求解,偏向于选择熵比较小的特征,这是因为特征自身的冗余性
- SPEC
  - 通过求解矩阵的主特征向量来求解,而且可以处理二阶的特征组合
- 相关特征选择(CFS)
  - 基于以下假设来评估特征集合的重要性:好的特征集合包含跟目标变量非常相关的特征,但这些特征之间彼此不相关;这里的相关性不一定是皮尔森相关系数或斯皮尔曼相关系数
- CFS、MBF、FCBF
工具包
- 数据量小
  - sklearn里面的feature_selection模块
- 数据量大
  - Spark MLlib

由于过滤方法与具体的机器学习算法独立,因此过滤方法没有考虑选择的特征集合在具体机器学习算法上的效果.封装方法直接使用机器学习算法评估特征子集的效果,它可以检测出两个或多个特征之间的交互关系,而且选择的特征子集让模型的效果达到最优.

2.4.2封装方法

完全搜索
- 思想：先用全部特征,然后去掉一个看看效果提升没
- 穷举
  - 广度优先搜索
    - 时间复杂度太高,不实用
  - 分支定界搜索
    - 在穷举搜索的基础上加入了分支限界,若断定某些分支不可能搜索出比当前找到的最优解更优的解,则可能剪掉这些分支
- 非穷举
  - 定向搜索
    - 首先选择N个得分最高的特征作为特征子集,将其加入一个限制最大长度的优先队列,每次从队列中取出得分最高的子集,然后穷举向该子集加入一个特征后产生的所有特征集,将这些特征集加入队列;
  - 最优优先搜索
    - 与定向搜索类似,唯一不同的是不限制优先队列的长度
启发式搜索
- 思想：先用少量特征,再慢慢加
- 方法：
  - 序列向前选择
    - 特征子集从空集开始,每次只加入一个特征,贪心
  - 序列向后选择
    - 特征子集从全集开始,每次删除一个特征
  - 双向搜索
    - 同时使用序列向前选择和向后选择,当两者搜索到相同的特征子集时停止
  - 增L去R
    - 若算法先删除R个特征,再增加L个特征
  - 序列浮动选择
    - 每次选择添加和删除的特征个数不是固定的
随机搜索
- 思想：执行序列向前或者向后选择的时候,此算法随机选择特征子集
- 模拟退火、随机爬山、基因算法

过滤方法与机器学习算法相互独立,而且不需要交叉验证,计算效率比较高,但是过滤算法没有考虑机器学习算法的特点;封装方法使用预先定义的机器学习算法来评估特征子集的质量,需要很多次训练模型,计算效率很低;嵌入方法则将特征选择嵌入到模型的构建过程中,具有封装方法与机器学习算法相结合的优点,而且具有过滤方法计算效率高的优点,是实际应用中最常用的方法.

2.4.3嵌入方法　

Lasso回归
通过对回归系数添加L1惩罚项来防止过拟合,可以让特定的回归系数变为0,从而可以选择一个不包含那些系数的更简单的模型.lambta越大,回归系数越稀疏,lambta一般用交叉验证的方法来确定;任何广义线性模型如逻辑回归/FM/FFM/神经网络模型,都可以添加L1惩罚项
- 基于树模型
  - 可以基于树模型中特征出现次数等指标对特征进行重要性排序;深度较浅的节点一般特征分类能力更强(可以将更多的样本区分开)
  - 如决策树、随机森林、梯度提升树
- SVM
  - 自带L2正则
- 工具包
  - 一般机器学习包的线性模型都支持L1正则,如Spark MLlib和Sklearn
  - sklearn中的随机森林;Xgboost包,支持根据不同指标(如增益或者分裂次数)对特征进行排序

三.模型选择

1.分类

传统机器学习：

深度学习：

2.回归

传统机器学习：

深度学习：

四.模型融合

1.定义

单模型即从数据训练而来的模型,也叫作基学习器、个体学习器、组件学习器
如果单模型是同一种模型,叫作同质模型融合;否则称异质模型融合

2.融合的意义

统计的角度：平均假设,可以得到一个逼近f的优化假设
计算的角度：同一份数据集,从不同的出发点进行计算
表示的角度：模型融合使得假设空间扩大

3.融合的理论

模型的误差分歧：单模型的差异性越大,最后融合的效果就越好
多样性独立：不一致度量、相关系数、Q统计、K统计、双次失败度量、KW差异、k度量、熵度量
多样性增强：数据样本的扰动、属性的扰动、输出的扰动、算法参数的扰动

4.融合的方法

4.1Bagging
- 思想
  1. 在包含Ｎ个样本的数据集中采用有放回的抽样方式随机抽取一定数量(可以为Ｎ)的样本，构成一个数据集；
  2. 按照步骤ｉ中的方式得到M个数据集；
  3. 利用机器学习的方法(例如：SVM，决策树，神经网络……)对得到的Ｍ个数据集，训练出Ｍ个弱模型(比随机模型效果好)；
  4. 集成M个弱模型的结果作为最终结果；
  Bagging就是通过Ｍ个弱模型的结果，通过并行集成的方式来获得最终结果。因为Ｍ个数据集是相互独立的，因此这Ｍ个弱模型之间也是相互独立的，在最终的集成结果时，每个模型的权重是一样的。这是和Boosting所不同的。
- 集成方式
  - 回归问题
    - Ｍ个模型结果的均值；
  - 分类问题
    - 对Ｍ个模型的结果进行投票决定，票数多的作为结果；票数一样，随机决定；
- 代表方法
  - RF
    - 理论
    - 调参
  - Extree
    - 理论
    - 调参
4.2Boosting
- 思想
  1. 每一次都根据上一次训练得到的模型结果，调整数据集样本分布，然后再生成下一个模型；
  2. 直到生成Ｍ个模型;
  3. 根据Ｍ个模型的结果集成得到最终的结果；
- 集成方式
  
  每个模型的重要度作为每个模型结果的权重，然后加权计算得出结果。
  
  可以看出Boosting中生成多个模型的方式并不是和Bagging一样并行生成，而是串行生成，因此也决定了多个模型结果的集成是串行集成,也就是每个模型的结果权重并不是一样的。如何来调整样本分布以及计算模型的重要度，不同方法有不同的定义，详情参见具体方法。
- 代表方法
  - AdaBoost
    - 理论
    - 调参
  - GBDT
    - 理论
    - 调参
  - XGBoost
    - 理论
    - 调参
  - LightGBM
    - 理论
    - 调参
  - CatBoost
    - 理论
    - 调参
4.3Stacking
- 理论
- 调参
4.4Blending
- 理论
- 调参

转载于:https://www.cnblogs.com/nxf-rabbit75/p/10939299.html

Blender 云渲染高效流程：渲染 101 集群加速实战渲染101专业云渲染 blender houdini 分布式服务器 maya
一、核心优势：适配Blender全场景需求✅全渲染器深度兼容Cycles（CPU/GPU模式）：云端4090显卡渲染速度比本地快12倍，支持8K分辨率+16K纹理无压力Eevee实时渲染：集群同步输出预览动画，帧间延迟控制在0.5秒内，迭代效率提升300%插件无缝衔接：自动适配GeoNodes节点树、Hair粒子系统，流体模拟缓存文件完整同步✅效率与成本双突破二、5步上云流程（新手友好版）文件预处
挂车“瘦身”方式盘点，轻量化挂车桥最高能承重多少？掌上说车
挂车轻量化可以说是一个老生常谈的话题，尤其是在当前治超力度加大、计重收费政策实施的条件下，如何能在法定的范围内运输更多的货物成了车主们关心的问题，越来越多的车主在选购挂车或配件的时候，开始倾向于那些自重更轻的产品。一般情况下，挂车想要实现轻量化，常见的途径有以下几种：1、使用自重更轻的材料，比如用铝合金代替钢材，常见的像铝合金车身、铝合金变速箱、铝合金传动轴、铝合金油箱、铝合金轮辋等；2、车辆外观
JAVAWeb2 DanB24 oracle 数据库
1.数据库设计1.软件的研发步骤数据库设计概念数据库设计就是根据业务系统的具体需求，结合我们所选用的DBMS，为这个业务系统构造出最优的数据存储模型。建立数据库中的表结构以及表与表之间的关联关系的过程。有哪些表？表里有哪些字段？表和表之间有什么关系？数据库设计的步骤需求分析（数据是什么?数据具有哪些属性?数据与属性的特点是什么）逻辑分析（通过ER图对数据库进行逻辑建模，不需要考虑我们所选用的数据库
崔律·100天挑战阅读《奇特的一生》【《奇特的一生》·Day57·如何评价自己的一生（1）冬夜读书YHY
这是“崔律精时力之100天挑战《奇特的一生》阅读”系列，今天是2019年3月30日一个人在离开了这个世界上以后。后人对他的评价是什么样子，在某种程度上也就决定了这个人在他的有生之年对这个世界做出的贡献吧。柳翁一生有一件非常固执的事情，就是长达几十年的时间记录时间统计时间计划。因为他的这种非常近乎于苛刻的这种方式，让他获得了很多的成就。同时，以它在生物学上的一些贡献，让他的后来的后继者会记住。会沿着
你永远叫不醒一个装睡的人，等他自己醒的时候已经晚了鱼和熊掌兼得
在办公室批改作业，旁边的两位老师在聊天，说起以前上学时的事情。一位老师说：“高中三年我都是混过来的，最后还考上中专，大家都替我可惜，觉得我要是努力一点能考的更好，只有我自己没啥感觉。”“当时能考上中专已经很不错了，成绩下来的时候我开心坏了。现在知道后悔了，那时候要是用点心就好了。”“那你爸妈也不管你吗？”“一开始管我很严，成绩很不错。后来我爸工作调动，我也跟着回来了。家里有一个大爷是重男轻女，只要
录音转写：颠覆传统共享下载体验 | 如何提升团队效率？ Ai一拾光人工智能个人空间语音识别智能写作
一、为什么必须“智转”+“共享”？录音≠文本：领导真正想要的，是3分钟能读完的纪要，而不是2小时从头听。共享≠发送：临时链接、7天失效、VIP限速，都不叫共享，那叫“施舍”。团队作战：需求评审、设计、开发、测试、运营，五路人马都在等同一批素材，必须“一处上传、全员秒达”。————————————————二、技术选型：我们为什么放弃“大而全”，拥抱“小而美”传统网盘：上传快、下载慢，会员费年年涨；N
D065+8组煎果子+《高效能人士的7个习惯》读书笔记煎果子
习惯一：积极主动时下盛行的社会观点认为，环境与条件对我们起着决定性的作用。我们不否认条件作用的影响巨大，但并不等于承认它凌驾于一切之上，甚至可以决定我们的命运。在外界的刺激与最后的回应之间，人拥有选择的自由，这也是人与动物之间最大的不同。史蒂芬•柯维指出，看一个人的时间和精力集中于哪些事物，就可以大致判断出他是否积极主动。作者将我们关注的问题分成两类：关注圈和影响圈。关注圈，是指我们关注的问题，包
何旖莎携联盛新能源摘得CFS2025双奖，以新质生产力引领能源变革联盛新能源联盛新能源何旖莎 CFS2025 CFS2025双奖
2025年7月16日，在上海盛大开幕的CFS2025第十四届财经峰会暨新质生产力企业家大会上，联盛新能源集团凭借卓越的创新实力与行业影响力，一举摘得两项重量级奖项！集团董事长何旖莎获评“2025（行业）影响力人物”，其标杆项目“河南郑州嵩基集团45MW/133MWh用户侧储能电站”则摘得“2025杰出创新解决方案奖”。双奖同辉，彰显了联盛新能源在推动能源新质生产力发展中的领军地位。作为中国经济领域
白帽必备技术栏目一（javascript基础）
直接进入主题正好也在带学生会把笔记同步发送到csdn上后期不管是去就业还是在家里挖洞都都行javascript基础注意事项局部作用域里面给到的变量不加var就会变成全局变量数据类型boolean布尔类型boolean除了0和空字符串以及nullundefined其他的都是truevarbool=true;varbool=false;number类型varnum=10;//10varnum=0x23
“双531”启示录：政策轮回中的进化密码联盛新能源 136号文联盛新能源光伏储能新能源
导语当2025年6月1日“136号文”（《关于深化新能源上网电价市场化改革促进新能源高质量发展的通知》）正式实施，“531”这个数字再度成为新能源行业的命运符号。表面看，两者都带来装机量骤降、价格雪崩、企业出清。但深层次看，这是行业从青春期阵痛到成年礼蜕变的关键跃迁。理解两次531的相似基因与进化差异，方能看清新能源产业的未来路径。共性基因：政策倒逼出生存法则市场震荡：从断奶阵痛到出海突围2018
小程序框架单元测试：Jest在不同框架中的配置与使用小程序开发2020 小程序开发宝典小程序单元测试 log4j ai
小程序框架单元测试：Jest在不同框架中的配置与使用关键词：Jest、单元测试、小程序、Taro、uni-app、WePY、测试配置摘要：本文将深入探讨如何在不同的小程序框架（Taro、uni-app、WePY）中配置和使用Jest进行单元测试。我们将从基础概念讲起，逐步深入到具体配置和实战案例，帮助开发者掌握小程序单元测试的核心技能，提升代码质量和开发效率。背景介绍目的和范围本文旨在帮助小程序开
追你时装高冷,我选呆萌校花你哭啥？(程实夏宁虞白薇)全文免费阅读无弹窗大结局_(程实夏宁虞白薇)程实夏宁虞白薇最新章节列表_笔趣阁（追你时装高冷,我选呆萌校花你哭啥？）一米文库
追你时装高冷,我选呆萌校花你哭啥？(程实夏宁虞白薇)全文免费阅读无弹窗大结局_(程实夏宁虞白薇)程实夏宁虞白薇最新章节列表_笔趣阁（追你时装高冷,我选呆萌校花你哭啥？）书名：追你时装高冷,我选呆萌校花你哭啥？主角：程实夏宁虞白薇简介：什么叫恐怖如斯？这就叫恐怖如斯！老程跟袁女士，都激动的发抖。“儿砸，咱真能上清华北大啦？”老程不住拍着程实肩膀，一下重过一下，直到把程实拍得龇牙咧嘴。“爸，你对面派来
虚函数和多态应用场景 yshi2017
有两个类，在一个类添加函数的时候，另一个类也需要添加，这个时候可以提出一个基类讲这个函数作为一个基类的函数，子类实现这两个函数，比如此函数为outPut();调用基类函数方式：BaseClass::outPut();
中华民国三年袁大头艺术人生88
直径约：3.88cm,重量约：25.5g此枚三年袁大头，藏品虽然经历了无穷的岁月的洗礼，但是如今保存依然较为完好，其色泽光鲜自然，纹饰深浅适度，边缘线条粗细均匀，间距也疏密一致。人像、发丝、胡须、穗忙等细微之处清晰有度，生动自然。民国三年“袁大头”正面为袁士凯五分侧面像，上列“中华民国”六字，背面两条嘉禾，左右交互，下系结带，具有一定的保值和升值功能。尤其是近年来随着收藏投资热的不断升温，“袁大头
2023-08-13 Dongkl122
祝福宽恕，宽恕他人对你的冒犯。宽恕，宽恕计较他人的自己。并无被宽恕者，也无宽恕的你。宽恕，本是接纳，也只有接纳。接纳，是宽恕实质的性质。接纳中，无有所接纳，也无接纳者。于是，接纳是平安，只有平安。平安熄灭了恐惧，恐惧消散则离分别。亘古与当下，在平安中。生死与烦恼，性自平安。平安即是圣主，与众生同在。圣主在众生中，以平安赐福。————————————————————当年为了，让真理传播，令佛法振兴，
笔趣阁&《生命最后倒计时，妻子选择丢下我跑路》郑薇顾源~精彩言情新书免费阅读神书阁
笔趣阁&《生命最后倒计时，妻子选择丢下我跑路》郑薇顾源~精彩言情新书免费阅读主角：郑薇顾源简介：生命进入了倒计时，妻子却对我百般折磨。侮辱！殴打！在我面前和其他男人做苟且之事！我要让这个女人付出代价！----阅读全文小说内容请翻阅文章最底部---第1章三周年结婚纪念日当天，我和郑薇提了离婚。别人都以为我们浓情蜜意，是圈子里的模范夫妻。只有我知道，郑薇爱的人，一直是她的青梅竹马。郑薇拒绝了我的提议，
过来人都说，夫妻还是原配的好一天情感随笔
常听父辈人说：“夫妻还是原配的好，人这辈子最重要的还得是婚姻，古人言，宁拆十座庙，不破一桩婚”。这句话在我们家乡常常用来，劝说小俩口吵架厉害时，闹离婚所用的箴言。在父辈人眼里，他们对婚姻的解读和理解都有自己的独到之处。为什么在如今这个物质丰满的社会，很多人的婚姻不太稳定，甚至用尽了所有的力气和所有的精力，终其多年还是把不住婚姻这道门。婚姻是两个人一起携手经营，苦心修炼多年的结晶。我们每个人都置身于
晨间日记的奇迹读后感6-10 优雅生活_9919
【今日阅读页数】6--10【金句】早上写日记之后，觉得整个人神清气爽，于是一整天下来，工作的情绪也承接了早上的愉悦情绪。【感悟】早上起床后，精力充沛，虽然没有达到作者的这种状态，但也略微有所感触，也开始写自己的晨间日记了，养成写晨间日记的习惯，拥抱人生梦想！
#不要脸——2021-05-24转载藍芷苡夢
即便不与人为善，也别作恶，因为你的无礼拉低你的人品。当不要脸的人得到的不是好处，而是谴责和唾弃，自然就没了“不要脸”的市场和底气。面对世事扰攘，阴暗和颓败，我们能做的，是坚守自己的底线，不再为不要脸的人买单，不再一味包容忍让，坚决不能把好好的世界，让不要脸的人搅坏了。只有这样，不要脸的人才会越来越少。而世界变好，就是从不要脸的人变少开始。
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
3月1日记录一路前行乐在其中
昨天做了小蓝本8.居然12道题目也花了一小时？晚上电学甬真做了一些，正确率可以，说好以后每天晚上回来做十题。乐乐对科学的兴趣远高于数学。
13威霖引导孩子表达感受很重要威霖_e363
这两天，姨妈带着小侄子来我家玩，顺便看看我和宝宝。小侄子叫萱萱，五岁大，长的高高壮壮，看上去像是已经上了小学三年级的学生一样。虽然只有五岁，但是特别喜欢小孩，也非常乐意帮忙带小孩，每次都主动要求帮忙，性格也比较开朗，招人喜欢。然而这两天我发现他有个极其不好的坏习惯，就是爱打人，和长辈瞪眼睛，甚至拳打脚踢，尤其是对他姥姥。原本我没打算介入他的教育问题，但是仅仅两天时间，就发生了三四次类似的事情，而大
这五节课浸润在书香里渡过（一）——教师小组读书分享，我一直在场教育行走林
今天上午第三节课一直到下午第四节课我始终在三楼会议室，基本没有动地方，听取七八年级五个小组的四月份阶段性读书交流汇报。四月份共读书目为于永正老师的《教海漫记》，但因为疫情原因，没有办法买快递，所以有的老师纸质版书没有能够及时买到，就读的电子书或者读的其他书目，当然这里面也包括个别人耍小聪明——嫌书贵，没有买这本书，书贵吗？买化妆品、买衣服、买鞋、买零食毫不心慈手软，一点也不嫌贵，说到底是思想认识的
2019年10月10日天气晴 Dandelion_d123
早上八点下班，回到家就开始睡觉，一觉睡到下午两点才感觉自己又活了过来，每上完一个夜班就是一次劫后重生。两点起来洗漱，三点出门，先在美团上预约好跑腿的把卖给同城的洗衣液送出去，然后再去了交通银行去解封银行卡。说到这个交通银行卡的挂失当时有个挺大的乌龙，差不多三月份吧，我也是早上下了夜班去食堂吃了早饭，然后把包忘在食堂了，自己没发现，等到家了才发现包没了，一直以为是在公交车上遗失的，然后各种找也没找到
七绝·稻盛和夫（二）四季的眺望
七绝·稻盛和夫（二）【上平十四寒】新衣珍贵兄情厚，家信无辜弟实难。背水执拼迎曙色，人和立业涌奇澜。您好，如果感到文章还有点行，请点个赞再走，最好还请在评区刷点简言，让四季能眺望见您惊鸿的一鸣。以心换心，福德往来。作者的话：我是四季的眺望！原创是我的风格！
广州花都区权威10家亲子鉴定中心一览(附2024年8月汇总鉴定) 民鉴基因科普
广州花都区亲子鉴定中心：400-9989-716（微信号：gao897160）亲子鉴定是对家庭关系和法律问题的重要考验，因此选择专业权威的亲子鉴定机构非常重要。在选择亲子鉴定机构时，应考虑机构的专业性、信誉和客户声誉。广州花都区一些专业权威的亲子鉴定机构包括：广州花都区民鉴基因亲子鉴定中心。这些机构一般都有经验丰富的专家和科研团队，可以提供准确可靠的亲子鉴定结果。广州花都区权威10家亲子鉴定中心一
C#程序唯一性守护：用互斥锁（Mutex）实现进程级安全控制的实战指南
为什么程序重复启动是个"毒瘤"？在软件开发中，程序重复启动可能导致以下灾难性后果：资源冲突：多个实例争夺数据库连接、文件句柄等有限资源数据污染：并发写入配置文件导致内容错乱界面混乱：多个窗口同时弹出，用户体验崩坏安全漏洞：恶意程序通过伪造实例窃取数据而互斥锁（Mutex）是Windows/Linux系统提供的原生机制，能完美解决这些问题。相比文件锁、注册表标记等传统方案，Mutex具有以下不可替代
《披荆斩棘》：把没人要的歌唱成第二名，初代披哥这三招真绝 windy天意晚晴
《披荆斩棘》二公舞台来了，虽然目前只更新了上半场，但是可以看出，这一次的舞台要比上一次更加惊艳。尤其是《心如止水》的舞台，水火交融，令人震撼。不过最令人惊喜的，还是张智霖、李承铉和麦克的《伤心的人别听慢歌》，居然能排名第二。要知道，当时选歌时，这首歌可是没人要，要不是陈小春没有理解规则，他们也不可能选择这首歌。但就是这首没人要的歌，在张智霖的演绎下成了上半场第二名，可见初代披哥还是挺有办法的。总结
华为路由器PPP MP与CHAP验证实验详解神秘人X707 网络服务器
实验拓扑图实验目的R1和R2使用PPP链路直连，R2和R3把2条PPP链路捆绑为PPPMP直连按照图示配置IP地址R2对R1的PPP进行单向chap验证R2和R3的PPP进行双向chap验证实验步骤1.R1和R2使用PPP链路直连，R2和R3把2条PPP链路捆绑为PPPMP直连步骤一在R2上创建MP-GROUP口[R2]intMP-group1步骤二把S1/0和S2/0加入到上一步创建的MP-GR
感恩日记20180515 兰姐美式减脂倡导者
图片发自App1，感恩安静的打坐冥想时间，没有受到干扰。2，感恩卡瘦+美味的豆浆+黑芝麻+枣夹核桃，是我完美的早餐，唇齿留香，能量满满。3，感恩午间做了个冥想，舒服极了。4，感恩老爸给我去批发市场买了十公斤南瓜子，只因我说了句我想吃南瓜子。对父母的爱，真的无以回报，只有让自己过的更幸福。5，北京好友发200块红包给我，请我吃哈根达斯，谢谢，这份美意必须领，必须去吃。感恩在北京一起星巴克的美好时光。
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

机器学习---一个完整的机器学习目录

一.问题建模

1.评价指标

1.1分类指标

二分类

精确率

召回率

F1值

P-R曲线

ROC曲线

AUC

对数损失

多分类

准确率

错误率

1.2回归指标

平均绝对误差MAE

平均绝对百分误差MAPR

均分根误差RMSE

1.3聚类指标

1.4排序指标

平均准确率MAP

NDCG归一化贴现累计收益

2.样本选择

2.1好处

2.2数据噪声

2.3采样

2.4原型选择

2.5训练集选择

3.交叉验证

3.1留出法

3.2K折交叉验证

3.3自助法Boostraping

总结

二.特征工程

1.特征提取

1.1探索性的数据分析（Exploratory Data Analysis）

1.2数值特征

截断

二值化

分桶

缩放

缺失值处理

特征交叉

非线性编码

行统计量

1.3类别特征

自然数编码

独热编码

分层编码

散列编码

计数编码

计数排名编码

目标编码

类别特征之间交叉组合

类别特征和数值特征之间交叉组合

1.4时间特征

单个时间变量

两个时间变量之间

时间序列相关的特征

基于滑动窗口统计特征

1.5空间特征

经纬度

计算两个位置之间的距离

1.6文本特征

预处理

语料构建

文本清洗

分词

词性标注

词形还原和词干提取

文本统计特征

N-Gram模型

Skip-Gram模型

词集模型

词袋模型

TF-IDF

余弦相似度

Jaccard相似度

Levenshtein(编辑距离)

2.4.3嵌入方法