Lyteins

《美团机器学习实践》笔记

偶然在群里看到了《美团机器学习实践》这本书的pdf资源，而美团又是一直以来我最敬佩的公司之一，之前从美团技术团队那个账号学到了很多，所以拜读一下这本书，这里简要整理一下读书笔记。
全书总共分为通用流程、数据挖掘、搜索与推荐、计算广告、深度学习、算法工程这几部分，涉及范围较为广泛。

一、通用流程

1.问题建模

一个问题拿到手，需要通过机器学习的方式进行处理，首先要通过评估指标、样本选择、交叉验证等一系列方式进行问题建模，而后特征工程、模型选择、模型融合，最后应用。

1.1评估指标

评估指标分为机器学习评估指标与业务指标，分别用于线下与线上。为保证线下指标与线上指标变化趋势一致，通常需要多轮模型迭代。通常评估指标按照任务类型可分为分类、回归、聚类、排序等。

1.1.1分类

对于分类指标，精确度(precision)和召回率(recall)分别表示在二分类中真实正例占全部预测样本和全部正例的比例。通常在同一个模型中，一项的升高会导致另一项的降低，此时以recall作为横轴、precision作为纵轴作PR曲线，PR曲线越靠近右上角也就是与横轴围成面积越大表示模型越好。若是用一个指标表示这两个，则可使用 $F_1$ 指标，也就是以上两项的调和平均值。除此外，也可使用准确率(accuracy)，表示预测正确的样本数占全部样本数的比例，因此accuracy可用于多分类。
另外一个重要的指标为ROC曲线，其横轴为假正率(FPR)也就是估计为正例的负例占全部负例的比例，纵轴为真正率(TPR)是估计为正例的正例占全部正例的比例，ROC越接近左上角越好，在数据量较少时，ROC曲线通常不平滑，随着数据量增多而逐渐平滑。ROC曲线与横轴围成的面积称为AUC(Area Under Curve)，一个重要特性就是AUC等于Wilcoxon Test of Ranks，计算方式为任意挑选一个正样本与负样本，正样本输出概率值高于负样本的概率，这也是实际算法中AUC的计算方式。AUC与排序顺序高度敏感，但对输出概率是否准确就没那么敏感。
logistic loss，也就是所有样本logistic loss或者cross entropy的平均值，用于表示二分类或多分类中，预测概率分布与真实概率分布的差异性，与AUC相对，其对排序结果不敏感，但是对预测概率值敏感。

1.1.2回归

平均绝对误差(Mean Absolute Error，MAE)，也就是 $L_1$ 范数，是对数据分布的中值进行拟合，但是若是损失函数有二阶导如XGBoost时则不能直接优化，可考虑次梯度。在此基础上，也可对不同样本进行加权，如考虑时间因素。在MAE基础上除以真实值，则表示偏理的百分比程度，注意此时在真实值等于0的地方无意义。
均方根误差(Root Mean Squared Error，RMSE)，最为常见，表示预测值与真实值的标准差，是对数据的平均值进行拟合，对离群点比较敏感。或者将预测值与真实值取对数后再进行MSE，此时对预测值偏小的样本惩罚大于预测值偏大的(由于对数曲线的特性)。

1.1.3排序

排序常见的有平均准确率均值(Mean Acerage Precision，MAP)和归一化贴现累计收益(Normalized Discounted Cumulative Gain，NDCG)，这部分在另一篇关于Learn To Rank的文章中详加描述。

1.2样本选择

样本选择的目的在于从完整训练集中找出一个子集，使得训练出的模型效果近似不变差。

1.2.1数据去噪

数据中不可避免地存在噪声，训练集中适当引入噪声也可以增强模型的健壮性。数据去噪指的是去除标注带噪声的样本，但是对于特征带有噪声的样本通常不去除，而是将缺失噪声也作为一个特征，表达一定的信息。

1.2.2采样

在类别不平衡的训练集中，通过采样可以实现平衡样本比例。一个好的样本子集应具有无偏性，即样本期望等于全体样本期望。采样方法常见的有有放回的、无放回的、分层采样等，其中分层采样常用于不平衡分类问题，按照不同类别样本占总样本比例进行采样。

1.3交叉验证

为防止全部样本用来训练造成的过拟合现象，通常采用交叉验证。其中留出法(Hold-Out)指的是按照一定比例将全部数据集划分为互斥的两部分，如2：1，实际上并没有进行“交叉”，但是有些应用场景如和时间序列有关，通常需要将时间靠前的样本划分为训练集，靠后的划分为测试集。
K折交叉验证(K-fold Cross Validation)是最常见的交叉验证方式，即将完整数据集划分为K份互斥数据集，常用5和10，然后每次选一份作为测试集，其他用于训练，将K次测试结果取平均。
自助法(Bootsrapping)是以有放回的方式进行采样，从m个样本中采出m个，计算概率为0.368的样本会被采到，可用于解决数据集较小的情况，但是采集的数据分布与原分布不同，因此在数据充分时通常不使用。

2.特征工程

众所周知，为了达到较好的效果，通常有复杂的模型+简单的特征和简单的模型+复杂的特征两种方式，而在实际应用中，更重视数据清洗和特征构建。

2.1特征提取

特征的提取通常需要对业务的深刻理解，比如在酒店搜索排序中，浏览次数等计数特征、点击率等比率特征、价格均值等统计特征都是可以构建抽取的特征。
对于数值型特征，主要考虑其分布与大小。线性模型如LR等，或者DNN，对输入特征的大小敏感，而树类型的如GBDT则对特征大小不敏感，不需要归一化。常见处理方式为各种离散化，比如对于长尾数据，先进性对数变换后选取一定阈值进行截断，或者根据特征数值大小进行离散区间划分，或者根据累计概率值进行离散区间划分。也可以对数值特征进行缩放，比如z-score或者用 $L_1$ 范数进行归一化。对于缺失值，可采用均值填补，或者直接讲缺失作为一类特征，现在一些模型如XGBoost可以处理缺失值，在训练时直接忽略缺失值，预测时则直接分入右子树。贝叶斯模型、树模型、大数据量下用DNN对缺失数据均不敏感，但与距离相关的模型如SVM和KNN则对缺失值十分敏感。另外，对于新特征的构建，可采用特征交叉，或者高斯核等非线性编码，或者输入GBDT等树模型后将输出叶节点值作为新特征交给LR。
对于类别特征，常见的是进行One-Hot编码。另外，也可进行计数编码、计数排名编码等。
时间特征在推荐排序实际应用中是一个非常重要的特征，通常采用前面时刻的特征对接下来的进行预测，或者采用滑动窗口统计特征。在YouTube的文章中，采用了将用户以往观看记录的特征进行均值处理输入，而阿里的DIN模型，则是根据特征之间的相似程度进行加权，权重通过数据进行训练。如何挖掘时间序列特征，对提高推荐效果有着重要的意义。空间特征则可以进行计算距离、聚类后编码等方式进行处理。
对于文本特征，包含多个词语，常见的有N-Gram、Skip-Gram或者近年来的word2vec模型，这又涉及到NLP中的一个重要方面，这里不展开讲述。

2.2特征选择

本身存在的特征加上交叉组合和构建的特征，往往会产生冗余、过拟合、计算复杂等问题，因此需要对特征集进行一定提取筛选。首先可以比较特征变量和目标变量之间的相关性，如覆盖率，即特征在训练集中出现的比例，或者皮尔逊相关系数，这个可以很好的度量两个变量之间的线性相关度，表达了消除了便准差影响的余弦相似度，又或者进行卡方检验。另外，皮尔逊相关度也可以检测不同特征之间的相关程度。应用树模型，本身非叶节点对特征的选取也会确定特征的重要性排序，因此可以通过GBDT先进行特征重要度排序后再进行选取。除此外，正则项的添加，尤其是 $L_1$ 正则项，本身就可以进行特征的筛选，使重要程度较低的特征系数为0。

3.常用模型

常用模型就不讲述了，无非是LR类的线性模型，或者XGBoost等集成树模型，或者DNN模型。在工业界尤其是新闻、广告、推荐等的线上运行，通常采用LR系列的模型，因为模型相对简单，可以实现实时快速更新，Google提出的FTRL算法集合了FOBOS算法、RDA算法等的优点，加入了 $L_1$ 和 $L_2$ 正则项以0和过往的参数同时对现在的参数 $w$ 进行了正则化处理。FM类的模型是在LR基础上增加了特征之间的二阶组合，可以看作对高维稀疏特征的embedding。或者采用GBDT等树模型，将连续特征进行处理，以输出值作为新的特征加入LR。

4.模型融合

模型融合经常会在比赛中后期大放异彩。常见的有回归问题中的平均法、分类问题中的投票法等。有两种方法重点提一下，一个叫Bagging，是通过有放回的对数据集采样同样多的样本，类似于自助法，T次后用这T份数据训练T个但模型，将每个但模型的结果用平均法或投票法进行融合。Bagging是一种并行的方法，通过重采样的方法降低了模型过拟合的可能性。另一种叫做Stacking，这种方法是通过分级的方式，以二级为例，首先通过K-fold将数据分为K份后，每次选用K-1份训练，对剩下的一份做预测，用这1/K个数据作为第二级模型的输入值，在完全进行结束后，得到全部数据的新的输入值和输出值，输出值为真实label，然后对于新的数据，首先使用一级模型得到预测结果作为二级模型的输入值，然后送入二级模型进行预测。在线上运行时，考虑到响应速度，一般谨慎使用模型融合。

你可能感兴趣的:(《美团机器学习实践》笔记)

【gopher的java学习笔记】代码分层之controller和service ThisIsClark gopher的java学习笔记 java 学习笔记
在Java的Web开发中，Controller层和Service层是两个至关重要的层次，它们各自承担着不同的职责，共同协作以实现复杂的应用程序功能。本文将详细介绍Java中Controller层和Service层的技术特点和作用。一、Controller层（控制层）Controller层是应用程序的入口点，负责接收用户的请求并处理。它通常处理来自前端或客户端的请求，并将请求转发给相应的Servic
[论文笔记] Megatron: mistral sliding window（ImportError: /workspace/venv/lib/python3.10/site-packag报错解决）心心喵论文笔记论文阅读
pyTorch—TransformerEngine1.2.1documentation论文：https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention（新版本2以上，这里用的最新版本2.5.2）里对sliding_window的实现。所以不需要用transformerengine。直接用
python学习笔记---中文词云 DiAsdream 数据分析学习 python 学习开发语言
python学习笔记–中文词云提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加发现词云的展示还挺有意思的，比较多的应用场景是给用户打标签，社交软件应用较多。今天随便找了一些文字电影《肖申克的救赎》的一些评价，做了一个词云，其实还挺简单的。Python的学习路上真的需要这样的小成功来激发更多学习的动力。Comeon！提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章
阿里二面准备(Java 研发)，精心准备200题（含答案）收割 offer 跟着我学Java 面试程序员 Java java 面试开发语言后端 Java开发
这篇文章我花了两天编辑，是目前我能找到的几乎所有的问题。所以你们如果能全部掌握，基本就能收割offer了。时间有限的话，针对自己的情况优先选最有可能被问到的问题来准备。文中的200道题大部分都包含了答案，希望对要参加面试的读者有一定的帮助，这是小编为了准备面试阿里二面所准备的面试题，出来收集了200道高级Java面试题之外，小编同时整理的Java核心笔记，Java架构面试专题整合200道（pdf文
读书笔记-你不知道的js(中卷) 道甚夷 js陷阱前端原理 javascript 前端开发语言
类型值和类型js中的变量是没有类型的，只有值才有。undefined和undeclared是不同的，前者是已经申明但没赋值，后者是未定义。varaa//undefinedb//ReferenceError:bisnotdefined报错varatypeofa//undefinedtypeofb//undefined不会报错，typeof有安全机制写polyfill有用数组delete数组单元后，数
学习笔记： MySQL进阶篇一之架构和日志文件蜗牛_snail 学习笔记 mysql
MySQL架构图Connectors连接器：负责跟客户端建立连接ManagementServeices&Utilities系统管理和控制工具ConnectionPool连接池：管理用户连接，监听并接收连接的请求，转发所有连接的请求到线程管理模块SQLInterfaceSQL接口：接受用户的SQL命令，并且返回SQL执行结果Parser解析器：SQL传递到解析器的时候会被解析器验证和解析Optimi
helm介绍和helm部署应用到k8s集群（helm+k8s）——详细文档运维实战课程 docker和k8s学习文档 docker kubernetes 运维
helm介绍和helm部署应用到k8s集群（helm+k8s）——详细笔记整理文档相关配套软件包和文档网盘地址:https://url28.ctfile.com/f/37115828-599686627-f6a619?p=4907访问密码：4907本人会经常更新运维相关技术文档，如有兴趣，可以关注我博客，欢迎互动分享1.为什么使用helm和部署大量应用时传统部署方式面临的挑战?K8s上的应用对象，
【Python・统计学】卡方检验（原理及代码） TUTO_TUTO python 统计学 python
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎）本文重点：卡方检验（非参数检验的一种）【1.卡方检验的简单原理和前提条件】【2.卡方检验的数据实例】【3.卡方检验代码以及残差分析】关于“参数检验”和“非参数检验”的不同，请参考以下文章。【统计学】参数检验和非参数检验的区别和基本统计学1
openmv模块学习笔记：openmv瞳孔识别代码详细解析 DIY机器人工房 openmv学习笔记计算机视觉人工智能深度学习 opencv python 学习笔记
这段代码的主要功能是使用OpenMV摄像头持续采集图像，通过Haar级联分类器检测图像中的眼睛，然后在检测到的眼睛区域内寻找瞳孔，并使用矩形框标记眼睛、十字形标记瞳孔的位置，同时输出程序的处理帧率。#瞳孔识别例程##这个例子展示了如何找到图像中的眼睛后的瞳孔（瞳孔检测）。该脚本使用#find_eyes函数来确定应该包含瞳孔的roi的中心点。它通过基本上找到瞳孔#中心的眼睛最黑暗的区域的中心。##注
嵌入式MCU笔记——GPIO charlie114514191 嵌入式面试笔记整理单片机嵌入式硬件 GPIO
目录模式初始化步骤速度几个典型的引用GPIO是通用输入输ＧＰＩＯ出的简写，也就是单片机的一个通用的输入输出接口。他的作用是：控制设备同外设之间的交互模式GPIO常见的输入输出模式有8钟模式。输入输出是对半开的。输入模式有四种：浮空输入、上拉输入、下拉输入、模拟输入浮空输入的引脚状态是不确定的，在没有外力作用的时候，我们并不知道此时此刻是高电平还是低电平。上拉输入是使用一个上拉电阻将状态确定为高电平
Ansible详细学习笔记和实战案例沉淅尘 Linux #Ansible 运维 Ansible 自动化 linux
Ansible详细学习笔记和实战案例（容易忘记的内容）一、主机清单ansiblelocalhost-mcommand-a"ls"##主机列表文件cat/etc/ansible/hosts主机描述形式：主机IP地址和主机名##blue.example.com##192.168.100.1散列主机列表和主机组列表散列主机列表主机组列表嵌套主机组列表##blue.example.com##[webser
R语言学习笔记5-数据结构-多维数组 Colin♛ R语言 r语言学习笔记开发语言数据结构
R语言学习笔记5-数据结构-多维数组多维数组(array)介绍特点和用途创建多维数组多维数组的索引和切片多维数组的运算获取多维数组的维度和属性多维数组的合并和拆分多维数组的逻辑操作多维数组的转置和重塑多维数组的元素操作多维数组的统计函数多维数组的循环操作使用reshape2包的melt()和dcast()函数利用purrr包对多维数组进行函数应用对多维数组进行条件筛选和替换多维数组的子集选择使用d
R语言学习笔记6-数据框 Colin♛ r语言学习笔记开发语言信息可视化
R语言学习笔记6-数据框数据框(DataFrame)介绍数据框用途创建数据框从矩阵创建数据框索引和切片添加和修改列数据框的预处理数据框的排序数据框的筛选处理缺失值应用函数处理数据重塑数据框使用dplyr进行数据框的管道操作数据框的时间序列操作大数据框的处理数据框的绘图数据框的文本处理数据框的连接与关联按行或列连接数据框按键值关联数据框数据框的条件处理与逻辑操作条件筛选逻辑操作数据框的汇总与统计分析
corba学习笔记一枚前端猿
CORBA公用对象请求代理（调度）程序体系结构（CommonObjectRequestBrokerArchitecture），缩写为CORBA，是对象管理组织（ObjectManagementGroup）对应当今快速增长的软硬件的协同工作能力的要求而提出的方案。简而言之，CORBA允许应用程序和其他的应用程序通讯，而不论他们在什么地方或者由谁来设计。CORBA曾经是分布式计算的主流技术，在电信等领
二、机器学习模型评估与选择没见过西瓜嘛机器学习学习笔记机器学习人工智能数据分析
机器学习模型评估与选择学习笔记一、核心概念1.1经验误差与过拟合误差相关定义错误率与精度：分类错误样本数占样本总数比例为错误率E=a/mE=a/mE=a/m，精度=1-错误率。训练误差与泛化误差：学习器在训练集上误差为训练误差（经验误差），在新样本上误差为泛化误差，泛化误差越小越好。过拟合与欠拟合过拟合：学习器把训练样本学得“太好”，将训练样本特点当作所有样本一般性质，导致泛化性能下降。欠拟合：学
WGCLOUD的【工作笔记】功能使用介绍服务器运维kubernetes
WGCLOUD的【工作笔记】是一个完全辅助的模块，和监控没有关系它纯粹用来记录我们的一些笔记，比如工作内容，日报，知识等等都可以，非常方便它只需要添加删除维护就可以了，这是一个非常轻量又实用的功能如下图
Java 学习笔记面向对象的七大设计原则「已注销」学习笔记 java 学习开发语言
文章目录参考资料一、单一职责原则SRP二、开闭原则OCP三、里氏替换原则LSP四、依赖倒转原则DIP五、接口隔离原则ISP六、合成复用原则CRP七、迪米特法则LOD八、总结参考资料参考资料：视频资料面向对象设计，ObjectOrientedDesign，简称OOD。在进行软件开发时，需要考虑项目的可维护性和可复用性，开发项目一般是由一个开发团队来维护，因此我们在编写代码时，应可能规范，防止项目出现
C语言编程笔记：文件处理的艺术就爱学编程 C c语言笔记开发语言
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一、为什么要用文件二、文件的分类三、文件指针四、文件的打开与关闭1.文件的打开2.文件的关闭五、文件缓冲区六、文件的基本操作（1）打开文件（2）关闭文件（3）检测文件末尾和错误（4）清除文件错误标志七、顺序读写文件（1）字符级操作函数fgetc
FPGA GTP 4K30Hz SDI视频的接收，处理及发送的实现笔记 qsj_csdn fpga
1，硬件实现框架SDI的视频数据经M22564接收后转为差分信号输入到FPGA，FPGA经过处理后通过M22428转为同轴信号输出。我实现的功能是将输入的4K30Hz的SDI视频流加上OSD显示，在将其输出。2，FPGA处理流程图说明：1，GTPTransceivers这是Xilinx自带的IP核，实现信号的串并转换，根据ug482可知，其支持的速率是在500Mb/s到6.6Gb/s之间，所以完全
python keyboard模块使用笔记 G.O.Y python
**前言：之前写了一个脚本使用到了几个模块，就记录一下用到知识点的使用keyboard模块：wait函数：#等待按下“t”键。keyboard.wait('t')#如果没有按下“t”键，则不会运行下面的代码：print('helloworld!')threading模块：threading.Thread继承threading.Thread的子类并复写run函数，实现多线程；classqq(thre
电脑CPU带字母和带数字的解释光影少年电脑
1.CPU型号中的字母含义字母通常位于型号的末尾，例如：IntelCorei7-12700H或AMDRyzen75800U。IntelK：支持超频的高性能桌面处理器。KF：支持超频，但没有集成显卡的高性能处理器。F：无集成显卡，需配独立显卡。H：高性能移动处理器，通常用于笔记本电脑。HK：高性能且支持超频的移动处理器。HQ：高性能四核移动处理器（旧款）。U：超低功耗处理器，适合轻薄本。Y：极低功耗
python在统计专业的应用_Python在计量经济与统计学中的应用 weixin_39851457 python在统计专业的应用
PythonforEconometricsandStatistics(Python在计量经济与统计学中的应用)【点击链接进入主页】。这套笔记将重点介绍Python在计量经济学与统计分析中的应用。内容涵盖Python基本数据类型，Numpy科学运算，Pandas数据分析，统计分析，蒙特卡洛过程，最优化过程，数据可视化功能，以及在计量经济与统计模型中的应用等。随后还将陆续推出统计学习在在量化金融中的应
2025美赛C题奥运奖牌榜模型（附代码+全保姆教程）Models for Olympic Medal Tables 步入烟尘数学建模 2025美赛奥运奖牌榜模型
本文为个人解题笔记，仅供参考学习。本文C题的所有问题。文章目录问题1解题全流程解题完整过程：建立预测奥运会奖牌数的数学模型1.数据分析与清理1.1数据来源与结构1.2数据清理2.探索性数据分析(EDA)2.1国家奖牌分布趋势2.2奖牌与赛事数量的关系2.3主办国优势分析3.模型建立3.1奖牌数预测模型3.2奖牌首次获得预测模型3.3奖牌分布与赛事类型关联模型4.模型实现与代码4.1数据清理与预处理
类似美团外卖APP测试怎么做？测试要点有哪些？第三方软件测评软件测试软件测试
随着智能化生活的推进，APP外卖带来新的餐饮模式。目前市场上比较活跃的比如美团外卖、饿了么外卖、百度外卖等为餐厅提供外送服务的APP已经深入影响人们的生活。由于外卖APP使用人群范围广泛，对客户信息保密性要求较高，做好外卖APP测试对于保障APP正常使用有重要意义。那么这类外卖APP测试工作应该怎么开展，有哪些测试要点需要重点关注呢？卓码测评小编就整理了部分APP测试相关内容，供大家参考。外卖AP
亚博microros小车-原生ubuntu支持系列：12 URDF 模型 bohu83 ubuntu 亚博 microros urdf rviz 机器人模型
ros2笔记-6.2使用urdf创建机器人模型_urdf机器人建模-CSDN博客之前跟小鱼老师大概了解过urdf模型。再贴一下亚博的介绍4.1、组成部分link，连杆，可以想象成是人的手臂joint，关节，可以想象成是人的手肘关节link与joint的关系：两个link之间通过关节连接起来，想象成手臂有小臂(link)和大臂(link)通过肘关节(joint)连接。4.1.1、link1）、简介在
YOLOv9-0.1部分代码阅读笔记-train.py 红色的山茶花笔记 YOLO 深度学习
train.pytrain.py目录train.py1.所需的库和模块2.deftrain(hyp,opt,device,callbacks):3.defparse_opt(known=False):4.defmain(opt,callbacks=Callbacks()):5.defrun(**kwargs):6.if__name__=="__main__":1.所需的库和模块importargp
Vasp+phonopy 计算声子谱 Wang Niewei 笔记
来源VASP计算笔记-声子谱计算-知乎#phonopy可以随意打开一个conda环境进行安装，我自己安装到了wnw_pyw90上。密度泛函微软理论/线性响应方法(DFPT)必要的输入文件：INCARKPOINTSPOSCAR1POTCARband.conf1扩胞得到计算所需的POSCARvaspkit401可以直接创建超胞#在Linux终端直接运行命令#1.生成超胞phonopy-d--dim="
python基础笔记随记--Python字符串详细，简洁。 ALL程序猿 python 字符串
#笔记摘录3（python基础）python字符串，详细简洁。字符串使用引号(单引号、双引号、三引号)引起来的内容就是字符串。字符串官方定义:元素以引号包围不可修改的有序序列。1.不可修改:字符串中的内容一旦定义后就不能修改。2.有序序列:即成员(字符)有序排列,可通过下标访问。字符串索引字符串中每一个个体我们称之为字符或者元素。索引指的是字符的下标。字符串索引正序从0开始，倒序从-1开始通过字符
英伟达DeepStream学习笔记39———使用netplan固定ip 翟羽嚄英伟达TX2 /Xavier /deepstream开发学习 linux 运维
英伟达DeepStream学习笔记39———使用netplan固定ip简介●介绍Netplan是一个在linux系统上轻松配置网络的实用工具。您只需创建所需网络接口的YAML描述以及每个接口应配置的功能。根据此描述，Netplan将为您选择的渲染器工具生成所有必要的配置。●原理Netplan从/etc/Netplan/*.yaml读取网络配置，这些文件由管理员、安装人员、云映像实例化或其他操作系统
网络技术搭建学习笔记 m0_70960708 笔记学习笔记网络
局域网属于计算机网络中的一种，具有计算机网络的性能，有自己的特点和类型。随着网络技术的不断发展，网络设备的价格不断降低，性能不断提高，为局域网的发展提供了良好的物质基础；同时现代社会对信息资源的需求，也促使局域网技术迅猛发展。在计算机网络发展过程中，局域网技术占据非常重要的地位。1972年，Bell（贝尔）公司提出了两种环型局域网技术。1975年，美国Xerox公司推出了Ethernet（以太网）
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他