NIeson2012

KNN算法对新上市汽车评估分析

应用IBM SPSS Statistic 的最近邻元素分析模型(NNA)对汽车厂商预研车型进行市场评估。分析新车型的技术指标是否达标，预测新车型投放市场后的预期销售额。

4.1 研究背景

某汽车制造厂商研发了一款新车型，为了提升影响力，提高收益产出比，在投入市场之前希望能够对市场进行考核，增加两项技术设计指标，通过对已有的相关数据和技术指标进行对比，从而通过验证来检验新车型的技术指标是否能够达到预期效果。

4.2 研究目的

某汽车制造厂商的研发部门制定出两款新预研车型的技术设计指标，厂商的决策层希望将其和已经投放到市场上的已有车型的相关数据进行比较，从而分析新车型的技术指标是否符合预期，并预测新车型投放到市场之后，预期的销售额是多少。

对于解决此类问题，软件提供了一种新的行之有效的模型分析方法：Nearest NeighborAnalysis（最近邻元素分析模型）。本案例将简单介绍最近邻元素分析模型的概念，并详细探讨本案例中该模型的分析方法。

4.3 研究方法与模型

4.3.1 SPSS 的最近邻元素分析模型简介

SPSS软件的最近邻元素分析是一种针对样本实例进行的分类算法，它根据某些样本实例与其他实例之间的相似性进行分类。特征相似的实例互相靠近，特征不相似的实例互相远离。因而，可以将两个实例间的距离作为他们的“不相似度”的一种度量标准。SPSS的最近邻元素分析模型可以支持两种方法计算实例间距离，他们分别是：Euclidean Distance( 欧氏距离法 ) 和 City-block Distance（城区距离法）。

相互临近的实例被称之为“Neighbors（邻居）”。当我们向模型中引入一条新的实例，它和模型当中已经存在的每一个实例之间的距离将会被计算出来。这样，与这条新实例最相近的邻居就被区分出来了。图4-1描述了一个目标变量是离散型变量的最近邻模型，红色五角星是新实例，白色和蓝色的点是模型当中已有实例。与他最近的邻居们都被用红线连接了起来。

图4-1 最近邻元素模型

最近邻居数量K在最近邻元素分析模块建模中起到了很大的作用。K的取值不同，将会导致对新实例分类结果的不同。图4-1所示，每个实例根据其目标变量取值（0和1）的不同，被分入两个类别集合。当 K=5 时，与新实例连接的旧实例（邻居）当中，目标变量取值为1的实例数更多，所以新实例被分到类别1当中。然而，当 K=9 时，目标变量取值为0的邻居更多，因此新实例被分到类别0当中。Statistics的最近邻元素分析模型既允许用户指定固定的K值，也支持根据具体数据自动为用户选择K值。

Statistics的最近邻元素分析模型支持feature selection（预测变量选择）的功能，允许在用户输入的众多的预测变量当中，只选择一部分预测变量用作建模，使得建立的模型效果更好。Statistics的最近邻元素分析模型允许建立目标变量是连续型变量的模型，在这种情况下，目标变量的平均值或者中位数值将作为新的实例目标的预测值。

4.3.2 数据准备

该汽车制造厂商的研发部门所制定的两款预研车型的技术指标数据如表4-1所示：

表4-1 两款新预研车型的技术指标数据

我们需要将这两款新车型的数据作为两条新的记录，写入原先的数据文件当中，然后再进行分析。这需要我们进行一些数据准备工作。

首先按照表4-1提供的数据，在原数据文件当中增加两条新的记录，如图4-2所示：

图4-2 原数据文件当中增加两条新记录

然后，我们要为这两条新记录加上特别关注的标记，这需要为所有记录增加新的变量。通过菜单转换->计算变量，打开计算变量对话框，如图4-3所示。键入focal作为目标变量，在NumericExpression文本框当中键入表达式：any(model, ‘ newCar ’ , ’newTruck ’ )。根据这个表达式，对于任意一条记录，其model变量的取值如果是newCar或newTruck，则它的focal 变量的取值被设置为 1，否则被设置为 0。

图4-3 增加 focal（焦点）变量

我们再增加一个新变量 partition，以区分训练数据子集和测试子集，我们将已有车型视为训练数据子集，而新车型为测试子集，如图4-4所示。注意在数字表达式文本框中填写1-any(model, ‘newCar’,‘newTruck’)，使得变量partition的取值与变量focal 正好相反。之所以这样做是由于算法中规定：partition> 0 表示为训练数据，这两个新车型作为测试数据，将其 partition 设为0；而focal=1为重点关注对象。

图4-4 增加partition（分区）变量

4.3.3 寻找最近的邻居

现在，让我们来看看如何将这两款新车型的数据和已有车型的数据进行比较。通过菜单打开最近邻模型对话框，如图 4-5所示：

图 4-5 打开最近邻元素分析模型

在打开的最近邻模型对话框当中，我们选择 variables（变量）页面，并选择从price（价格）开始，到mpg（耗油率）为止的变量作为预测变量，选入Features（特征）文本框，共计9个特征。然后我们将focal 变量选入 Focal Case Identifier(optional)（焦点个案标识符（可选））文本框。而在Case Label（个案标签）中，我们选择了变量 model。如图4-6所示：

图4-6 变量设置

之后，切换到 Partition（分区）页面，保持默认选项不变。如图 4-7 所示：

图 4-7 使用默认设置选择训练数据

本次分析过程只寻找K个最近的邻居，而不做分类和预测，所以我们没有选择目标变量。为了图形显示更加清晰，本步骤选择含有少数个案的数据集进行示例。分析过程运行结束后，我们从“Output 输出视图”中打开模型视图浏览器，如图4-8所示：

图4-8 3个最近邻居（K=3）的输出视图

模型浏览器左边的子视图是预测变量空间视图。它是一个三维视图，图中的三条轴分布代表了马力、引擎尺寸、价格三个预测变量。该视图是可交互的，用户可以通过鼠标点击和拖拽，将视图旋转到更好的视角来观察个案样本点在空间中的分布。图中的每个点都代表训练分区数据集中的个案，用圆形表示。在图4-8当中，只有两个新车型个案属于focal（焦点）个案，其外形被红色包裹，其余已有车型都不是焦点个案。可以看到，每一个焦点个案都用红线连接着3个最近邻居。

模型浏览器右边的子视图是对等图，初始内容将显示每一个焦点个案的3个邻居们在每一个预测变量上的取值分布。系统默认将在前6个用户选择的预测变量上显示数值。

当我们在预测变量空间子视图当中用鼠标点击选择某个点，即选中某个个案时，该个案成为焦点个案。在右边的对等图中，将显示该个案及它的3个邻居们在每一个预测变量上的取值分布。每一个单独的图表显示了某个预测变量的一维空间。比如，newCar处于Enginesize（引擎尺寸）图表的最下端，说明它引擎尺寸比邻居们的都要小。

4.3.4 预估汽车类型

通过在运行设置时增加一个目标变量——Vehicle type（汽车类型），如图4-9所示，我们可以更好的了解新车型应该被匹配到哪个类型当中。要额外说明的是，增加了目标变量，最近邻元素分析过程将支持自动选择一个“最优”的邻居个数，并通过Variable Importance（变量重要性）来衡量个案之间的距离。

图4-9 添加目标变量

切换到 Neighbors页面，如图4-10所示。我们选中Specify fixed K，并指定K=3，同时，选中 Weightfeatures by importance when computing distances选项。

图4-10 设置固定的 K 值及计算距离时的选项

然后切换到 Features页面，如图4-11所示。选择Perform feature selection选项，在 StoppingCriterion（中止条件）区域，填写7作为Number to select（待选择数目）。

图4-11 执行预测变量选择

之后，我们转到 Partition页面，如图4-12所示。在Training and Holdout Partitions区域当中，我们选择Use variableto assign cases，并将前期数据准备阶段产生的新变量partition 选入Partitionvariable文本框中。

图4-12设置 Partition（分区）变量

最后一步，我们选择Save页面，如图4-13所示。在Variablesto Save区域中，选择 Predicted value or category，并用一个新的变量保存它，我们可以使用在Variableor Root Name中的默认的变量名称“KNN_PredictedValue”做为新变量的名称。

点击 OK 按钮执行最近邻元素分析。

图4-13选择新变量存储预测值

运行结束后，查看此时的原始数据的DataSet数据集，在其最右边，可以看到数据增加了一列，名为“KNN_PredictedValue”，我们称其为预测值，它是对原始数据每个个案，利用所产生的模型，根据预测变量的取值计算出的目标变量值。我们注意到，newCar的预测type是0，newTruck的预测type是1。下面我们来检查这些预测分类计算的是否合理。

打开Model Viewer，选择右边PeerChart视图下方的下拉菜单中的项Classification Table并打开，如图4-14，图4-15所示，它反映了对目标变量的观测值和预测值之间的交叉验证情况。对训练数据，从表中可以看到只有一个Automobile个案被错误地划分成为卡车，而对于Truck，只有7个卡车个案被错误地划分为小轿车，因此总体的准确率达到了94.7%；同样对测试数据，可以看到两个新车型的观测值和预测值都是一致的，这说明新轿车和新卡车的分类结果都是正确的。根据这个结果，说明我们建立的模型是很好的。

图4-14 Peer Chart 视图下方的下拉菜单

图4-15 Classification 分类表

通过选择Peer Chart下方的下拉框菜单中的PredictorImportance项，可以显示 Predictor Importance视图，该视图描述了每个预测变量在做出预测时的重要程度，其度量值是相对的，所有变量的重要程度值总和为1，从上至下，变量的重要程度依次递减。如图4-16所示：

图4-16 预测变量重要性视图

4.3.5 预测销售额

现在我们设置目标变量为Sales in thousands（销售额（千元）），再进行一次分析，从而获得如果将两个新车型投放到市场后的预期销售额。

在图4-9所示的最近邻元素模型对话框的variables页面中，我们将目标变量换成销售额，切换到Neighbors页面，如图4-17所示。我们选择AutomaticallySelect K选项，选择3作为所允许的最少邻居数，选择9作为所允许的最多邻居数，其余保持不变。

图4-17自动选择 K 个最近邻居数

然后切换到Features页面，在如图4-11所示的页面中，取消对Performfeature selection的选择，我们希望所有的预测变量都被用来建模。

再切换到Partitions页面，如下图4-18所示。可以看到，此时Cross-ValidationFolds区域已经处于激活状态，这是由于我们在图4-17中选择了自动选择K而不是指定K值。如图选择Randomlyassign cases to folds，并选择子集数为10。同时，选中Setseed for Mersense Twister（设置 MersenseTwister 种子）选项，并设置种子取值，可以选择某个日期。

图4-18 交叉验证子集设置

由于本次我们选择了从 K=3到K=9自动选择K，并且使用用户设置的所有预测变量，所以在执行过程当中，将使用所有的预测变量为范围内的每一个K计算错误率，哪个K值及其预测变量所确定的模型在预测目标值时的错误率最低，哪个K值就被自动选定了。

然后，同上一个分类预测的过程一样，选择Save页面，如上图4-13所示。在Variables to Save区域中，选择 Predicted value or category，使用默认的变量名。

运行结束后，原始数据集最右边同样会增加新的一列，保存的是目标变Sales inthousands（销售额）的预测值，列名为“KNN_PredictedValue_1”。从这一列中我们得到，newCar的预测销售额是94.375 (千元)，newTruck的预测销售额是 108.537 (千元)。那么，这些预测值计算的是否合理，我们所建的模型如何？

由于本例中的目标变量是连续型变量，上例中预估分类模型（目标变量是离散型）的方法在此不再适合。我们可以通过判断该模型的统计量Rsquare的值，来评定所建模型的好坏。

Rsquare的计算公式：Rsquare=1-errorSummary/( Variance *( N -1) )，其中，errorSummary代表建模后得到的错误合计；Variance代表训练数据的方差值；N代表训练数据中有效的个案个数。根据分析的结果，通过公式计算，得到：Rsquare=0.76542

理论上，Rsquare 值应该在0和1之间，Rsquare值越接近1，则表示所创建的模型越好。本例中的值大于0.7，说明我们的模型还是不错的。那么，由该模型计算出来的预测值应该也是可信的。

现在来看最近邻居数目在建模过程中是如何确定的，在 Peer Chart 视图下方的下拉菜单中选择K Selection，得到最近邻居数目K的选择视图，如图4-19所示。可以看到，当K 值为3的时候，模型的预测错误率是最低的，因此最邻近元素分析自动地为我们选择了3作为最终的K值。

图4-19最近邻居数目K的选择

其他视图的分析过程和前面介绍的类似，这里不再过多阐述。

4.4 研究结果

最终，可以得到根据最近邻元素模型预估出这两块车型所属的类型，newCar的预测type是0，newTruck的预测type是1。预测出两款新车型在投入市场后可能得到的销售额，newCar的预测销售额是94.375 (千元)，newTruck的预测销售额是 108.537 (千元)。从模型的详细信息当中可以了解到该预测结果的可信程度是比较高的。

通过对该商业实例进行实际的建模分析，我们了解到SPSS软件的NearestNeighbor（最近邻元素分析模型）是一种基于分类的数据挖掘算法，能够根据已有数据，迅速、准确地对个案进行分类和预测。所建立的模型也能够通过丰富、直观的图表来描述，方便了用户的使用，是一个有着广泛用途的分析工具。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
三大师传 beca酱
巴尔扎克的作品被誉为“法国社会的一面镜子”。文学大师维克多·雨果对巴尔扎克的评价是：“在最伟大的人物中间，巴尔扎克是名列前茅者；在最优秀的人物中间，巴尔扎克是佼佼者之一。”一个原本寂寂无名的小人物，从地中海的某个海岛上，只身一人来到巴黎，没有朋友，也没有名望。作为一个一文不名的外乡人，凭着赤手空拳赢得了巴黎，征服了整个法兰西，并且赢得了世界。这个人就是十九世纪法国伟大的军事家、政治家，法兰西第一帝
活给自己看，笑容才灿烂听着了么
白岩松说“有时候，我们活得很累，并非生活过于刻薄，而是我们太容易被外界的氛围所感染，被他人的情绪所左右。”心情是自己的。若只是活在别人的眼里、嘴里，便掌握不了让自己开心的主动权。人活着，不是为了活给别人看的，唯有做最真实的自己，活给自己看，笑容才灿烂。诚然，世事纷繁复杂，人人都有一张嘴，管也管不了。永远有人欣赏你，也永远有人批评你，不可能做到让所有人都满意，开心做自己才是最重要的。人生苦短，有太多
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
我在意的 Yuexiaofeng
我所在意的，往往是你最容易忽略的，这让我感到为难。我所感动的，你却无动于衷，这使我感到惭愧。我所做的，你却视而不见，这让我不知如何是好。
蘩漪：新女性？利己主义者赮_红雨
蘩漪是曹禺《雷雨》笔下的女性形象。对于她的喜爱，曹禺在之前的访谈中，就已经表达得很清楚了，蘩漪是他所倾心的女子的“代替者”。在这个女性身上有着曹禺最精心的描写，但同时她的身上又存在着一些时代的问题。图片发自App首先，繁漪是追求自由和幸福的新女性形象。她是精神悲剧的核心人物，她对周朴园的反抗，具有典型意义。她是位资产阶级家庭出身的小姐，受过五四新思潮的影响，她任性、傲慢，追求人格独立、个性自由和爱
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
心有蓝天白云，爱情便会晴空万里，然后有花香有鸟鸣有美好的未来曹十二吖
丁南的婚姻，来自于一场她对生命的对比。她曾经说过，当她最爱的母亲用生命去逼迫她结婚的时候，她曾一度不理解到愤怒，甚至于想过用轻生来对抗母亲的不理智。庆幸的是，丁南是一个自我调节能力非常强的人，她想如果我连死亡都不怕，还怕不能经营好一段婚姻吗？抱着这样的念头，24年没有谈过恋爱的她，用短短三个月的时间，完成了少女到女人的蜕变。她曾经说过：“我要把自己最珍贵的东西留给自己命中注定的那个人。”闺蜜几人中
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
第九十章真情溪境
图片发自App图片发自App和雏田在一起的日子真的很开心。姐姐永远是最亲的最真的。佐助总来捣乱。小樱准备一盆水泼佐助。想到恋爱通告亦菲被泼水不免高兴。亦菲是最美的。没想到她也会有这种遭遇。也许不需要赚那么多钱。和家人在一起的日子真好。却轻易破碎。雏田的话语温软，依稀在耳边。她的微笑纯美温柔。喜欢温柔的哥哥，雏田就是这样啊。不知道雏田是喜欢男生还是女生。我都支持。过去门当户对。现在自由恋爱。想永远和
高仿包包批发在哪里买最便宜?推荐6个购买渠道鸿运工作室
高仿包包作为一种时尚单品，受到很多人的喜爱。然而，对于批发高仿包包的人来说，如何找到最便宜的购买渠道是一个关键问题。本文将为您推荐6个购买高仿包包最便宜的渠道，帮助您更好地满足批发需求。咨询加微信：FB2260(下单赠送精美礼品)1.义乌国际商贸城义乌国际商贸城是中国最大的小商品批发市场之一，也是高仿包包批发的热门地点。这里有众多的批发商聚集，提供了各种各样的高仿包包，价格相对较低。您可以在这里找
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
社保应该缴15年还是25年？那种方式最划算？袋鼠观保保险规划师
社保无论是缴费15年还是25年，影响最大的就是养老保险和医疗保险，缴费时间越长越有利！1.养老保险真的交满15年就够了吗？要知道，社保缴费时长，直接影响到退休后能拿多少养老金，而且交得越久，退休领得越多。我拿深圳作为例子，想拿到养老金必须满足两个条件：只要达到一定的退休年龄，养老保险累计交满15年就可以拿到养老金了。那如果多缴了20年、25年甚至30年，是不是浪费了？实际上，缴满15年只是刚好可以
钟表可以回到起点却已不是昨天凉小夏
人生的路很长，但是我们只能前进不能后退就像钟表，可以回到起点，却已时过境迁，永远也找不到那个过去的昨天。因我们总是会对过去有着很多留恋不舍和怀念，会时常回头看看走过的脚印，时常想起过去的美好时光，时常想到那些悲伤和不如意。今天的到来时钟不可阻止，历史的记录，原人生最宝贵的不是金钱，不是地位，而是时间。拥有时间就等于拥有一切，因为拥有时间，我们不怕囊中羞涩，因为拥有时间我们不惮创业无门，因为拥有时间
“这才好”麻辣香锅能够增加人身体的免疫能力小补文知
我就来介绍一种香锅，那就是“这才好”麻辣香锅，它产出于著名的蜀地文化，具有悠久的历史土家风味，麻辣鲜香，健康安全。采用传统秘制麻辣香锅油辣子，还有贴心加料“孜然包”满足人们的不同口味需求，香锅底料辣椒，微辣且香，含有丰富微量元素和维生素，具有辣而不躁，味道纯正，醇厚温和。花椒采用历史悠久，被列为宫廷供品的“贡椒”的汉源花椒。我们还挑选了“川菜之魂”郫县豆瓣的鼻祖品牌豆瓣，保留最原始的郫县豆瓣味道，
119:虚惊一场追梦的小蚂蚁
医院体检结果出来了。老a被通知再次去复查，又复查了一遍，结果还是不理想。老a心里有点不痛快了，难不成饭吃到头了？这人生最悲剧的事情就是人没了，钱还没花完。我从明天开始想吃的想喝的一毛都不省，天天抽华子。上班期间，老a掏出华子给人散。老c：“这发什么横财了？都整上了华子了？”老a：“别tm废话，抽不？不抽我装上了！”老c：“哥哥，肯定抽啊，拿来。”老a：“就凭这个哥哥，以后给你天天发华子！”老c：“
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
一次冒险追梦少年_4509
每个人应该都会经历很多冒险，这样你才能变得坚强起来，变得勇敢起来，冒险就是用来磨练自己，勇气的工具，接下来就给大家说说，我经历过的最吓人的冒险。2016年的夏天我和大爷大娘一起去北地捉知了我们边走边找，我负责拿着罐子大娘拿了一个电灯四处照，大爷就拿着一个棍子负责把知了，弄下来我们边走边捉，一会儿罐子就满了，就在我四处看分神的时候看见了一个知了接着我叫大爷大娘来拿知了我一看旁边没有人，我的心里十分害
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

KNN算法对新上市汽车评估分析

你可能感兴趣的:(knn,汽车市场,最近邻算法)