weixin_30794491

基于 ReliefF和K-means算法的应用

数据挖掘方法的提出，让人们有能力最终认识数据的真正价值，即蕴藏在数据中的信息和知识。数据挖掘 (DataMiriing)，指的是从大型数据库或数据仓库中提取人们感兴趣的知识，这些知识是隐含的、事先未知的潜在有用信息，数据挖掘是目前国际上，数据库和信息决策领域的最前沿研究方向之一。因此分享一下很久以前做的一个小研究成果。也算是一个简单的数据挖掘处理的例子。

数据挖掘与聚类分析概述

数据挖掘一般由以下几个步骤：

(l)分析问题:源数据数据库必须经过评估确认其是否符合数据挖掘标准。以决定预期结果，也就选择了这项工作的最优算法。

(2)提取、清洗和校验数据:提取的数据放在一个结构上与数据模型兼容的数据库中。以统一的格式清洗那些不一致、不兼容的数据。一旦提取和清理数据后，浏览所创建的模型，以确保所有的数据都已经存在并且完整。

(3)创建和调试模型:将算法应用于模型后产生一个结构。浏览所产生的结构中数据，确认它对于源数据中“事实”的准确代表性，这是很重要的一点。虽然可能无法对每一个细节做到这一点，但是通过查看生成的模型，就可能发现重要的特征。

(4)查询数据挖掘模型的数据:一旦建立模型，该数据就可用于决策支持了。

(5)维护数据挖掘模型:数据模型建立好后，初始数据的特征，如有效性，可能发生改变。一些信息的改变会对精度产生很大的影响，因为它的变化影响作为基础的原始模型的性质。因而，维护数据挖掘模型是非常重要的环节。

　　聚类分析是数据挖掘采用的核心技术，成为该研究领域中一个非常活跃的研究课题。聚类分析基于”物以类聚”的朴素思想，根据事物的特征，对其进行聚类或分类。作为数据挖掘的一个重要研究方向，聚类分析越来越得到人们的关注。聚类的输入是一组没有类别标注的数据，事先可以知道这些数据聚成几簇爪也可以不知道聚成几簇。通过分析这些数据，根据一定的聚类准则，合理划分记录集合，从而使相似的记录被划分到同一个簇中，不相似的数据划分到不同的簇中。

特征选择与聚类分析算法

Relief为一系列算法，它包括最早提出的Relief以及后来拓展的ReliefF和RReliefF，其中RReliefF算法是针对目标属性为连续值的回归问题提出的，下面仅介绍一下针对分类问题的Relief和ReliefF算法。

Relief算法

Relief算法最早由Kira提出，最初局限于两类数据的分类问题。Relief算法是一种特征权重算法(Feature weighting algorithms)，根据各个特征和类别的相关性赋予特征不同的权重，权重小于某个阈值的特征将被移除。Relief算法中特征和类别的相关性是基于特征对近距离样本的区分能力。算法从训练集D中随机选择一个样本R，然后从和R同类的样本中寻找最近邻样本H，称为Near Hit，从和R不同类的样本中寻找最近邻样本M，称为NearMiss，然后根据以下规则更新每个特征的权重：如果R和Near Hit在某个特征上的距离小于R和Near Miss上的距离，则说明该特征对区分同类和不同类的最近邻是有益的，则增加该特征的权重；反之，如果R和Near Hit在某个特征的距离大于R和Near Miss上的距离，说明该特征对区分同类和不同类的最近邻起负面作用，则降低该特征的权重。以上过程重复m次，最后得到各特征的平均权重。特征的权重越大，表示该特征的分类能力越强，反之，表示该特征分类能力越弱。Relief算法的运行时间随着样本的抽样次数m和原始特征个数N的增加线性增加，因而运行效率非常高。具体算法如下所示：

ReliefF算法

由于Relief算法比较简单，但运行效率高，并且结果也比较令人满意，因此得到广泛应用，但是其局限性在于只能处理两类别数据，因此1994年Kononeill对其进行了扩展，得到了ReliefF作算法，可以处理多类别问题。该算法用于处理目标属性为连续值的回归问题。ReliefF算法在处理多类问题时，每次从训练样本集中随机取出一个样本R，然后从和R同类的样本集中找出R的k个近邻样本(near Hits)，从每个R的不同类的样本集中均找出k个近邻样本(near Misses)，然后更新每个特征的权重，如下式所示：

Relief系列算法运行效率高，对数据类型没有限制，属于一种特征权重算法，算法会赋予所有和类别相关性高的特征较高的权重，所以算法的局限性在于不能有效的去除冗余特征。

K-means聚类算法

由于聚类算法是给予数据自然上的相似划法，要求得到的聚类是每个聚类内部数据尽可能的相似而聚类之间要尽可能的大差异。所以定义一种尺度来衡量相似度就显得非常重要了。一般来说，有两种定义相似度的方法。第一种方法是定义数据之间的距离，描述的是数据的差异。第二种方法是直接定义数据之间的相似度。下面是几种常见的定义距离的方法：

1.Euclidean距离，这是一种传统的距离概念，适合于2、3维空间。

2.Minkowski距离，是Euclidean距离的扩展，可以理解为N维空间的距离。

聚类算法有很多种，在需要时可以根据所涉及的数据类型、聚类的目的以及具的应用要求来选择合适的聚类算法。下面介绍 K-means聚类算法:

K-means算法是一种常用的基于划分的聚类算法。K-means算法是以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，而簇间的相似度较低。K-means的处理过程为：首先随机选择k个对象作为初始的k个簇的质心；然后将余对象根据其与各个簇的质心的距离分配到最近的簇；最后重新计算各个簇的质心。不断重复此过程，直到目标函数最小为止。簇的质心由公式下列式子求得：

在具体实现时，为了防止步骤2中的条件不成立而出现无限循环，往往定义一个最大迭代次数。K-means尝试找出使平方误差函数值最小的k个划分。当数据分布较均匀，且簇与簇之间区别明显时，它的效果较好。面对大规模数据集，该算法是相对可扩展的，并且具有较高的效率。其中，n为数据集中对象的数目，k为期望得到的簇的数目，t为迭代的次数。通常情况下，算法会终止于局部最优解。但用，例如涉及有非数值属性的数据。其次，这种算法要求事先给出要生成的簇的数目k，显然这对用户提出了过高的要求，并且由于算法的初始聚类中心是随机选择的，而不同的初始中心对聚类结果有很大的影响。另外，K-means算法不适用于发现非凸面形状的簇，或者大小差别很大的簇，而且它对于噪音和孤立点数据是敏感的。

一个医学数据分析实例

数据说明

本文实验数据来自著名的UCI机器学习数据库，该数据库有大量的人工智能数据挖掘数据，网址为:http://archive.ics.uci.edu/ml/。该数据库是不断更新的，也接受数据的捐赠。数据库种类涉及生活、工程、科学各个领域，记录数也是从少到多，最多达几十万条。截止2010年底，数据库共有199个数据集，每个数据集合中有不同类型、时间的相关数据。可以根据实际情况进行选用。

本文选用的数据来类型为：Breast Cancer Wisconsin (Original) Data Set，中文名称为：威斯康星州乳腺癌数据集。这些数据来源美国威斯康星大学医院的临床病例报告，每条数据具有11个属性。下载下来的数据文件格式为“.data”,通过使用Excel和Matlab工具将其转换为Matlab默认的数据集保存，方便程序进行调用。

下表是该数据集的11个属性名称及说明：

对上述数据进行转换后，以及数据说明可知，可以用于特征提取的有9个指标，样品编号和分类只是用于确定分类。本文的数据处理思路是先采用ReliefF特征提取算法计算各个属性的权重，剔除相关性最小的属性，然后采用K-means聚类算法对剩下的属性进行聚类分析。

数据预处理与程序

本文在转换数据后，首先进行了预处理，由于本文的数据范围都是1-10，因此不需要归一化，但是数据样本中存在一些不完整，会影响实际的程序运行，经过程序处理，将这一部分数据删除。这些不完整的数据都是由于实际中一些原因没有登记或者遗失的，以“?”的形式代表。

本文采用Matlab软件进行编程计算。根据第三章提到的ReliefF算法过程，先编写ReliefF函数程序，用来计算特征属性，再编写主程序，在主程序中调用该函数进行计算，并对结果进行分析，绘图，得到有用的结论。

程序统一在最后贴出。

乳腺癌数据集特征提取

本文采用3.1节中的ReliefF算法来计算各个特征的权重，权重小于某个阈值的特征将被移除，针对本文的实际情况，将对权重最小的2-3种剔除。由于算法在运行过程中，会选择随机样本R，随机数的不同将导致结果权重有一定的出入，因此本文采取平均的方法，将主程序运行20次，然后将结果汇总求出每种权重的平均值。如下所示，列为属性编号，行为每一次的计算结果：

下面是特征提取算法计算的特征权重趋势图，计算20次的结果趋势相同：

上述结果是否运行主程序所得的计算结果，看起来不直观，下面将其按照顺序绘图，可以直观显示各个属性权重的大小分布，如下图所示：

　　

按照从小到大顺序排列，可知，各个属性的权重关系如下：

属性9<属性5<属性7<属性4<属性2<属性3<属性8<属性1<属性6

我们选定权重阀值为0.02，则属性9、属性4和属性5剔除。

从上面的特征权重可以看出，属性6裸核大小是最主要的影响因素，说明乳腺癌患者的症状最先表现了裸核大小上，将直接导致裸核大小的变化，其次是属性1和属性8等，后几个属性权重大小接近，但是从多次计算规律来看，还是能够说明其中不同的重要程度，下面是着重对几个重要的属性进行分析。下面是20次测试中，裸核大小（属性6）的权重变化：

从上图中可以看到该属性权重大部分在0.22-0.26左右，是权重最大的一个属性。下面看看属性1的权重分布：

块厚度属性的特征权重在0.19-25左右变动，也是权重极高的一个，说明该特征属性在乳腺癌患者检测指标中是相当重要的一个判断依据。进一步分析显示，在单独对属性6，和属性1进行聚类分析，其成功率就可以达到91.8%。本文将在下节中的Kmeans算法中详细介绍。

乳腺癌数据集聚类分析

上一节中通过ReliefF算法对数据集的分析，可以得到属性权重的重要程度，这些可以对临床诊断有一些参考价值，可以用来对实际案例进行分析，可以尽量的避免错误诊断，并提高诊断的速度和正确率。下面将通过K-menas聚类分析算法对数据进行分析。本小节将分为几个步骤来进行对比，确定聚类分析算法的结果以及与ReliefF算法结合的结果等。
1.K-means算法单独分析数据集

下面将采用Kmeans算法单独对数据集进行分析。Matlab中已经包括了一些常规数据挖掘的算法，例如本文所用到的K-means算法。该函数名为kmeans，可以对数据集进行聚类分析。首先本文对乳腺癌数据集的所有属性列(除去身份信息和分类列)直接进行分类，由于数据集结果只有2种类型，所以首先进行分2类的测试，结果如下：总体将683条数据分成了2类，总体的正确率为94.44%，其中第一类的正确率为93.56%，第二类的正确率为96.31%。下面是分类后对按照不同属性的绘制的属性值分布图：

限于篇幅，只选择了上述3个特征属性进行图像绘制，从结果来看，可以很直观的观察到K-means算法分类后的情况，第一类与第一类的分类界限比较清晰。但是不容易观察到正确和错误的情况。下表是分类结果中各个属性的聚类中心：

从K-means算法的效果来看，能够很准确的将数据集进行分类。一方面是由于该数据集，可能是该案例特征比较明显，另一方面是由于K-menas算法对这种2类的作用较大。
2.K-means结合ReliefF分析数据集

单从分类正确率和结果方面来看，K-mens算法已经完全可以对乳腺癌数据集做出非常准确的判断。但是考虑ReliefF算法对属性权重的影响，本小节将结合ReliefF算法和K-means算法来对该数据集进行分析，一方面得到处理该问题一些简单的结论，另外一方面可以得到一些对医学处理数据的方法研究方法。

首先，本小节首先根据3.2节中的一些结论，根据不同属性的权重来对k-menas分类数据进行预处理，以得到更精确的结论和对该数据更深度的特征规律。

从3.2节中，得知属性9<属性5<属性7<属性4<属性2<属性3<属性8<属性1<属性6，根据ReliefF算法原理本文可以认为，对于这种属性6和属性1重要的特征属性，应该对分类起到更加到的作用。所以下面将单独对各个属性的数据进行分类测试，详细结果如下表：

总的分类正确率中，属性9最低，属性6最高，这与ReliefF算法测试的结果大致相似，但是由于ReliefFar算法中间部分权重接近，所以也区分不明显。说明特征属性权重的判断对分类是有影响的。上述单独分类中，只将需要分类的列数据取出来，输入到K-means算法中即可。由于输入数据的变化，K-means分类时结果肯定是有差距的，所以单独从一个属性判断其类型是不可靠的。下面选择了单个分类时最高和最低的情况，绘制其分类属性值分布图，如下图所示：

下面将对特征权重按照从大到小的顺序，选择相应的数据，进行聚类分析，结论如下：

1.直接选择全部9种属性，分类成功率为：94.44%；

2.选择属性6，属性1，分类成功率为：91.36%；

3.选择属性6，1，8，3，分类成功率为：93.85%；

4.选择属性6，1，8，3，2，4，分类成功率为：94.48%；

5.选择属性6，1，8，3，2，4，5，7，分类成功率为：95.02%；

从上面的测试可以看出，选择特征权重最大的6个属性，其正确率就达到选择所有属性的情况，因此我们可以认为特征权重最小的几个属性在乳腺癌诊断过程的作用实际可能比较小，实际有可能造成反作用，也就是这几个属性值与乳腺癌没有必然的联系。这一点可以给诊断参考，或者引起注意，进行进一步的研究，确认。
3. K-means分成3类的情况

虽然从上述2小节的实验中可以得到该数据集的大部分结果和结论。但是为了将相同类型的数据更加准确的分出，下面将尝试分为3类的情况。一方面，可以分析在乳腺癌良性和恶性情况下的显著特征属性；另一方面也可以根据此结果找到更加合理的解决方法。

还是采用Matlab中的kmeans函数，将分类数改为3，由于分为3类后数据类型增多，判断较复杂，所以手动对数据进行分析，将所有特征属性加入进去。运行结果如下，测试数据中总共683条，其中良性共444条，恶性共239条：

1.分为第一类的记录中，良性占96.88%；

2.分为第二类的记录中，恶性占 100% ；

3.分为第三类的记录中，恶性占 92%；

根据上述结果可以认为第一类为良性的分类，第二类为恶性分类，第三类为混合类。对于混合类，说明里面的数据较其他数据更加接近于偏离病例的典型数据，所以进一步分析在第一类中和第二类中的分类正确率：

1.第一类为良性，共448条数据，分类正确率为96.88%；

2.第二类为恶性，共99条数据，分类正确率为 100% ；

3.第三类为混合类，共136条数据

因此单独从分类后的正确率来看，效果有提高，说明对典型的病例数据分类更准确，但是对于第三类数据，而无法区分，因此这种情况下，其意义不在于分类的整体正确率，而在于在一些特殊情况下，可以根据一些重要的特征属性值就可以为患者确诊，从而提高效率和准确率，减少误诊断的几率。

上面是将所有属性进行K-means变换，下面将结合ReliefF算法，先去掉一部分特征权重较小的特征属性后，再进行K-means处理。根据4.2节中的结论，下面提取权重最大的6个属性进行测试，分别是：属性6，属性 1，属性 8，属性 3，属性2，属性 4。

1.第一类为良性，共281条数据，分类正确率为97.51% ；

2.第二类为恶性，共211条数据，分类正确率为 97.16% ；

3.第三类为混合类，共191条数据

因此，对比可以看到，虽然良性的正确率增加了，但是检测出的数据减少了。第三类混合的数量也增多了，说明提出了特种属性较小的属性，可以更加容易区分极端的病例数据，对极端数据的检测更加准确。

转载于:https://www.cnblogs.com/ainima/p/6331808.html

韦奇定律海霞设计风
（走自己的路，让别人去说吧）美国洛杉矶加州大学经济学家伊渥-韦奇提出：即使你已经有了主见，但如果有10个朋友看法和你相反，你就很难不动摇。这种现象被称为韦奇定律。韦奇定律告诉我们，即使我们已经有了主见，但如果受到大多数人的质疑，恐怕就会动摇甚至放弃。许多成功人士之所以成功，就是因为比别人看得更高，想的更远，更坚定地忠于自己的选择。只有自己才最了解自己，只有自己才能对自己负责，走自己的路，让别人去说
《出苍茫》五五零奇怪的宝石佛朗西斯_阿道克
海瑟薇似乎什么也没听见，径直推门走了进去，刘畅他们也没有犹豫，跟在海瑟薇的身后走进了木门。木门内，又是个装修豪华的大厅，天花板、墙壁和地板上镶嵌着无数可以自行发光的宝石。宝石的密度看起来比议政厅入门的那个大厅还要高许多。在大厅的中央还有一堵围墙，显然，在这个大厅内部，还有一个封闭的房间。刘畅脸色一变，在这个大厅里，他也有了那种特别不舒服的感觉，这种感觉甚至比议政厅以及们的一进门那个大厅还要强烈。不
通过docker部署的MySQL数据库初始化方式 GIS从业者资料数据库 docker mysql
背景安装好MySQL容器后，有时需执行MySQL命令创建项目初始表才能使用。手动创建不太便捷，可将相关SQL命令保存为.sql文件（如init.sql）。在docker-compose.yml中配置MySQL容器时，借助volumes把该脚本挂载到MySQL容器的初始化目录（/docker-entrypoint-initdb.d/），以此完成自动创建，这样会方便许多。步骤1、创建SQL初始化文件在
叶黄素（Lutein）、玉米黄质（Zeaxanthin）、虾青素（Astaxanthin）与维生素 A 在护眼上的差异净逮着一个嘬健康医疗笔记
叶黄素（Lutein）、玉米黄质（Zeaxanthin）、虾青素（Astaxanthin）与维生素A在护眼上的差异维度叶黄素&玉米黄质（常并称“叶黄素”）虾青素维生素A（视黄醇/视黄酸等）归属类胡萝卜素中的“非前体型”氧化胡萝卜素（叶黄素类）类胡萝卜素中的酮型类胡萝卜素类胡萝卜素中的“维生素型”——可转化成视黄醛/视紫红质体内主要分布●黄斑中心凹（叶黄素:外周>中心；玉米黄质:中心>外周）●晶状体
2019-04-15 周世川
今天语文我们复习了第十课，还有第11课。还有第四单元，数学学的是两位数加一位数。还上了美术课，美术老师让我们画小人国
拖延症，根本原因不在你薇薇然
一个月前，和邻居一起带孩子参加了《三只杯》绘本活动，并约定为孩子准备三只杯子，教孩子合理支配自己的零花钱，帮助她们建立财商意识。前天，在楼下碰见邻居，顺便问邻居孩子的零花钱分配的怎么样。没想到，邻居一脸尴尬，告诉我杯子还没有准备好。原因是孩子不想要杯子，想要存钱罐，自己觉得网上存钱罐的不好选，想去店里买，但一直还没腾出时间去呢。分开时，邻居还不好意思的解释自己拖延症比较严重。说起拖延，大家都会发现
山中岁月催（3/12) 辛也的往事随风
时间过的真快，一转眼台历本就翻到了四月。我在这一页的显眼位置上，写下:气温20-25℃，培葫芦苗、黄瓜苗。而我是个急性子的，三月底的时候已经将培好的黄瓜苗移栽到了大田里。每天在农忙的闲暇去看一眼，觉得长势还行。地温上来，它们开始发出真叶。未栽完的黄瓜苗，我养在了窗台上我将黄瓜移植的时间比往年提前了大约十天，天气也给力，预示着我的黄瓜也会比别人家早上市十天，正赶上好时节。窗台上的黄瓜是专为我的小可爱
拼多多的商业思考拼图区块链
拼多多除了假货还有什么？这是普遍大家回问的一个问题。但是拼多多的的真的只有假货那么简单吗？把它定位成一个假货平台显然是不公平的。拼多多抓住的第一个关键词是“高频”。在拼多多排名前10的类目中，排到第一的是食品。而淘宝排名第一的是服装。很显然，食品是一个比服务高频多的东西，主要就包含：瓜子零食和水果。拼多多关注的第二个关键词是“拼团”。我们必须承认拼多多上面确实存在很多的假货。但是中国广大的3、4、
不完美的过去妹_清水
有时候总是回忆过去，怎么没有做出正确的决定，没有做出更好的选择？而现在我也在一些决定，突然想若干年后我会不会不理解现在的决定呢？可这是我能力范围内所能做的最好的决定了。原来过去的每个决定和选择都是我当时竭尽所能做的最好选择了。我接纳原来那个不完美的自己，爱你！放在对方身上同样的理解，也许我们无法理解和接受别人的观点和做法，但我想在他的环境下，他已经尽力做到最好，应该没有谁故意朝着糟糕的方向发展，不
2018-03-29 XuelinW
今天去cambrils上课，孩子们都很可爱。可是不怎么喜欢学习中文。不过感谢他们好几年的坚持，尽管自己不想牺牲玩儿的时间来学习现在看似没用的汉语。尽管他们都是被家长逼着过来的，只要来，就有进步!感谢家长提供上课场所。感谢奶奶邀请儿子去她家吃饭，感谢她对我的帮助。感谢老公每天记得打电话给我。感谢他让我超越过去的混沌。感谢儿子的自立，感谢儿子的自律，他在运动，做人家妈妈的总不好坐着看电视，总不好无节制
STM32微控制器的按键短按与长按检测 AI_Guru人工智能 stm32 单片机嵌入式硬件
在嵌入式系统开发中，按键是最常见的输入设备之一。STM32微控制器广泛用于各种项目，包括需要按键输入的场合。本文将介绍如何在STM32微控制器上实现按键的短按和长按检测。引言按键检测是嵌入式系统中的基础功能，它允许用户通过物理按键与设备进行交互。STM32微控制器提供了丰富的GPIO（通用输入输出）引脚，可以方便地连接按键并进行检测。短按和长按是两种常见的按键操作模式，短按通常用于触发一个事件或命
关于韭菜的交易费我才是Alpha呀
作为一家交易所，他们的大部分盈利应该是来自于手续费（交易佣金），如果说他们放弃了这一块，又加上他的团队是非常厉害的团队，那么他们起码应该是一个看好未来并且愿意和用户一起成长的团队。而不是把用户当“韭菜”。对于交易费李笑来在《韭菜的自我修养》中写到：“韭菜”的幻觉在于，他们用行动表明他们的坚信和坚持，他们认为自己的智商与体力，完全可以打败手续费……殊不知，“抽水”是人类史上唯一可以永续的商业模式，真
伤感短句【四】言静熙
（一）以前对你的喜欢是见你，念你，陪伴你现在对你的喜欢是不问，不看，不叨扰（二）爱是一把手中的细沙握得越紧，流得越快最后，会一无所有（三）你活得不快乐的原因大概是你总是间接性的踌躇满志持续性的混吃等死既没有办法忍受目前的状态又没能力去改变（四）烟我抽得起架我打的起酒我喝得起唯独爱情我输不起（五）直到今天你依然是我拒绝别人的原因其实我也没有在等你我就是没法喜欢上别人而已（六）爱情就像银行里存一笔钱能
8月19日我只选择和平 | 我的奇迹日志白兰白小兔
D19~LESSON19今天，我不断重复对自己说，我充满爱，我可爱。我感受到我对其他人充满爱，我也值得他们的爱。我爱我自己，我爱每个人，而且每个人都爱我。无论假我试图告诉我什么，我知道我值得拥有爱。今天，我知道我充满爱，我可爱。首先我很喜欢今天这段话，特别是英文原文。很适合对自己暗暗鼓励~~TodayIconstantlyrepeattomyselfthatIamlovingandlovable.
云服务器哪家便宜，阿里云服务器与腾讯云服务器价格对比阿里云最新优惠和活动汇总
云服务器哪家便宜？对于想要购买云服务器的用户来说，大多都会优先选择阿里云或腾讯云的服务器，因为这两家都是目前国内名气最大的云服务商，自然也成为了用户购买云服务器的首选，因此，用户也总是喜欢拿阿里云服务器和腾讯云服务器的价格来做对比，今天给大家做个常用服务器配置的对比，看看云服务器哪家便宜。阿里云腾讯云.png一、代金券优惠力度对比首先我们看下阿里云和腾讯云各自的代金券优惠力度，因为不管购买哪家云服
单片机IO中断方式的短按与长按功能 weixin_50707044 单片机嵌入式硬件
#include//定义按键连接的引脚sbitKEY=P1^0;//定义短按和长按的时间阈值（单位：毫秒）#defineSHORT_PRESS_TIME200#defineLONG_PRESS_TIME1000//定义标志位bitpress_flag=0;bitlong_press_flag=0;unsignedintpress_time=0;//中断服务程序，用于处理按键按下的事件voidext
【大语言模型基础】GPT（Generative Pre-training ）生成式无监督预训练模型原理
前言ELMo：将上下文当作特征，但是无监督的语料和我们真实的语料还是有区别的，不一定符合我们特定的任务，是一种双向的特征提取。OpenAIGPT:通过transformerdecoder学习出来一个语言模型，不是固定的，通过任务fine-tuning,用transfomer代替ELMo的LSTM。OpenAIGPT其实就是缺少了encoder的transformer：当然也没了encoder与de
GPT-4o mini TTS：领先的文本转语音技术桂花饼 AIGC GPT-4o o4-mini 语音识别人工智能 GPT-4o
什么是GPT-4ominiTTS？GPT-4ominiTTS是OpenAI推出的全新一代文本转语音（TTS）技术，能够以自然、流畅的方式将普通文本转换为语音。依托先进的神经网络架构，GPT-4ominiTTS在语音合成中避免了传统TTS的生硬与机械感，能够生成富有情感和个性化表达的高质量语音。该技术支持多语言与多口音，是视频、播客、电子学习等场景的理想选择。核心特点自然流畅，接近真人GPT-4om
【农业模型】GPT地学领域应用、AquaCrop、R贝叶斯生态、Copula函数、DSSAT、APSIM、WOFOST、DNDC、CERRES、SWACRO、RZWQM、POTATO、SOLANUM weixin_贾遥感数据与作物模型地理遥感生态模型 ChatGPT4/DeepSeek gpt r语言无人机经验分享
农业模型依据研究对象分为农业生物模型、农业环境模型、农业技术模型、农业经济模型作物模型，即作物生长模拟模型(或称作物生长模型)，是从系统科学的角度，基于作物生理过程机制，将气候、土壤、作物品种和管理措施等对作物生长的影响因素作为一个整体系统的数值模拟系统。能够以特定时间步长对作物在单点尺度上生长发育的生物学参数以及作物产量进行动态模拟，定量化研究环境因子以及田间管理措施对作物生长发育的影响。通用型
440洋洋【1期4班】刻意练习Day4 蓝梦菁
图片发自App【分析】：运用对比，前后时间的对比，人物的变化，通过他人的语言表达出来，更加真实，让人信服。【刻意练习】：我已经融化了，有一天，在一家冷饮店里，有一位女士手捧着我，她用双眼凝视着我说：“我认识你，永远记得你。那时候，你是一颗绿豆，碧绿色的外衣包裹着饱满的躯体，人人都说你是绿豆中的极品。现在，我要告诉你，对我来说，我觉得现在的你比以前更有味道，那时你只是一颗绿豆，与你那时的形态相比，我
中华古典文学-诗经名句要生花
中华上下五千年，文化底蕴浩如烟海，其中，诗经有着不可忽视的地位。图片发自App知我者，谓我心忧；不知我者，谓我何求，悠悠苍天，此何人哉?——《诗经国风王风黍离》译：知道我的人，说我心烦忧；不知道的，问我有何求。高高在上的老天，是谁害我如此(指离家出走）？知我者，在何方？！
连山易每天学术——四利吉符“龙德”终于等到您啦…… 丰羽国学
图片发自App今天是2019年7月29日己亥年辛未月丁卯日天时环境值龙德之气，为2爻。6柱中有酉、丑、卯今天和您有关联，应5爻，两个条件都具备了，今天是您的幸运日，会有如期收获；六柱有辰、丑墓，同时应5爻者，天道酬勤、见好就收；六柱有子、酉长生者，同时应5爻者，追求美好的您今天可以接见、拜访重要客户，通过美好的语言收获对方的认，谈判适合坐正西方；六柱有巳旺者，同时应5爻，追求浪漫的您今天可以少做重
为什么品牌商纷纷搭建商城小程序？有调琳琳
商城小程序近年来备受品牌商青睐。作为新型的电商形态，商城小程序有什么优势呢?搭建商城小程序需要注意什么?商城小程序能为品牌带来什么与众不同的效应?微信在2017年1月上线小程序功能，目的在于将用户使用APP的频率降低，将用户整合到微信小程序。与APP相比，小程序有不需要安装及删除，用完即走的特点，不占用手机内存，不需要APP之间来回切换。最近微信小程序有了星标功能，可以让用户在使用过小程序之后，小
年末黑马小说＆《黄昏之恋》老赵孙雨菲&全文无删减阅读寒风书楼
年末黑马小说＆《黄昏之恋》老赵孙雨菲&全文无删减阅读主角：老赵孙雨菲简介：半个月前，来省城探亲的老赵，住进了表姐董茹的家里。刚住进来，他就不淡定了。关注微信公众号【放心文楼】去回个书号【6】，即可阅读【黄昏之恋】小说全文！半个月前，来省城探亲的老赵，住进了表姐董茹的家里。刚住进来，他就不淡定了。因为表姐董茹的儿媳妇，简直是一个极品尤物。她叫孙雨菲，年芳26岁，是一家美妆公司的高管，她不仅貌相倾国倾
《我们的日子》横跨30年，两代人四个家庭，看亲情友情爱情的变迁娱娱鱼
《我们的日子》的预约被提上来了，虽然还没定档，但该剧属于老少皆宜的年代剧题材，很适合在春节期间上星播出。跟讲述一家人事业情感变迁的《人世间》类似，略有不同的一点，《我们》的侧重点是讲述邻里几家人事业情感的变迁。杨家、王家、东方家都是工厂家属区的老住户。其中，王宪平（李乃文饰）跟刘淑霞（李小冉饰）是一起长大的发小，也是青梅竹马的恋人。傅莹（齐欢饰）跟东方玉树（孙浩饰）是不打不相识，也是日久生情的爱人
淘宝门店优惠券在哪里?淘宝店铺的优惠券在哪里设置氧惠好物
首先，你需要登录淘宝账号，然后进入淘宝卖家中心。在卖家中心的左侧菜单中找到并点击“营销中心”选项下的“促销管理”。在促销管理页面中，你可以看到各种促销工具，其中就包括“优惠券”。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元
平行宇宙宇起gege
大家有没有想过平行宇宙，当我在开心或难过的时候我就会想宇宙的那边有没有平行宇宙，他现在有在干什么呢？他的心情又是一个什么样的呢？今天我就给大家讲一讲我心目中的平行宇宙是什么样的。当我考试的时候，我就会想宇宙那头的我是不是还在放假？当我们睡觉的时候，他们是不是才刚起床？当我们生气的时候，他们是不是非常开心？当我们死亡的时候，他们是不是才刚出生？当我们写作文的时候，他们是不是还在玩耍？他们的一加一等于
day 28打卡 weixin_39908253 AI学习笔记 python
day18选用昨天的kmeans得到的效果进行聚类，进而推断每个簇的实际含义#先运行之前处理好的代码importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsimportwarningswarnings.filterwarnings('ignore')plt.rcParams['font.sans-se
python-程序编程-实例“温度转换”
实例：温度刻画的两种不同的体系。摄氏度、华氏度需求：将两种不同的摄氏度进行转换。问题分析：输入：输入一个华氏度的温度或者摄氏度的温度值处理：根据温度标志进行温度转换。输出：输出一个带华氏度或者摄氏度的温度值。(f代表华氏度，c代表是摄氏度)c=(f-32)/1.8f=c*1.8+32代码如下：temp=input("请输入有符号的温度值")iftemp[-1]in['f','F']:c=(eval
每天都值得记录14 一年级新生
今天周日，主要工作送娃归校，其次是喝茶聊天。早上女儿补课，我赶回来上网课，不记得之前买的牛奶拿了没。回家查看记录竟然一个星期都没到货，又懒得下去买了。吃完饭，让老公下去买牛奶，给孩子带去学校。他竟然来一句“没有就不带了，一个星期不吃会死人呀”！我直接回一句“怎么这么说话？”转瞬我就明白，他知道我累又不好发我火，只能把目标转向孩子，我也是醉了。儿子和婆婆都在客厅，我没理论，也没继续沟通。准备晚上沟通
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源