jediael_lu

sklearn中的metrics

文章目录

- MSE
- 交叉验证
- 准确率、精度、召回率、F1、AUC
- - 准确率
  - 混淆矩阵
  - 精度、召回率、F1
  - ROC & AUC
- 阈值衡量、ROC曲线
- - 阈值选择
  - ROC曲线

多分类的metrix问题，请见多分类问题。

MSE

我们先看一下回归问题常用的均方根误差MSE。

from sklearn.metrics import mean_squared_error
housing_pred = lin_reg.predict(housing_feature)
lin_mse = mean_squared_error(housing_label, housing_pred)
print(np.sqrt(lin_mse))

69658.1903557702

交叉验证

使用sklearn提供的cross_val_score()，我们可以很方便的交叉验证模型效果。比如，我们看一下上面5和非5的线性分类器的准确率：

from sklearn.model_selection import cross_val_score, cross_val_predict
cross_val_score(sgd_clf, X_train, y_train_5, cv=3, scoring='accuracy')

array([0.9615, 0.9595, 0.9535])

上述代码中，我们随机划分训练数据和测试数据，训练模型后计算准确率，并重复了3次。

准确率、精度、召回率、F1、AUC

下面我们主要看一下准确率、精度、召回率、F1、ROC/AUC等常用于二分类问题的metrics。

准确率

from sklearn.metrics import accuracy_score, confusion_matrix, precision_score, recall_score, f1_score, precision_recall_curve
y_pred_5 = sgd_clf.predict(X_test)

accuracy_score(y_test_5, y_pred_5)

0.96165625

混淆矩阵

confusion_matrix(y_test_5, y_pred_5)

array([[57323,   878],
       [ 1576,  4223]])

精度、召回率、F1

precision_score(y_test_5, y_pred_5)

0.8278768868849246

recall_score(y_test_5, y_pred_5)

0.7282290050008622

f1_score(y_test_5, y_pred_5)

0.774862385321101

ROC & AUC

from sklearn.metrics import roc_auc_score
roc_auc_score(y_test_5, y_pred_5)

0.856571676775787

阈值衡量、ROC曲线

sklearn不允许对分类模型直接设置阈值，但是可以访问它用于预测的决策分数。不是调用分类器的predict()函数，而是调用decision_function()函数，这种方法返回每个实例的分数，然后就可以根据这些分数，使用任意阈值进行预测了。

我们先看个示例：

y_pred = sgd_clf.predict([X_test[11]])
print(y_pred)

y_score = sgd_clf.decision_function([X_test[11]])
print(y_score)

[ True]
[58446.52780903]

我们随机抽取了一个样本，其score=41983，而默认的阈值为0，所以预测结果为True。如果我们现在想提高精度（降低其召回率），那可以提高其阈值：

threshold = 50000
y_predict_t = (y_score > threshold)
print(y_predict_t)

accuracy = accuracy_score(y_test, y_predict_t)
precision = precision_score(y_test, y_predict_t)
recall = recall_score(y_test, y_predict_t)
f1 = f1_score(y_test, y_predict_t)
auc = roc_auc_score(y_test, y_predict_t)
print(accuracy, precision, recall, f1, auc)

[ True]

阈值选择

那怎么选取合适的阈值呢？

我们先使用cross_val_predict()获取决策分数而非预测结果；然后使用precision_recall_curve()计算所有可能阈值的精度和召回率；最后使用matplotlib绘制精度和召回率相对于阈值的函数组：

y_score = cross_val_predict(sgd_clf, X_train, y_train_5, cv=3, method='decision_function')
precisions, recalls, thresholds = precision_recall_curve(y_train_5, y_score)
def plot_precision_recall_vs_threshold(precisions, recalls, thresholds):
    plt.plot(thresholds, precisions[:-1], 'b--', label='Precision')
    plt.plot(thresholds, recalls[:-1], 'g-', label='Recall')
    
plot_precision_recall_vs_threshold(precisions, recalls, thresholds)
plt.show()

根据上图，可以选择合适的阈值。

假设你决定将精度设置为90%：

threshold_90_precision = thresholds[np.argmax(precisions>=0.90)]
print(threshold_90_precision)

261289.38745837728

取的合适的阈值后，我们可以这样指定最终的预测结果：

y_pred_90 = (y_score >= threshold_90_precision)
print(y_pred_90)

[False False False ... False False False]

ROC曲线

画ROC曲线和上述的精度、召回率曲线类似，但要先算出FPR和TPR：

from sklearn.metrics import roc_curve
fpr, tpr, thresholds = roc_curve(y_train_5, y_score)
def plt_roc_curve(fpr, tpr, label=None):
    plt.plot(fpr, tpr, linewidth=2, label=label)
    plt.plot([0,1], [0,1], 'k--')
    
plt_roc_curve(fpr, tpr)
plt.show()

画出ROC曲线后，可用上述的方法计算得到AUC：

roc_auc_score(y_test_5, y_pred_5)

0.856571676775787

你可能感兴趣的:(3.Sklearn,sklearn,metrics,精度,召回率,ROC)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python画出分子化学空间分布（UMAP） Sakaiay python
利用umap画出分子化学空间分布图安装pipinstallumap-learn下面是用一个数据集举的例子importtorchimportumapimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfromsklearn.manifoldimportTSNEfromrdkit.Chemimport
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
quartus频率计时钟设置_FPGA021 基于QuartusⅡ数字频率计的设计与仿真 weixin_39876739 quartus频率计时钟设置
摘要随着科技电子领域的发展，可编程逻辑器件，例如CPLD和FPGA的在设计中得到了广泛的应用和普及，FPGA/CPLD的发展使数字设计更加的灵活。这些芯片可以通过软件编程的方式对内部结构进行重构，使它达到相应的功能。这种设计思想改变了传统的数字系统设计理念，促进了EDA技术的迅速发展。数字频率计是一种基本的测量仪器。它被广泛应用与航天、电子、测控等领域。采用等精度频率测量方法具有测量精度保持恒定，
欺诈文本分类检测（十四）：GPTQ量化模型沉下心来学鲁班微调分类人工智能语言模型微调
1.引言量化的本质：通过将模型参数从高精度（例如32位）降低到低精度（例如8位），来缩小模型体积。本文将采用一种训练后量化方法GPTQ，对前文已经训练并合并过的模型文件进行量化，通过比较模型量化前后的评测指标，来测试量化对模型性能的影响。GPTQ的核心思想在于：将所有权重压缩到8位或4位量化中，通过最小化与原始权重的均方误差来实现。在推理过程中，它将动态地将权重解量化为float16，以提高性能，
Unreal Engine——AI生成高精度的虚拟人物和环境（虚拟世界构建、电影场景生成）（二）（技术分析）爱研究的小牛 AIGC—虚拟现实人工智能虚幻游戏引擎 AIGC
UnrealEngine（虚幻引擎）是业界领先的3D实时渲染引擎，广泛应用于游戏开发、影视制作、建筑可视化和虚拟现实等领域。其核心技术实现涵盖了多项复杂的功能模块，包括图形渲染、物理引擎、动画系统、音效系统和网络系统等。1.图形渲染技术UnrealEngine的图形渲染系统非常强大，支持实时渲染复杂的3D场景，生成高品质的视觉效果。虚幻引擎使用先进的渲染管线，主要分为以下几个方面：1.1渲染管线虚
什么是电能表精度等级，1级电能表、B级电能表有差异吗 zjytldz 人工智能大数据
电能表作为电力能源的计量装置，计量的精度等级是十分重要的，关系到电能的计量准确性和公平性。如果电能表精度等级过低，会导致计量结果存在较大的误差，从而影响用户的利益和公平性。因此，为了确保电能的准确计量和公平分配，需要制定相应的精度等级标准，对电能表进行严格的质量控制和监管。国家地区、行业等权威机构制定电能表计量精度等级的标准作为电能表研发、制造、销售的标准，在MID认证执行标准中将精度等级划分了A
GPS信号解释记得往前走 GNSS
笔者在进行对GPS信号解码的时候，看得头昏脑涨，就整理一下1.频段和频率L1/1575.42MHz:这是GPS的主要频段之一，用于大多数民用和军用信号。L2/1227.60MHz:这是GPS的第二个主要频段，通常用于提高精度，特别是与L1组合使用以消除电离层误差。L5/1176.45MHz:这是最新引入的频段，主要用于航空导航和其他高精度应用。2.信号类型（ChannelorCode）每个频段有多
JavaSE：数据类型与变量牛牪犇犇 java java 开发语言
目录1.字面常量2.数据类型3.变量3.1变量概念3.2语法格式3.3整型变量3.3.1整型变量3.3.2长整型变量3.3.3短整形变量3.3.4字节型变量3.4浮点型变量3.4.1单精度浮点型3.4.2双精度浮点类型3.5字符型变量3.6布尔型变量3.7类型转换3.7.1自动类型转换(隐式)3.7.2强制类型转换(显式)3.8类型提升3.8字符串类型1.字面常量System.Out.printl
东芝 TB67S128FTG：释放精密电机控制的力量东芝、铠侠总代13610068393 单片机嵌入式硬件
在电机控制领域，精度和效率至关重要。东芝的TB67S128FTG是一款专为先进电机控制应用设计的两相双极步进电机驱动器。让我们深入了解这款出色的芯片的功能和优点。TB67S128FTG概述TB67S128FTG是一款采用东芝BiCD工艺（结合双极、CMOS和DMOS技术）设计的高度集成的单片IC。此集成实现了高性能和可靠性，使TB67S128FTG成为需要精确电机控制的各种应用（如3D打印机、工业
Gauss列主元素消去法-C++【可直接复制粘贴/欢迎评论点赞】月白风清江有声 c++算法开发语言
Gauss列主元素消去法（也称为列主元Gauss消去法）是Gauss消去法的一种改进版本，主要用于求解线性方程组。在C++中实现时，它具有一些显著的优点和缺点，并且有着深厚的数学和计算背景。优点提高数值稳定性：列主元Gauss消去法通过在每一列中选择绝对值最大的元素作为主元，从而避免了在消元过程中使用过小或接近零的主元，这有助于提高计算的数值稳定性和精度。减少误差累积：由于选择了较大的主元进行消元
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
螺杆支撑座与滚珠丝杆的精准适配！科士威传动滚珠丝杆螺杆支撑座大数据服务器数据库运维制造能源
螺杆支撑座与滚珠丝杆的适配是确保机械系统的稳定性、精度和耐用性的关键，其适配方法主要包括螺纹连接、联轴器连接、锁紧连接。螺杆支撑座种类多样，每种类型都有其特定的适用范围和性能特点。因此，根据滚珠丝杆的规格和应用需求，选择合适的螺杆支撑座类型是首要，接下来就可以进行连接了。1、‌螺纹连接：‌是最常见的方法，通过丝杆上的外螺纹与螺杆支撑座上的内螺纹紧密咬合，实现直线运动的传递。2、‌联轴器连接：‌适用
分类算法可视化方法 dundunmm 数据挖掘分类数据挖掘人工智能可视化
可视化方法可以用于帮助理解分类算法的决策边界、性能和在不同数据集上的行为。下面列举几个常见的可视化方法。1.决策边界可视化这种方法用于可视化不同分类算法在二维特征空间中如何分隔不同类别。对于理解决策树、支持向量机（SVM）、逻辑回归和k近邻（k-NN）等模型的行为非常有用。importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasets
南京哪里有卖高仿手表 - 推荐这十个渠道美鞋之家
南京哪里有卖高仿手表-推荐这十个渠道对于钟表爱好者来说，能拥有一只瑞士名表无疑是件非常令人兴奋的事情。然而，正品名表的高昂价格却让很多人望而却步。为了满足大众的需求，市场上便出现了很多高仿手表，它们的外观、功能甚至是精度都与正品达到了几乎一样的水平。如果你正在寻找南京哪里有卖高仿手表，以下是十个可靠的渠道。微信:785540645(下单赠送精美礼品)1.玄武湖旁：这里有一些小商贩售卖各种仿制品，包
使用java9的uuid生成方式，让uuid生成速度提升一个档编程小世界
简介UUID的目的，是让分布式系统中的所有元素，都能有唯一的辨识信息，而不需要通过中央控制端来做辨识信息的指定。uuid常用场景IOT设备，设备号；网站sessionid，cookie用户id；数据库主键id；uuid生成工具hutoolJava工具包集mica基于Spring、java8微服务工具集压测代码测试基于JMH，是专门用于代码微基准测试的工具套件，基于方法层面的基准测试，精度可以达到微
Python基础朵&朵 python 开发语言
1.命名方法大驼峰：所有单词的首字母均大写小驼峰：第一个单词的首字母小写，其他单词的首字母小写变量：字母、数字、下划线组成，不能以数字开头，不能使用内置关键字，区分大小写2.多种变量输出方式查看类型：type(变量名)字符转义：\例如原本的\t表示一个tab键，\\t表示\t只作为了一个字符串打印出来而非一个tab键类型有：整型int、单精度浮点型float、双精度浮点型double、字符串str
conda安装包报PackagesNotFoundError错误张遥数据分析 python anaconda
先查找包(base)bash-3.2$anacondasearch-tcondasklearn返回包的相关信息根据对应的包的包名使用如下命令(base)bash-3.2$anacondashowcorjos/sklearn-pandas会直接给出安装命令condainstall--channelhttps://conda.anaconda.org/corjossklearn-pandas
刻意练习才能融会贯通 Canna谢
【格格读书成长营】第三讲开始带领我们解锁写作力。根据老师的要求，我们要写一篇《好好学习》这本书的书评。实话讲，书评这种文体类的命题作文还真没正经写过。格格老师教的方法不可谓不实用，但是面对不擅长的东西迟迟不敢下笔。《好好学习》这本书绝对是一本值得精度的书。整本书在教我们如何学习，如何升级我们的认知水平。我们之所以不长进，之所以“读了很多书，懂了很多道理，却依然过不好这一生”，是因为脑海里存储的临界
智能听诊器：宠物健康的科技守护者萌宠心语宠物科技
智能听诊器，作为宠物健康领域的创新技术，正以其精准监测和智能分析。这项技术通过高精度传感器捕捉宠物胸腔的微小振动，再利用先进的数据分析技术转化为关键生命体征，如心率和呼吸频率。它的便捷操作和实时反馈让宠物主人能够随时掌握宠物的健康状况，而早期预警系统则为宠物的健康提供专业保障。智能听诊器的智能化和便携性，使其成为宠物健康管理的得力助手。与传统的听诊方式相比，智能听诊器的一键连接功能和智能手机APP
【ML】支持向量机SVM及Python实现（详细） 2401_84009698 程序员支持向量机 python 算法
fromsklearn.preprocessingimportStandardScalerfrommatplotlib.colorsimportListedColormapfromsklearn.svmimportSVC###2.1加载数据样本加载样本数据及其分类标签iris=datasets.load_iris()X=iris.data[:,[2,3]]#按花瓣划分#X=iris.data[:,
python3.7安装keras教程_python 3.7 安装 sklearn keras(tf.keras) weixin_39641103
#1sklearn一般方法网上有很多教程，不再赘述。注意顺序是numpy+mkl，然后scipy的环境，scipy，然后sklearn#2anocondaanaconda原始的环境已经自带了sklearn，这里说一下新建环境（比如创建了一个tensorflow的环境），activatetensorflow2.0，然后condainstallsklearn即可，会帮你把各种需要的库都安装。#kera
TensorRT模型量化实践痛&快乐着深度学习 TensorRT c++深度学习
文章目录量化基本概念量化的方法方式1：trtexec（PTQ的一种）方式2：PTQ2.1pythononnx转trt2.2polygraphy工具:应该是对2.1量化过程的封装方式3：QAT(追求精度时推荐)使用TensorRT量化实践（C++版）使用TensorRT量化（python版）参考文献量化基本概念后训练量化PostTrainingQuantization(PTQ)量化过程仅仅通过离线推
使用3DUNet训练自己的数据集（pytorch）— 医疗影像分割编程日记✧ 智能医疗 pytorch 人工智能 python 计算机视觉图像处理深度学习健康医疗
代码：lee-zq/3DUNet-Pytorch:3DUNetimplementedwithpytorch(github.com)文章<cicek16miccai.pdf(uni-freiburg.de)3DU-Net:LearningDenseVolumetricSegmentation
验证resneXt，densenet，mobilenet和SENet的特色结构 dfj77477 人工智能 python
简介图像分类对网络结构的要求，一个是精度，另一个是速度。这两个需求推动了网络结构的发展。resneXt：分组卷积，降低了网络参数个数。densenet：密集的跳连接。mobilenet：标准卷积分解成深度卷积和逐点卷积，即深度分离卷积。SENet：注意力机制。简单起见，使用了[1]的代码，注释掉layer4，作为基本框架resnet14。然后改变局部结构，验证分类效果。实验结果GPU：gtx107
AN7536PT时钟电路 LeeYLong 时钟电路晶振选型
目录1时钟电路概述2时钟晶振电路2.1需求分析2.2晶振选型（Datasheet表5-7解读）2.3设计晶振电路（表4-1、图5-4）1时钟电路概述时钟电路是一种用于产生稳定、周期性脉冲信号的电子电路。它通常由晶体振荡器和相关逻辑电路组成。晶体振荡器负责产生高精度的振荡信号，而逻辑电路则负责对振荡信号进行分频、缓冲和分配，以满足不同部件的时序要求。时钟信号可以看作是系统中的心跳，指示了系统的工作节
如何从0到1本地搭建whisper语音识别模型 MaxCode-1 搭建本地gpt whisper
文章目录环境准备1.系统要求2.安装依赖项1：安装Python和虚拟环境2：安装Whisper3：下载Whisper模型4：进行语音识别5：提高效率和精度6：开发和集成Whisper是OpenAI发布的一个强大的语音识别模型，它可以将语音转换为文本，支持多语言输入，并且可以处理各种音频类型。以下是一个从0到1的本地搭建Whisper模型进行语音识别教程环境准备1.系统要求操作系统：Linux、Ma
微信小程序中数值计算的精度丢失问题 WorkAndDebugger 微信小程序微信小程序
在微信小程序中，当你遇到数值计算的精度丢失问题时，主要是因为JavaScript在处理浮点数时存在固有的精度问题。这是因为计算机内部使用二进制形式存储数字，而某些十进制小数在二进制中无法精确表示，从而导致了精度误差。解决这个问题的方法有几个：使用整数运算：如果你的应用允许，可以将所有涉及的小数转换为整数再进行计算。例如，将货币值乘以100转换为分进行计算，最后再除以100转换回元。function
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他