shaoyue1234

异常检测——集成学习

Ensembles for Unsupervised Outlier Detection: Challenges and Research Questions

首先，知道一个模型好不好（精确不）

外部指标
内部指标

其次，提高不同模型的多样性

多样性的意义
多样性的引入
多样性的评估
模型的选择

模型的集成

异常分数的Normalization
分数向量的合成
排名的合成

总结

首先，知道一个模型好不好（精确不）

外部指标

aucroc
top-k正确率
但是这些都是有监督的

内部指标

目前暂无

其次，提高不同模型的多样性

多样性的意义

图中红色的一个点代表一个模型的结果，绿圈代表groundtruth，蓝色代表集成各个模型后的结果。

当模型具有多样性时，模型之间可以互补，结果会更接近于groundtruth。

当模型不具备多样性时，多个模型的结果可能聚集在一起，导致最终的结果向该方向偏移，并不会取得很好的结果。
总的来说，每个模型越精确，模型之间越具有多样性，最终得到的结果就越好。

多样性的引入

目前主要通过以下几种方法实现：

每个模型在不同的特征子集上学习
- 如feature bagging
每个模型在不同的数据子集上学习
- 比如估计密度时，只用10%的数据，可以大大的提高运算速度，增加多样性
用随机的方法训练/学习
- 例如isolation forests ，每次subsample时，可以选随机的特征把树split，可以视为随机的方法
用同一种方法学习，但是用不同的参数
- 不同的参数会带来不同的学习效果
用不同的模型学习
- 使用时要注意结果的normalization and unification ，避免单模型分数高影响最终结果

多样性的评估

目前发现

使用同一方法，不同参数学习的结果很相似
不同的距离度量方法可以带来多样性
同一家族里的算法具有相似的结果，如LOF和LoOP
Feature Bagging可以获得比较uncorrelated结果，能改善集成的结果

模型的选择

模型的选择有不同的方法，比较有代表性的是启发式的算法。
论文中给了一个贪心的模型选择算法。

利用weighted Pearson来判断相似性，然后进行贪心的选择。

模型的集成

已经获得了准确的、具有多样性的模型，并对其进行选择以后，就要将模型集成在一起了，集成时要注意以下几点。

异常分数的Normalization

避免单模型分数scale不同导致的误差

分数向量的合成

Normalization以后，如何将这些分数向量（1*m，m表示数据的个数）合成在一起，需要考虑实际的状况。

如果分数大，表示大概率为异常，分数小表示大概率为正常时，选用maximum score会倾向于将数据判断为异常。上图a表示会倾向于表示为异常，图b表示可能某个单个模型的结果会对最终结果造成很大的影响。
通常情况下，选用maximum score不如选用mean。
但是实际上还是根据具体应用具体分析。如果漏掉异常的代价比高的false alarm rate代价高，那么使用maximum score是不错的选择。如果false negative的代价高，而错过一个异常代价低，那么选择minimum也很好。

排名的合成

有时有些模型不输出异常分数，而是输出异常排名。这时候就要进行排名的合成了。这种在数据库和信息检索学中都有比较成熟的方法。
feature bagging 中使用的方法是breadth-first traversal rank combination，这是一种宽度优先的算法，将每个模型的topk排名取出，然后依次拿出每个模型的第一名，排在一起，然后再拿第二名，以此类推。

总结

成功集成的关键

学到好的模型（精确）
让模型具有多样性
将这些模型结合在一起

你可能感兴趣的:(异常检测)

pytorch正向传播没问题，loss.backward()使定义的神经网络中权重参数变为nan 加速却甩不掉伤悲 pytorch 神经网络人工智能
记录一个非常坑爹的bug:loss回传导致神经网络中一个linear层的权重参数变为nan1.首先loss值是正常数值；2.查了好多网上的解决办法：检查原始输入神经网络数据有没有nan值，初始化权重参数，使用relu激活函数，梯度裁剪，降低优化器的学习率等等都没解决，个人认为这些应该影响不大，一般不会出问题；3.最后是使用如下异常检测：检测在loss回传过程中哪一块出现了问题torch.autog
工信教考 | AI智能体应用工程师（模拟试题）人工智能-猫猫人工智能开源自然语言处理语言模型架构
关于AI智能体工程师的模拟试题，下面根据AI智能体工程师所需掌握的知识和技能，设计一些模拟题型的示例。这些题目旨在考察应试者在人工智能、机器学习、深度学习、算法设计、系统开发等方面的能力。一、选择题无监督学习常用于哪些任务？（单选）A.回归分析B.聚类分析C.分类预测D.序列预测答案：B解析：无监督学习常用于聚类、降维、异常检测等任务，如市场分割、数据可视化等。以下哪种激活函数常用于分类问题的输出
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
【大数据】孤立森林算法大雨淅淅大数据算法 python 大数据人工智能
目录一、孤立森林算法概述二、孤立森林算法优缺点和改进2.1孤立森林算法优点2.2孤立森林算法缺点2.3孤立森林算法改进三、孤立森林算法代码实现3.1孤立森林算法python实现3.2孤立森林算法JAVA实现3.3孤立森林算法C++实现四、孤立森林算法应用一、孤立森林算法概述孤立森林算法是一种用于异常检测的机器学习算法。它基于这样的直觉：异常点是数据中的少数派，它们在特征空间中的分布与正常数据点不同
基于STM32的工厂安全监测系统：采用FreeRTOS、MQTT协议、InfluxDB存储与Grafana可视化，实现实时数据监测与异常检测算法优化的综合解决方案（代码示例）极客小张 stm32 安全 grafana 算法物联网 c++异常检测算法
一、项目概述项目目标与用途随着工业自动化的不断推进，工厂的安全问题成为了企业管理者关注的重点。工厂中的温度、湿度、气体浓度、烟雾、压力等环境参数直接影响着生产的安全性和产品的质量。本项目旨在设计并实现一个嵌入式工厂安全监测系统，实时监测工厂环境中的关键安全参数，通过无线通信模块将数据传输到云端进行存储和分析，从而实现对工厂环境的智能化监控和预警。项目解决的问题与价值实时监测：实时采集工厂内的温度、
电力行业电气领域相关数据集下载地址汇总输电线路变电站电网应用数据集汇总(全网最全) FL1623863129 数据集目标检测
在电力行业电气领域，数据集扮演着至关重要的角色。这些数据集涵盖了从发电到用电的各个环节，包括输电线路图像、变电站监测、电力负荷预测等多样化内容。例如，输电线路图像数据集通过无人机或直升机拍摄，包含了杆塔、绝缘子、导线等详细图像，为目标检测、分类和异常检测提供了丰富的素材。此外，还有针对变电站烟火检测、导线破损检测等特定任务的数据集，这些数据集通过收集实际场景中的图像和视频，帮助研究人员训练更加精准
周报 | 24.8.12-24.8.18文章汇总双木的木深度学习拓展阅读深度学习人工智能 transformer 算法 python stable diffusion llama
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|24.8.5-24.8.11文章汇总-CSDN博客OpenCV与AI深度学习|实战|使用YoloV8实例分割识别猪的姿态（含数据集）-CSDN博客极市平台|异常检测开源数据集汇总-CSDN博客程序员学长|快速学习一个算法，集成学习-CSDN博客Coggle数据科学|行业落地分享：大模型RAG汽车应用实践_rag中的意图识别-CSD
异常GPT：使用LVLMs检测工业异常 DUT_LYH gpt 人工智能算法
AnomalyGPT：利用LVLMs进行工业异常检测摘要本文介绍了一种名为AnomalyGPT的新型工业异常检测方法，该方法基于大型视觉语言模型(LVLMs)。AnomalyGPT能够检测并定位图像中的异常，无需手动设置阈值。此外，AnomalyGPT还可以提供与图像相关的详细信息，以交互方式与用户进行交流。本文详细阐述了AnomalyGPT的模型架构、解码器、提示学习器以及异常模拟方法，并在Vi
基于极限树特征递归消除和LightGBM的异常检测模型宋罗世家技术屋信息资源管理与发展专栏算法 python
摘要入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除（ExtraTrees-RecursiveFeatureElimination,ET-RFE）和LightGBM（LGBM）的入侵检测方法。首先对网络数据进行独热编码重构,在数据级层面均衡少量样本的攻击类别;其次,使用基于ET-RFE对流量特征进行降维处理,寻找含有信息
探索LightGBM：监督式聚类与异常检测 Echo_Wish Python 笔记 Python算法聚类数据挖掘机器学习
导言监督式聚类和异常检测是在监督学习框架下进行的一种特殊形式的数据分析技术。在Python中，LightGBM提供了一些功能来执行监督式聚类和异常检测任务。本教程将详细介绍如何使用LightGBM进行监督式聚类和异常检测，并提供相应的代码示例。监督式聚类监督式聚类是一种将聚类任务结合到监督学习框架中的技术。LightGBM提供了一种基于决策树的监督式聚类方法。以下是一个简单的示例：importli
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试 deephub llama 深度学习时间序列基础模型
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
基于UI交互意图理解的异常检测方法美团测试
美团到店平台技术部/质量工程部与复旦大学周扬帆教授团队开展了科研合作，基于业务实际场景，自主研发了多模态UI交互意图识别模型以及配套的UI交互框架。本文从大前端质量保障领域的痛点出发，介绍了UI交互意图识别的方法设计与实现。基于UI交互意图编写的测试用例在实际业务中展现出了可以跨端、跨App的泛化能力，希望可以为从事相关工作的同学带来一些启发或帮助。1.背景近年来，随着美团多种业务线的扩充和迭代，
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试人工智能深度学习python
2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的开源基础模型:laglllama。在原论文《Lag-Llama:TowardsFoundationMo
异常检测-基于统计学的方法-学习笔记-2 Rank_Fan007
异常检测的学习笔记并非原创，而是搜索各位大佬的帖子整理而得。如有冒犯，请联系我。1.概述统计学⽅法对数据的正常性做出假定。它们假定正常的数据对象由⼀个统计模型产⽣，而不遵守该模型的数据是异常点。异常检测的统计学⽅法的⼀般思想是：学习⼀个拟合给定数据集的⽣成模型，然后识别该模型低概率区域中的对象，把它们作为异常点。根据如何指定和学习模型，异常检测的统计学⽅法可以划分为两个主要类型：参数⽅法和⾮参数⽅
Deep Learning for Anomaly Detection: A Review（翻译） appron 入侵检测异常检测网络攻击检测
前言一、引言二、异常检测：问题的复杂性和挑战1.主要问题复杂性2.深度异常检测所面临的主要挑战三、用深度异常检测应对挑战1.预备工作2.深度异常检测方法的分类四.深度学习的特征提取1.预训练模型2.特定的特征提取模型五.学习常态的特征表征(特征提取器即分类器，即时连接同步训练的特征提取器和分类器)1.通用规范特征学习1.1自动编码器。(特征提取器即分类器）1.2生成对抗网络。(AnoGAN,f-A
ICCV 2023 | 腾讯优图16篇论文入选！轻量级主干、异常检测和扩散模型等方向 Amusi（CVer）
点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【计算机视觉和论文写作】交流群来源：腾讯优图实验室作为全球计算机领域顶级的学术会议之一，ICCV2023（InternationalConferenceonComputerVision）国际计算机视觉大会将于今年10月在法国巴黎举行。近日，ICCV公布了论文录用结果，本届会议共有8068篇投稿，接收率为26.8%。今年
ICCV 2023 | 8篇论文看扩散模型diffusion用于图像检测任务：动作检测、目标检测、异常检测、deepfake检测... 机器学习与AI生成创作目标检测人工智能计算机视觉
1、动作检测DiffTAD:TemporalActionDetectionwithProposalDenoisingDiffusion基于扩散方法提出一种新的时序动作检测（TAD）算法，简称DiffTAD。以随机时序proposals作为输入，可以在未修剪的长视频中准确生成动作proposals。从生成建模的视角，与先前的判别学习方法不同。首先将真实proposals从正向扩散到随机proposa
智能运维哪些算法？智能运维包含哪些云呐AIOps 智能运维 AIOps 运维管理系统运维
在智能运维领域，详细介绍一些关键的算法，并阐述这些算法是如何被应用于智能运维系统中的。此外，关于智能运维中包含的主要组成部分或功能模块，以及它们各自的作用和重要性。如何应用再场景中应用在智能运维行业，一些关键算法包括：机器学习算法：如决策树、随机森林、svm算法等，从历史数据中学习方法和规律，预测未来的特点和故障。在智能操作和维护系统中，这些算法被应用于故障预测、异常检测、资源调度等方面，以帮助操
NeurIPS 2023 时间序列相关论文总结 STLearner 大数据智慧城市 pytorch 数据挖掘论文阅读深度学习
祝大家中秋国庆双节快乐！NeurIPS2023将于11月28日到12月9日在美国路易斯安那州新奥尔良举行。根据官方公布的邮件显示，今年共有12343篇投稿，接受率为26.1%，官网显示一共有3564篇论文。本文总结了NeurIPS23时间序列（不含时空数据，已经另外总结）的相关论文。包括时间序列预测，分类，异常检测，因果发现，交通，医疗等领域时间序列应用和大模型在时间序列问题建模的探索等方向。1.
WWW 2024 | 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结 STLearner 时空数据人工智能机器学习深度学习数据挖掘智慧城市论文阅读
WWW2024已经放榜，本次会议共提交了2008篇文章，researchtracks共录用约400多篇论文，录用率为20.2%。本次会议将于2024年5月13日-17日在新加坡举办。本文总结了WWW2024有关时间序列（TimeSeries）和时空数据（Spatial-Temporal）的相关文章，部分挂在了arXiv上。时间序列Topic：时序预测，异常检测，时域频域，大模型等时空数据Topic
梯度提升树系列6——GBDT在异常检测领域的应用 theskylife 数据挖掘机器学习数据挖掘 GBDT 分类 python
目录写在开头1异常检测的基本概念1.1定义和目标1.2GBDT在异常检测中的适用性2信用卡欺诈检测案例分析2.1场景介绍2.2收集数据和特征工程2.3进行异常值识别2.4模型效果评估2.5模型优化3策略和技巧4面临的挑战和解决方案4.1数据不平衡4.2过拟合4.3模型解释性写在最后在如今数据驱动的时代，异常检测成为了保障系统安全的关键技术，尤其在金融安全、网络安全等领域中扮演着至关重要的角色。梯度
时间序列异常检测论文TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate Time Series Data 蛐蛐蛐 transformer 深度学习人工智能
由于工作需要，想用一下这篇论文的方法，但感觉其代码还是有很多不清除的地方，简单总结一下。关于论文的内容介绍，可以参考：【VLDB】融合transformer和对抗学习的多变量时间序列异常检测算法TranAD论文和代码解读-知乎说得比较清楚了，我就不重复了。但是读代码的时候还是有很多不明白的地方。这里以Data文件夹下的SWaT数据集为例进行分析。首先，打开train.xlsx，可以看到就是两个me
Python报No such file or directory: ‘science‘的解决方法蛐蛐蛐 Python技巧论文点评 python 开发语言
接上一篇博文：时间序列异常检测论文TranAD:DeepTransformerNetworksforAnomalyDetectioninMultivariateTimeSeriesData-CSDN博客还是想看看这篇论文的可视化结果。但是当我重新运行原版代码的时候，会报错：FileNotFoundError:[Errno2]Nosuchfileordirectory:'science'Theabo
Wazuh功能——异常和恶意软件检测 Threathunter
异常检测是指在系统中发现与预期行为不匹配的模式的行为。一旦恶意软件(例如rootkit)安装在系统上，它就会修改系统以隐藏自己，不让用户看到。尽管恶意软件使用多种技术来实现这一点，Wazuh却使用了一种广谱的方法来发现异常模式，表明可能存在入侵者。负责这项任务的主要组件是rootcheck，然而，Syscheck也扮演着重要的角色。一、怎样工作1、文件完整性监测恶意软件可以替换其主机系统上的文件、
【人工智能】神奇的Embedding：文本变向量，大语言模型智慧密码解析(10) 魔道不误砍柴功 AI 大模型人工智能 embedding 语言模型
什么是嵌入？OpenAI的文本嵌入衡量文本字符串的相关性。嵌入通常用于：Search搜索（结果按与查询字符串的相关性排序）Clustering聚类（文本字符串按相似性分组）Recommendations推荐（推荐具有相关文本字符串的条目）Anomalydetection异常检测（识别出相关性很小的异常值）Diversitymeasurement多样性测量（分析相似性分布）Classificatio
Arxiv网络科学论文摘要15篇(2020-10-21) ComplexLY
考虑拓扑的图池化网络;因果网络模体：识别A/B测试中的异构溢出效应;关系事件模型与逆强化学习之间的联系，用于表征群体互动序列;不能通过外表来判断用户：了解社交媒体研究中多模式处理中的危害;气候讨论中推文的传播;目标路网中断导致的级联故障;通过基于订阅的频道嵌入来理解YouTube社区;鲁棒的异步和独立于网络的合作学习;通过学习和预测行为进行早期异常检测;Heider与协同演化平衡：从离散到连续相变
基于LLM的数据漂移和异常检测新缸中之脑 LLM
大型语言模型(LLM)的最新进展被证明是许多领域的颠覆性力量（请参阅：通用人工智能的火花：GPT-4的早期实验）。和许多人一样，我们非常感兴趣地关注这些发展，并探索LLM影响数据科学和机器学习领域的工作流程和常见实践的潜力。在我们之前的文章中，我们展示了LLM使用Kaggle竞赛中的表格数据提供预测的潜力。只需很少的努力（即数据清理和/或功能开发），我们基于LLM的模型就可以在几个竞赛参赛作品中获
京东数据分析岗面试题目整理 Data地平线
1，怎么做恶意刷单检验分类问题用机器学习方法建模解决，特征有：1）商家特征：商家历史销量、信用、产品类别、发货快递公司等2）用户行为特征：用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号3）环境特征（主要是避免机器刷单）：地区、ip、手机型号等4）异常检测：ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等5）评论文本检测：刷单的评论文本可能套路较为一致，计算与已标注评
2-5 异常检测 Anomaly detection with robust deep autoencoders 笔记 Siberia_
一、基本信息题目：Anomalydetectionwithrobustdeepautoencoders 期刊/会议：ACMSIGKDD 发表时间：2017年引用次数：26二、论文总结2.1研究方向提高自编码模型的抗噪声能力2.2写作动机受鲁棒PCA的启发，将原始数据分成正常数据和噪声、异常数据两部分，然后进行交替训练。2.3创新之处除了使用传统的L1正则化去约束噪声部分之外
[Python] 什么是KMeans聚类算法以及scikit-learn中的KMeans使用案例老狼IT工作室 python 机器学习 python scikit-learn
什么是无监督学习？无监督学习是机器学习中的一种方法，其主要目的是从无标签的数据集中发现隐藏的模式、结构或者规律。在无监督学习中，算法不依赖于任何先验的标签信息，而是根据数据本身的特征和规律进行学习和推断。无监督学习通常用于聚类、降维、异常检测等任务。在聚类中，算法会将相似的数据点归为一类；在降维中，算法会将高维数据映射到低维空间；在异常检测中，算法会发现与其他数据不同的离群点。无监督学习是与有监督
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他