thecloud

mahout算法源码分析之Collaborative Filtering with ALS-WR （二）splitDataset 和parallelALS

Mahout版本：0.7，hadoop版本：1.0.4，jdk：1.7.0_25 64bit。

接上篇，此篇blog分析第（1）、（2）对应的java源码，主要是splitDataset和parallelALS。

（一）其中splitDataset对应的mahout中的源java文件是：org.apache.mahout.cf.taste.hadoop.als.DatasetSplitter.java 文件，打开这个文件，可以看到这个类是继承了AbstractJob的，所以需要覆写其run方法。run方法中含有所有的操作。

进入run方法，看到刚开始和之前的算法分析一样，都是参数的获取。然后，新建了3个job，分别是：

Job markPreferences = prepareJob(getInputPath(), markedPrefs, TextInputFormat.class, MarkPreferencesMapper.class,
        Text.class, Text.class, SequenceFileOutputFormat.class);

Job createTrainingSet = prepareJob(markedPrefs, trainingSetPath, SequenceFileInputFormat.class,
        WritePrefsMapper.class, NullWritable.class, Text.class, TextOutputFormat.class);

Job createProbeSet = prepareJob(markedPrefs, probeSetPath, SequenceFileInputFormat.class,
        WritePrefsMapper.class, NullWritable.class, Text.class, TextOutputFormat.class);

首先来看第一个Job任务，这个Job没有reducer，只有一个mapper：MarkPreferencesMapper，打开这个Mapper就可以看到这个任务的具体操作了。

这个mapper含有两个函数，其一：setup，其二：map。看setup中，首先生成了一个随机变量，然后获取traning的数据集大小范围，然后获得prob（在前篇翻译为测试数据集，但是好像这个单词的翻译不是这样的，所以这里保留这个单词好了）数据集的大小范围。在map中则是根据setup中的随机数来把每条记录进行分类：

double randomValue = random.nextDouble();
      if (randomValue <= trainingBound) {
        ctx.write(INTO_TRAINING_SET, text);
      } else if (randomValue <= probeBound) {
        ctx.write(INTO_PROBE_SET, text);
      }

当随机数小于或者等于training的范围阈值traingingBound时就把这条记录标记为T，当随机数大于traingingBound且小于或者等于probeBound（prob数据集大小范围阈值）时，把该条记录标记为P。这里的probBound不一定要是1，意思就是说不一定要使用所有提供的数据集来把它们分为T和P，还可以分为不使用的数据集。

然后来看第二、三个任务，比较这两个任务，可以看到它们的不同之处只是在输入路径和输出路径，以及一些参数不同而已。而且也只是使用mapper，并没有使用reducer，那么打开WritePrefsMapper来看，这个mapper同样含有setup和map函数，setup函数则主要是获取是对T还是对P来进行处理，看map函数：

if (partToUse.equals(key.toString())) {
        ctx.write(NullWritable.get(), text);
      }

map函数就是对第一个job的输出进行处理的，partToUse是T的话，那么就把这条记录输出到TraingingDataSet中（这个是第二个任务）。第三个任务同样的道理，只是提供的partToUse不同，是P而已。这样就把原始数据分出了两部分，一部分是training dataset，一部分是 prob dataset，还有一部分是不使用的dataset（这部分可有可无）。

（二）parallelALS对应的源文件是：org.apache.mahout.cf.taste.hadoop.als.ParallelALSFactorizationJob.java文件。打开这个文件，进入run方法：参数获取完毕后，本次主要分析前面三个Job，分别是itemRatings Job、userRatings Job 和averageRatings Job。

(1)首先来分析itemRatings Job，调用的语句分别是：

Job itemRatings = prepareJob(getInputPath(), pathToItemRatings(),
        TextInputFormat.class, ItemRatingVectorsMapper.class, IntWritable.class,
        VectorWritable.class, VectorSumReducer.class, IntWritable.class,
        VectorWritable.class, SequenceFileOutputFormat.class);

这里有mapper和reducer，先分析mapper，即ItemRatingVectorsMapper，打开这个类看到，这个mapper中就一个map函数：

String[] tokens = TasteHadoopUtils.splitPrefTokens(line.toString());
      int userID = Integer.parseInt(tokens[0]);
      int itemID = Integer.parseInt(tokens[1]);
      float rating = Float.parseFloat(tokens[2]);

      Vector ratings = new RandomAccessSparseVector(Integer.MAX_VALUE, 1);
      ratings.set(userID, rating);

      ctx.write(new IntWritable(itemID), new VectorWritable(ratings, true));

这里的操作就是把一条记录转换，然后输出<key,value>对应为 itemID, [userID:rating]这样的输出，然后到reducer，即VectorSumReducer，这个reducer中也只有一个reduce函数：

Vector vector = null;
    for (VectorWritable v : values) {
      if (vector == null) {
        vector = v.get();
      } else {
        vector.assign(v.get(), Functions.PLUS);
      }
    }
    ctx.write(key, new VectorWritable(vector));

这个VectorSumReducer在前面的算法中好像也有分析过，vector.assign(v.get(),Functions.PLUS)是把vector中对应的项相加；比如如果原来的vector为[1:2.3,2:3.3,5:3.4]，然后使用上面的assign和Function.PLUS参数加上v,[2:3.3,4:4.0]，那么新的vector就更新为[1:2.3,2:6.6,4:4.0,5:3.4]，这就是所谓的对应相加。所以这个reducer的输出为itemID ：：[userID:rating,userID:rating,...]这样的输出。参考ratings.dat文件的说明文件中说item有3952个记录，由这个job的输出结果来看只有3692条记录输出，说明training dataset中只含有3692个item。可以编写下面的测试文件来读取这个job的输出文件，看是否和设想一样：

package mahout.fansy.als.test;

import java.io.IOException;
import java.util.Map;

import org.apache.hadoop.io.Writable;

import mahout.fansy.utils.read.ReadArbiKV;

public class ReadItemRatings {

	/**
	 *  读取itemRatings Job的输出
	 * @param args
	 * @throws IOException 
	 */
	public static void main(String[] args) throws IOException {

		String path="hdfs://ubuntu:9000/user/mahout/temp/als/itemRatings/part-r-00000";
		Map<Writable, Writable>map=ReadArbiKV.readFromFile(path);
		System.out.println("read "+map.getClass().toString()+" done...");
	}

}

其中的ReadArbiKV类文件在前面的系列算法中有提到代码 Hadoop Writable深度复制及读取任意序列文件，这里就不多说了。
（2）第（1）个job的输出类似：<key,vlaue> --> <itemID,[userID:rating,userID,rating,...]> ，然后到了userRatings job，这个job的调用如下：

Job userRatings = prepareJob(pathToItemRatings(), pathToUserRatings(),
        TransposeMapper.class, IntWritable.class, VectorWritable.class, MergeVectorsReducer.class, IntWritable.class,
        VectorWritable.class);

输入是itemRatings job的输出，mapper是TransposeMapper，看这个mapper，其中的map函数源码如下：

protected void map(IntWritable r, VectorWritable v, Context ctx) throws IOException, InterruptedException {
  int row = r.get();
  Iterator<Vector.Element> it = v.get().iterateNonZero();
  while (it.hasNext()) {
   Vector.Element e = it.next();
   RandomAccessSparseVector tmp = new RandomAccessSparseVector(Integer.MAX_VALUE, 1);
   tmp.setQuick(row, e.get());
   r.set(e.index());
   ctx.write(r, new VectorWritable(tmp));
  }
 }

那么row就是itemID了，然后遍历value的值，输出是<userID,[itemID:rating]>，这个就是map的输出了，所以itemRatings job里面的一条记录就对应于这里的map的多条输出了。

看reducer，即MergeVectorsReducer，它的reduce函数更加简单：

public void reduce(WritableComparable<?> key, Iterable<VectorWritable> vectors, Context ctx)
      throws IOException, InterruptedException {
    ctx.write(key, VectorWritable.merge(vectors.iterator()));
  }

直接调用VectorWritable的merge方法，reducer把相同key的value集中起来，比如user1 :{[item1:rating1],[item2:rating2],...}然后merge方法的操作是：

public static VectorWritable merge(Iterator<VectorWritable> vectors) {
    Vector accumulator = vectors.next().get();
    while (vectors.hasNext()) {
      VectorWritable v = vectors.next();
      if (v != null) {
        Iterator<Vector.Element> nonZeroElements = v.get().iterateNonZero();
        while (nonZeroElements.hasNext()) {
          Vector.Element nonZeroElement = nonZeroElements.next();
          accumulator.setQuick(nonZeroElement.index(), nonZeroElement.get());
        }
      }
    }
    return new VectorWritable(accumulator);
  }

这里看到是把所有的item整合起来了，所以reducer的输出是 <key,value> --> <userID,[itemID:rating,itemID:rating,...]>，感觉这个和itemRatings job的输出差不多。

把前面读取itemRatings job输出的代码中的路径更改下就可以读取userRatings job的输出了，看是否和猜测的一样。这里通过terminal看到这个job的输出为6040条记录，和ratings.dat描述文件一样，dataset含有6040个用户。

（3）averageRatings job，这个任务的调用代码：

Job averageItemRatings = prepareJob(pathToItemRatings(), getTempPath("averageRatings"),
        AverageRatingMapper.class, IntWritable.class, VectorWritable.class, MergeVectorsReducer.class,
        IntWritable.class, VectorWritable.class);

这个job的输入文件同样是itemRatings job的输出，即输入文件的格式是：<key,vlaue> --> <itemID,[userID:rating,userID,rating,...]> 。看mapper，即AverageRatingMapper：

 protected void map(IntWritable r, VectorWritable v, Context ctx) throws IOException, InterruptedException {
      RunningAverage avg = new FullRunningAverage();
      Iterator<Vector.Element> elements = v.get().iterateNonZero();
      while (elements.hasNext()) {
        avg.addDatum(elements.next().get());
      }
      Vector vector = new RandomAccessSparseVector(Integer.MAX_VALUE, 1);
      vector.setQuick(r.get(), avg.getAverage());
      ctx.write(new IntWritable(0), new VectorWritable(vector));
    }
  }

首先，看write中可以都是0，那么可以肯定在reducer中的输入和输出都是一条记录而已，这个可以在对job的分析界面（50030）或者terminal中可以得到求证。这里看到的代码的意思是把某个itemid的全部user的评价ratings全部遍历一遍，然后求这些ratings的平均值，然后输出就是<key,value> --> <0,[itemID:averageRating]>这样的输出，这里有新的类RunningAverage 和FullRunningAverage，其实这两个类可以暂时不用管的，或者，算了打开看看吧：

public synchronized void addDatum(double datum) {
    if (++count == 1) {
      average = datum;
    } else {
      average = average * (count - 1) / count + datum / count;
    }
  }

可以看到addDatum方法就是算平均值的。然后就是reducer了，reducer还是那个MergeVectorReducer，那么reducer的输出就应该是<key,value> --> <0,[itemID:averageRating,itemID:averageRating,...]>。

接下里就是initializeM和for循环了，今天又晚了。总感觉假期效率低的没法说。。。

分享，成长，快乐

转载请注明blog地址：http://blog.csdn.net/fansy1990

Spring Boot Actuator 集成 Micrometer（官网文档解读）找了一圈尾巴 Spring 架构学习文档解读系列 spring boot java
目录概述实现Observation可观测性Observation功能核心类ObservationPredicateGlobalObservationConventionObservationFilterObservationHandlerObservationRegistryCustomizerObservation相关注解多线程处理机制配置上下文传播常用标签配置OpenTelemetry支持关闭
用engine引擎文件在Jetson上面进行推理（YOLOv8）薇憨深度学习-硬件篇 YOLO python pycharm 深度学习 pytorch 嵌入式硬件
1.pt文件，推理在Jetson上可以通过predict.py脚本用.pt权重文件进行推理脚本如下：importwarningswarnings.filterwarnings('ignore')fromultralyticsimportYOLOif__name__=='__main__':model=YOLO('/best.pt')#selectyourmodel.ptpathmodel.pred
通过TenSorRT转换后的engine引擎文件进行验证的脚本薇憨深度学习-硬件篇嵌入式硬件 mcu python
YOLOv8算法验证pt文件的精度脚本一般都很常见，工程项目里面一般会有importwarningswarnings.filterwarnings('ignore')fromultralyticsimportYOLOif__name__=='__main__':model=YOLO('/best.pt')#权重文件路径model.val(data='/data.yaml',#yaml文件路径spl
ReactNative0.76版本发布，默认开启新架构 wayne214 ReactNative 1024程序员节
今天，我们非常激动地发布了ReactNative0.76版本！这是ReactNative的一个重要里程碑，因为我们默认启用了新架构，并引入了ReactNativeDevTools。这是我们团队六年辛勤工作的成果，也得到了我们了不起的开发社区的支持。亮点默认启用ReactNative新架构ReactNativeDevTools更快的Metro分辨率BoxShadow和Filter样式属性重大变更移除
特征选择（机器学习）赵孝正机器学习算法机器学习人工智能
目录1.为什么需要特征选择2.常见的特征选择方法2.1过滤式（FilterMethods）小示例（用Python伪代码表达）：2.2包裹式（WrapperMethods）小示例（RFE伪代码示例）：2.3嵌入式（EmbeddedMethods）小示例（Lasso伪代码示例）：3.实践建议4.小结1.为什么需要特征选择在机器学习任务中，经常会遇到以下问题：特征（变量）数量过多，导致计算量大、训练速度
卡尔曼滤波记录 qq_30362711 优化与求解机器学习
参考这个：https://www.kalmanfilter.net/alphabeta.html。这个吊打其他一切教程
Java基础入门day55 zpz2001 java hive 开发语言
day55过滤器简介过滤器filter，是处于客户端与服务器端目标资源之间的一道过滤技术技术作用执行地位在servlet之前，客户发送请求时，会先经过Filter，再到达目标Servlet中。相应时，会根据执行流程再次反向执行Filter可以解决多个Servlet共性代码的冗余问题编写新增一个类，实现Filter接口编写其生命周期方法再doFilter当中实现过滤方法packagecom.saas
课前准备---多样本ATAC联合分析（封装版）追风少年ii 单细胞 ATAC 数据分析聚类
作者，EvilGenius大家好，我们的课程已经在进行中了，需要分享给大家很多的分析资料，大家好好学习，资料很珍贵，好好保存。ATAC的主流分析内容1）Readfilteringandalignment2）Barcodecounting3）Identificationoftransposasecutsites4）Detectionofaccessiblechromatinpeaks5）Cellca
SAP Odata実行命令(1) weixin_30628801
＄count＄Orderby:desc/asc※＄Orderby＝ソートする項目desc降順/asc昇順を指定すること＄Filter:＄Skip,TopandInlinecount:＄skip=2は2つのレコードをスキップし、＄top=5は最初の5つのレコードが表示されることを意味します。また、Inlinecountは以下のようにcountでデータを表示します。※注意：$inlinecount=a
Django之ORM之QuerySet API 小赖同学啊 python python django
all(): 查询所有结果filter(**kwargs) 它包含了与所给筛选条件相匹配的对象get(**kwargs): 返回与所给筛选条件相匹配的对象，返回结果有且只有一个，如果符合筛选条件的对象超过一个或者没有都会抛出错误。exclude(**kwargs) 它包含了与所给筛选条件不匹配的对象values(*field) 返回一个ValueQuer
logstash（自动拉取，过滤，推送日志的应用，也是elk架构中的l）长东737 elk 架构
elk是指elasticsearch，logstash，kibana三款软件搭配组成的架构logstash是一个数据采集加工处理以及传输的工具logstash类似于流水线，有三个模块，分辨是input>filter>output，input模块负责收集数据，filter负责处理数据，output负责输出数据logstash需要先保证web集群和ela集群运行正常才能搭建，运行logstash需要先
stream流-去重今天学点啥6 Java java 后端
针对基本数据类型集合publicclassDistinctDemo{ publicstaticvoidmain(String[]args){ ArrayListusers=newArrayListSystem.out.println(u)); }}针对对象集合根据对象中的某一个成员变量进行去重使用filter根据集合中对象的某个成员变量进行去重publicclassDis
doris:异常数据处理向阳1218 大数据 doris
在导入过程中，源数据列与目标列的数据类型可能存在不一致的情况。导入过程会对这些类型不一致的数据进行转换，但在转换过程中可能会出现字段类型不匹配、字段超长、精度不匹配等问题，从而导致转换失败。为了处理这些异常情况，Doris提供了两个重要的控制参数：严格模式(strict_mode)：用于控制是否过滤转换失败的数据行。最大过滤比例(max_filter_ratio)：用于设置可容忍的异常数据所占总数
ESP32-CAM导入ino项目编译和烧录 Android小码家 Linux ESP32
文章目录ESP32Cam模式接线图导入ino项目选择INO打开目录结构手动转换成C++源代码编译效果图搞猛一点其他实验ESP32Cam模式接线图导入ino项目选择INO打开目录结构platformio.ini;PlatformIOProjectConfigurationFile;;Buildoptions:buildflags,sourcefilter;Uploadoptions:customup
C# PDF操作之-PDF转EXCEL Diamond 、 C#C#PDF PDF转EXCEL PDF操作
特别说明：需引用Aspose.PDF.dll代码案例：OpenFileDialogopenFileDialog1=newOpenFileDialog();//显示选择文件对话框openFileDialog1.Filter="Allfiles(*.*)|*.*|pdffiles(*.pdf)|*.pdf";openFileDialog1.FilterIndex=2;openFileDialog1.R
ESP32-CAM实验集(WebServer) Android小码家 Linux ESP32
WebServer效果图已连接web端platformio.ini;PlatformIOProjectConfigurationFile;;Buildoptions:buildflags,sourcefilter;Uploadoptions:customuploadport,speedandextraflags;Libraryoptions:dependencies,extralibrarysto
Solon Cloud Gateway 开发：熟悉 ExContext 及相关接口组合缺一 Solon Java Framework gateway solon java 后端
分布式网关的主要工作是路由及数据交换，在定义时，会经常用到：接口说明RouteFilterFactory路由过滤器工厂RoutePredicateFactory路由检测器工厂CloudGatewayFilter分布式网关过滤器ExFilter交换过滤器ExPredicate交换检测器ExContext交换上下文ExFilter应用场景CloudGatewayFilterextendsExFilte
Python 日志记录工具logging 酒酿小圆子～ Python python 运维
文章目录1.日志的作用2.日志的级别3.几个重要的概念3.1Logger记录器3.2Handler处理器3.3Formatter格式化器3.4Filter过滤器4.常见示例4.1常见示例1：Logging日志记录4.2常见示例2：函数化示例(避免重复日志)4.3多进程环境下往同一个文件写日志日志对于系统开发的开发、调试和运行整个过程中都起着很重要的作用，调试阶段需要查看日志来明确问题所在，运行阶段
日志收集Day006 ccnnlxc 运维
1.logstash的多分支案例:input{beats{port=>8888type=>"beats"}tcp{port=>9999type=>"tcp"}http{type=>"http"}}filter{if[type]=="beats"{grok{match=>{"message"=>"%{HTTPD_COMBINEDLOG}"}remove_field=>["agent","log","
Openwrt路由搭建pptp-server操作说明 wellnw Openwrt openwrt
ssh登录到路由后台使用putty或者SecureCRT软件安装PPTP软件包opkgupdateopkginstallpptpdkmod-nf-nathelper-extrakmod-mppe防火配置#Configurekernelparameterscat>/etc/sysctl.confnet.netfilter.nf_conntrack_helper=1EOF/etc/init.d/sys
python 中的 logging 详解 SATAN 先生 python python 开发语言
文章目录1.Abstract2.logging模块结构3.Logger的层次结构和命名规则3.1RootLogger3.2层次结构和命名规则3.2.1层次结构和命名规则3.2.2Logger的工厂机制4.Logger和Handler的过滤机制：Level和Filter5.emit：格式化与输出流6.配置basicConfig，logging.config.fileConfig…；6.1`basic
Linux内核漏洞CVE-2024-1086的风险评估与修复方法博览文库 linux 运维
CVE-2024-1086是一个Linux内核的权限提升漏洞，该漏洞源于netfilter组件中的nf_tables部分。具体来说，这个漏洞允许本地攻击者利用特定的操作来触发双重释放，从而将普通用户权限提升至root权限。因此，该漏洞的风险等级被评定为中等，CVSS3.1评分为7.0。**漏洞发现时间**：该漏洞于**2024年3月28日**被公开披露，并在互联网上出现了相关的概念验证（PoC）和
struts2 工布之者 struts struts
s2的工作原理（图解）详解Struts2的工作原理上图来源于Struts2官方站点，是Struts2的整体结构。一个请求在Struts2框架中的处理大概分为以下几个步骤1客户端初始化一个指向Servlet容器（例如Tomcat）的请求2这个请求经过一系列的过滤器（Filter）（这些过滤器中有一个叫做ActionContextCleanUp的可选过滤器，这个过滤器对于Struts2和其他框架的集成
struts2详解 dyy_gusi webMVC struts
1.搭建struts2运行环境：1.1找到所需要的jar包struts2-core-xwork-core-ognl-freemarker-commons-logging-commons-fileupload-1.2编写struts2的配置文件*.jsp1.3在web.xml中加入struts2的启动配置struts2org.apache.struts2.dispatcher.ng.filter.S
《spring编程常见错误50例》学习笔记 Day1 qq_31273845 学习 spring
1.为什么有时候我们代码移了一下包，就扫描不到了？在构建web服务的时候，我们启动服务程度如果不设置扫描包的话，默认会扫描运行程序所在的包。如果包和应用程序不在同一个包，就会失效。这个之前知道，至于为什么？今天才了解到，我就这里复述一下：@SpringBootApplication里面会有@ComponentScan注解。参考配置如下@ComponentScan(excludeFilters={@
分表数据通过canal同步数据 javacanal数据同步
项目使用的canal版本：1.1.4，使用rocketMQ进行消费之前项目中一直是单库单表进行数据同步，后面遇到分表数据也需要进行同步，数据表是用户登录数据：user_login_info_0、user_login_info_1...共分了10张表，但不想配置多个表与topic，想有一种正则的写法只配置一个就行，需要重点关注canal.instance.filter.regex与canal.mq.
12、数据系统内置功能（字符串、数组、时间、Math、遍历器、对象成员检测、Object静态方法、对象序列化、正则表达式）爱喝牛奶~ javascript 开发语言 ecmascript
目录12.1字符串12.1.1特效标签12.1.2字符串截子串12.2数组12.3时间12.4Math12.5遍历器1、for循环2、forin循环（es5的技术）3、while循环4、do-while循环5、ArrayforEach循环6、Arraymap()方法7、Arrayfilter()方法8、Arraysome()方法10、Arrayreduce()方法11、ArrayreduceRig
css粒子效果 HainesFreeman css 前端 html
htmlcss:body{height:100vh;background:radial-gradient(ellipseatbottom,#1b27350%,#090a0f100%);overflow:hidden;filter:drop-shadow(0010pxwhite);}@functionrandom_range($min,$max){$rand:random();$random_ran
【JavaScript】forEach 遍历数组详解 Peter-Lu #JavaScript javascript 开发语言 ecmascript 前端
文章目录一、forEach方法概述1.forEach方法简介2.语法结构3.forEach方法的特性二、forEach方法的基本用法1.遍历数组元素2.使用索引3.访问原数组三、forEach方法的实际应用1.修改DOM元素2.累加数组元素3.异步操作四、forEach方法的优缺点1.优点2.缺点五、forEach与其他遍历方法的对比1.for循环2.map方法3.filter方法六、注意事项1.
AD域管理PowerShell常用命令总结运维
一、GET-ADUser在AD域管理中的应用总结GET-ADUser：获取指定的用户对象或进行搜索，以获取多个用户对象。1.获取dc中所有的用户,导出为csv格式并保存到指定的路径下举例：Get-ADUser-filter*|export-csv保存路径-Encodingutf82.获取某一用户的所有AD属性，导出为csv格式并保存到指定的路径下.举例：Get-ADUser-Identity用户名
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

mahout算法源码分析之Collaborative Filtering with ALS-WR （二）splitDataset 和parallelALS

你可能感兴趣的:(filter)