fansy1990

Mahout基于项目的协同过滤算法源码分析（5）--推荐

Mahout版本：0.7，hadoop版本：1.0.4，jdk：1.7.0_25 64bit。

接上篇，本篇分析该算法的最后一个job。

在上篇计算共生矩阵的乘积后，接下来又到了一个shouldRunNextPhase的方法了，这个方法里面含有三个prepareJob，但是本次只分析一个，为啥？因为在实战中没有设置filterFile，这里其实是可以设置filterFile的，设置这个参数的作用是什么，用源码中的英文解释就是过滤掉不不关心的用户，那我就会产生疑问了，在上个计算共生矩阵乘积的时候明明是可以设置一个文件，用于过滤掉我们不关心的用户了，这里还要过滤？所以这里不是很明白源码设计的思路。但是，这里是分析算法的，关于过滤，其实也可以这样说，把全部结果分析出来后，然后再进行过滤，全部结果的分析就是算法的大概，而后面进行过滤可做可不做（这种做法和原来设计的还是有点不同的，效率不一样，如果可以在前期过滤掉一些数据，那么后面的计算会加快）。整个系列blog都是分析算法，所以过滤这一块暂时不关心。

这里可以看到是有三个job调用的：

if (filterFile != null) {
        Job itemFiltering = prepareJob(new Path(filterFile), explicitFilterPath, TextInputFormat.class,
                ItemFilterMapper.class, VarLongWritable.class, VarLongWritable.class,
                ItemFilterAsVectorAndPrefsReducer.class, VarIntWritable.class, VectorAndPrefsWritable.class,
                SequenceFileOutputFormat.class);

//extract out the recommendations
      Job aggregateAndRecommend = prepareJob(
              new Path(aggregateAndRecommendInput), outputPath, SequenceFileInputFormat.class,
              PartialMultiplyMapper.class, VarLongWritable.class, PrefAndSimilarityColumnWritable.class,
              AggregateAndRecommendReducer.class, VarLongWritable.class, RecommendedItemsWritable.class,
              TextOutputFormat.class);

if (filterFile != null) {
        setS3SafeCombinedInputPath(aggregateAndRecommend, getTempPath(), partialMultiplyPath, explicitFilterPath);
      }
      setIOSort(aggregateAndRecommend);
      aggregateAndRecommendConf.set(AggregateAndRecommendReducer.ITEMID_INDEX_PATH,
              new Path(prepPath, PreparePreferenceMatrixJob.ITEMID_INDEX).toString());
      aggregateAndRecommendConf.setInt(AggregateAndRecommendReducer.NUM_RECOMMENDATIONS, numRecommendations);
      aggregateAndRecommendConf.setBoolean(BOOLEAN_DATA, booleanData);
      boolean succeeded = aggregateAndRecommend.waitForCompletion(true);

由于filterFile是null，所以这里只考虑第二个job，即aggregateAndRecommend。

这个job是有mapper和reducer的，下面一个个分析：

首先来看下这个job的输入文件，输入文件就是前面计算共生矩阵的输出，如下：

{102={106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181}	[5, 1, 2]	[3.0, 3.0, 2.5], 
103={106:0.14243397116661072,105:0.11208890378475189,104:0.140376016497612,103:NaN,102:0.19754962623119354,101:0.15548737347126007}	[4, 1, 2, 5]	[3.0, 2.5, 5.0, 2.0], 
101={107:0.10275248438119888,106:0.14243397116661072,105:0.11584573984146118,104:0.1601526141166687,103:0.15548737347126007,102:0.14201472699642181,101:NaN}	[5, 1, 4, 2, 3]	[4.0, 5.0, 5.0, 2.0, 2.5], 
106={106:NaN,105:0.14201472699642181,104:0.1818181872367859,103:0.14243397116661072,102:0.1497250646352768,101:0.14243397116661072}	[4, 5]	[4.0, 4.0],
107={101:0.10275248438119888,107:NaN,105:0.22048120200634003,104:0.13472338020801544}	[3]	[5.0], 
104={107:0.13472338020801544,106:0.1818181872367859,105:0.16736577451229095,104:NaN,103:0.140376016497612,102:0.12789210677146912,101:0.1601526141166687}	[4, 2, 5, 3]	[4.5, 2.0, 4.0, 4.0], 
105={107:0.22048120200634003,106:0.14201472699642181,105:NaN,104:0.16736577451229095,103:0.11208890378475189,102:0.14328432083129883,101:0.11584573984146118}	[5, 3]	[3.5, 4.5]}

（1）mapper：//PartialMultiplyMapper

（1.1）map：

 protected void map(VarIntWritable key,
                     VectorAndPrefsWritable vectorAndPrefsWritable,
                     Context context) throws IOException, InterruptedException {

    Vector similarityMatrixColumn = vectorAndPrefsWritable.getVector();
    List<Long> userIDs = vectorAndPrefsWritable.getUserIDs();
    List<Float> prefValues = vectorAndPrefsWritable.getValues();

    VarLongWritable userIDWritable = new VarLongWritable();
    PrefAndSimilarityColumnWritable prefAndSimilarityColumn = new PrefAndSimilarityColumnWritable();

    for (int i = 0; i < userIDs.size(); i++) {
      long userID = userIDs.get(i);
      float prefValue = prefValues.get(i);
      if (!Float.isNaN(prefValue)) {
        prefAndSimilarityColumn.set(prefValue, similarityMatrixColumn);
        userIDWritable.set(userID);
        context.write(userIDWritable, prefAndSimilarityColumn);
      }
    }
  }

首先初始化三个变量，分别获得输入的三个值，然后for循环输出，这里可以看到是以userid来进行输出的，比如针对这样的一条输入： {102={106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181} [5, 1, 2] [3.0, 3.0, 2.5],

那么，其输出应该是<key,value> --> <5,[3.0,[{102={106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181} [5, 1, 2] [3.0, 3.0, 2.5], ]]> 、<1,[3.0,[{102={106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181} [5, 1, 2] [3.0, 3.0, 2.5], ]]> 、<2,[2.5,[{102={106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181} [5, 1, 2] [3.0, 3.0, 2.5], ]]> ，即userIDs中有多少个用户就输出多少条记录。输出格式是：<key,value> --> <userID,[prefValue,[itemid:simi,itemid:simi,...]]> 。

（2）reducer：//AggregateAndRecommendReducer

（2.1）setup：

在setup中初始化了四个变量，recommendationsPerUser，这个在实战中设置的是3；booleanData，这个设置的是false；indexItemIDMap这个是读取ITEMID_INDEX，即第一个job的输出了，即VarIntWritable和VarLongWritable的映射；itemsToRecommendFor，这个是要设置一个itemFile的文件的，由于在实战中没有进行设置，所以这个itemsToRecommendFor就是为null了。
（2.2）reduce：

protected void reduce(VarLongWritable userID,
                        Iterable<PrefAndSimilarityColumnWritable> values,
                        Context context) throws IOException, InterruptedException {
    if (booleanData) {
      reduceBooleanData(userID, values, context);
    } else {
      reduceNonBooleanData(userID, values, context);
    }
  }

这个reduce超简单，但是其实他是调用函数而已，由于booleanData是false，所以调用的是reduceNonBooleanData函数：

private void reduceNonBooleanData(VarLongWritable userID,
                        Iterable<PrefAndSimilarityColumnWritable> values,
                        Context context) throws IOException, InterruptedException {
    /* each entry here is the sum in the numerator of the prediction formula */
    Vector numerators = null;
    /* each entry here is the sum in the denominator of the prediction formula */
    Vector denominators = null;
    /* each entry here is the number of similar items used in the prediction formula */
    Vector numberOfSimilarItemsUsed = new RandomAccessSparseVector(Integer.MAX_VALUE, 100);

    for (PrefAndSimilarityColumnWritable prefAndSimilarityColumn : values) {
      Vector simColumn = prefAndSimilarityColumn.getSimilarityColumn();
      float prefValue = prefAndSimilarityColumn.getPrefValue();
      /* count the number of items used for each prediction */
      Iterator<Vector.Element> usedItemsIterator = simColumn.iterateNonZero();
      while (usedItemsIterator.hasNext()) {
        int itemIDIndex = usedItemsIterator.next().index();
        numberOfSimilarItemsUsed.setQuick(itemIDIndex, numberOfSimilarItemsUsed.getQuick(itemIDIndex) + 1);
      }

      numerators = numerators == null
          ? prefValue == BOOLEAN_PREF_VALUE ? simColumn.clone() : simColumn.times(prefValue)
          : numerators.plus(prefValue == BOOLEAN_PREF_VALUE ? simColumn : simColumn.times(prefValue));

      simColumn.assign(ABSOLUTE_VALUES);
      denominators = denominators == null ? simColumn : denominators.plus(simColumn);
    }

    if (numerators == null) {
      return;
    }

    Vector recommendationVector = new RandomAccessSparseVector(Integer.MAX_VALUE, 100);
    Iterator<Vector.Element> iterator = numerators.iterateNonZero();
    while (iterator.hasNext()) {
      Vector.Element element = iterator.next();
      int itemIDIndex = element.index();
      /* preference estimations must be based on at least 2 datapoints */
      if (numberOfSimilarItemsUsed.getQuick(itemIDIndex) > 1) {
        /* compute normalized prediction */
        double prediction = element.get() / denominators.getQuick(itemIDIndex);
        recommendationVector.setQuick(itemIDIndex, prediction);
      }
    }
    writeRecommendedItems(userID, recommendationVector, context);
  }

这个函数好长呀，要一点点看才行。在前面已经分析其map输出的结果了，这里整合一下，因为在reducer中是把相同的key整合起来的，所以，这里也把相同的key放在一起，方便reducer的分析，这个mapper输出主要是通过log信息打印出来（其实直接分析就可以的，这里图省事，直接设置log进行打印而已）：

上面的图中的

userIDWritable:5,prefAndSimilarityColumn:org.apache.mahout.cf.taste.hadoop.item.PrefAndSimilarityColumnWritable@5cb2666c

类似这样的就是最后map的输出结果了，这个结果怎么解读？首先key就是userIDWritable了，后面就是实际值；后面的prefAndSimilarityColumn打印的是一个地址，同时看到不同的用户id输出的地址竟然是一样的？比如针对第一条输出（即上面的输出），其输出其实应该是<key,value> -->

<5,[4.0,[107:0.10275248438119888,106:0.14243397116661072,105:0.11584573984146118,104:0.1601526141166687,103:0.15548737347126007,102:0.14201472699642181,101:NaN]]>

而第二条的输出其实是：<key,value> -->

<1,[5.0,[107:0.10275248438119888,106:0.14243397116661072,105:0.11584573984146118,104:0.1601526141166687,103:0.15548737347126007,102:0.14201472699642181,101:NaN]]>

通过上面的两条比较发现其实value只有prefValue的值不一样而已，但是为什么地址居然是一样的呢？这个是因为prefAndSimilarityColumn变量是在for循环外面定义好了，所以其地址不会变，同时因为每条数据设置值后直接写入了文件中，不存在后面设置的值会覆盖前面值的情况；整合后的map输出如下所示（只列出了用户1和2的数据）：

1:
{[3.0,[106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181]],
[2.5,[106:0.14243397116661072,105:0.11208890378475189,104:0.140376016497612,103:NaN,102:0.19754962623119354,101:0.15548737347126007]],
[5.0,[107:0.10275248438119888,106:0.14243397116661072,105:0.11584573984146118,104:0.1601526141166687,103:0.15548737347126007,102:0.14201472699642181,101:NaN]]
}
2:
{[2.5,[106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181]],
[5.0,[106:0.14243397116661072,105:0.11208890378475189,104:0.140376016497612,103:NaN,102:0.19754962623119354,101:0.15548737347126007]],
[2.0,[107:0.10275248438119888,106:0.14243397116661072,105:0.11584573984146118,104:0.1601526141166687,103:0.15548737347126007,102:0.14201472699642181,101:NaN]],
[2.0,[107:0.13472338020801544,106:0.1818181872367859,105:0.16736577451229095,104:NaN,103:0.140376016497612,102:0.12789210677146912,101:0.1601526141166687]],
}

那么就针对用户1 的数据来进行reduceNonBooleanData的分析吧：

首先初始化三个向量，然后进行for循环，for循环遍历输入的values，这个values就是上面1后面大括号里面的内容，使用foreach进行遍历，首先prefAndSimilarityColumn遍历就会被赋值为[3.0,[106:0.1497250646352768,105:0.14328432083129883,104:0.12789210677146912,103:0.19754962623119354,102:NaN,101:0.14201472699642181]]，然后针对上面的变量取出前面的prefValue和后面的similarityVector分别赋值给prefValue、simColumn，看while循环是干嘛的：

Iterator<Vector.Element> usedItemsIterator = simColumn.iterateNonZero();
		      while (usedItemsIterator.hasNext()) {
		        int itemIDIndex = usedItemsIterator.next().index();
		        numberOfSimilarItemsUsed.setQuick(itemIDIndex, numberOfSimilarItemsUsed.getQuick(itemIDIndex) + 1);
		      }

其实就是遍历1后面大括号中的全部similarityVector，如果项目出现一次那么就把numberOfSimilarItemsUsed中相应的项赋值为1次，所以变量numberOfSimilarItemsUsed最后（这里最后是指遍历完用户1的所有values）就会变为下面的样子[107:1.0,106:3.0,105:3.0,104:3.0,103:3.0,102:3.0,101:3.0]，因为107出现了一次，所以107对应的位置就设置为1，其他依次类推。

接着是：

numerators = numerators == null
		          ? prefValue == BOOLEAN_PREF_VALUE ? simColumn.clone() : simColumn.times(prefValue)
		          : numerators.plus(prefValue == BOOLEAN_PREF_VALUE ? simColumn : simColumn.times(prefValue));
	
		      simColumn.assign(ABSOLUTE_VALUES);
		      denominators = denominators == null ? simColumn : denominators.plus(simColumn);

三目？好吧，还是两个三目一起用！！！晕。刚开始numerators肯定是null的，那么numerators就会等于prefValue == BOOLEAN_PREF_VALUE ? simColumn.clone() : simColumn.times(prefValue)，这个又是一个三目，由于preValue不等于BOOLEAN_PREF_VALUE （等于1.0），所以numerators就等于simColumn.times(prefValue)（其实，这里不用三目吧，如果preValue等于1.0，那么simCoumn.clone()和simColumn.times(prefValue)不是相等的么？），然后等到第二次（即遍历用户1的values中的第二个value值时）numerator就会等于numerators.plus(prefValue == BOOLEAN_PREF_VALUE ? simColumn : simColumn.times(prefValue));，然后preValue又是不等于1.0，所以numerator就会等于原始值加上simColumn.times(preValue)的值，所以当这两个三目运算的作用就是：把每个value中的simi乘以prefValue然后相加。

接着是simColumn.assign(ABSOLUTE_VALUES);，额，好吧，说实话，这个我的确是不知道这个是啥意思，感觉也没啥作用的，并没有对simColumn进行任何的操作，这行代码运行前后simColumn的值并没有改变。

然后就是denominators了，这个也是一个三目，其实前面的两个三目分析后，这个就是小儿科了，这个的意思即是遍历用户1的values然后使用simi乘以prefValue的值全部相加即是变量denominators的值了。

然后for循环就结束了，接下来判断下numerators是否是null，如果是的话直接返回，即说明这个用户没有推荐的项目了，如果不为null，那么就是有推荐的项目，但是要做些处理才能输出，比如把得分最大的输出在第一个等等操作。

接下来的while循环就是求得分的算法了，主要是使用numerators除以denominators中对应的项，得到的值即是每个项目的得分了，但是这里还要使用前面的numberOfSimilarItemsUsed向量进行过滤，如果次数没有大于1，那么这个项目不用计算得分，那就是说这个项目不用输出了，根据上面的数据，用户1的输出如下：

106:3.491611584457462,105:3.4731628623748563,104:3.583812122426105,103:NaN,102:NaN,101:NaN}

其中numerators如下：

107:0.5137624219059944,106:1.5174299776554108,105:1.2893039211630821,104:1.5353794321417809,103:NaN,102:NaN,101:NaN

denominators如下：

107:0.10275248438119888,106:0.43459300696849823,105:0.3712189644575119,104:0.4284207373857498,103:NaN,102:NaN,101:NaN

这里可以看到NaN/NaN =NaN。

然后就是调用函数writeRecommendedItems进行输出了，看这个函数：

private void writeRecommendedItems(VarLongWritable userID, Vector recommendationVector, Context context)
      throws IOException, InterruptedException {

    TopK<RecommendedItem> topKItems = new TopK<RecommendedItem>(recommendationsPerUser, BY_PREFERENCE_VALUE);

    Iterator<Vector.Element> recommendationVectorIterator = recommendationVector.iterateNonZero();
    while (recommendationVectorIterator.hasNext()) {
      Vector.Element element = recommendationVectorIterator.next();
      int index = element.index();
      long itemID;
      if (indexItemIDMap != null && !indexItemIDMap.isEmpty()) {
        itemID = indexItemIDMap.get(index);
      } else { //we don't have any mappings, so just use the original
        itemID = index;
      }
      if (itemsToRecommendFor == null || itemsToRecommendFor.contains(itemID)) {
        float value = (float) element.get();
        if (!Float.isNaN(value)) {
          topKItems.offer(new GenericRecommendedItem(itemID, value));
        }
      }
    }

    if (!topKItems.isEmpty()) {
      context.write(userID, new RecommendedItemsWritable(topKItems.retrieve()));
    }
  }

代码首先定义了一个变量TopKItems，这个变量的输入参数有两个，一个是推荐的用户个数，还有一个是一个Comparator，如下定义：

private static final Comparator<RecommendedItem> BY_PREFERENCE_VALUE =
      new Comparator<RecommendedItem>() {
        @Override
        public int compare(RecommendedItem one, RecommendedItem two) {
          return Floats.compare(one.getValue(), two.getValue());
        }
      };

看到这个Comparator比的是value值，那么就可以想象，比如现在有一对值(项目和得分值)<102,3.3>、<103,3.5>，那么<103,3.5>就应该排在前面了；

看while循环里面就是把前面得到的得分向量加入TopKItems中，每次使用offer函数进行加入，offer函数：

public void offer(T item) {
    if (queue.size() < k) {
      queue.add(item);
    } else if (queueingComparator.compare(item, queue.peek()) > 0) {
      queue.add(item);
      queue.poll();
    }
  }

这里offer函数应该只是把它们加入而已吧，看这些加入后的topKItems变量值：

[RecommendedItem[item:105, value:3.473163], RecommendedItem[item:106, value:3.4916115], RecommendedItem[item:104, value:3.5838122]]

当user为2时，这个变量值是：

RecommendedItem[item:107, value:2.0], RecommendedItem[item:106, value:2.8146582], RecommendedItem[item:105, value:2.7573717]

从上面两个分析可以看到，这个应该是没有顺序的，只是加入了而已。

然后最后输出的时候使用了retrieve函数，看这个函数：

 public List<T> retrieve() {
    List<T> topItems = Lists.newArrayList(queue);
    Collections.sort(topItems, sortingComparator);
    return topItems;
  }

额，好吧，这个在最后才进行排序然后输出了，输出的具体值如下（含用户1和2）：

1=[104:3.5838122,106:3.4916115,105:3.473163], 
2=[106:2.8146582,105:2.7573717,107:2.0]

可以看到这个已经是排过序的了，到这里全部的mahout源码基本分析完毕，下篇应该来一篇整体的数据流程才行，使用excel做一个表格上面写上公式，这样应该会便于理解这个算法。

分享，成长，快乐

转载请注明blog地址：http://blog.csdn.net/fansy1990

网络协议——TCP/IP、socket、http 堃776 大数据
七层网络模型重点：TCP/UDP——传输层、IP——网络层、HTTP——应用层、socket——会话层**一、TCP/IP（传输层）“三次握手”“四次挥手”TCP/IP将七层网络模型归类到四个抽象层：应用层、传输层、网络层、数据链路层TCP(TransmissionControlProtocol，传输控制协议)是一种面向连接的、可靠的、基于字节流的通信协议，数据在传输前要建立连接，传输完毕后还要断
计算机毕业设计：基于python房产数据分析可视化大屏可视化 Django框架安居客二手房数据商品房✅ 源码之家 bysjbysj biyesheji0005 biyesheji0001 python 课程设计数据分析 django 商品房毕业设计可视化
博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久，选择我们就是选择放心、选择安心毕业✌>想要获取完整文章或者源码，或者代做，拉到文章底部即可与我联系了。点击查看作者主页，了解更多项目！感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。1、毕业设计：2025年
基于Flask实现的多语言Hello World 老大白菜 python flask python 后端
简介在这篇文章中，我们将探讨如何使用Flask框架创建一个智能的多语言HelloWorld服务器。这个服务器能够自动检测访问者的浏览器语言设置，并返回相应语言版本的"HelloWorld"问候语，支持超过20种世界主要语言。技术栈Python3.xFlask框架HTTP请求头处理Unicode字符串处理核心功能自动语言检测多语言支持（支持20种主要语言）优雅的降级处理（默认使用英语）支持区域特定的
基于JavaWeb开发的Java+SpringBoot+vue+element实现前后端分离玩具商城系统网顺技术团队成品程序项目 spring boot 开发语言课程设计 java vue.js
基于JavaWeb开发的Java+SpringBoot+vue+element实现前后端分离玩具商城系统作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章
YashanDB安装前依赖项准备数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E5%AE%89%E8%A3%85%...#依赖项准备为保障YashanDB的正常安装和运行，请按如下来源及最低版本要求，在所有服务器环境中配置所需依赖项：动态库名称来源版本要求作用libcrypto.so.1.1openssl1.1.1加密libssl.soopen
URI 未注册(设置 | 语言和框架 | 架构和 DTD) 我去2001 java 前端 tomcat
一、问题描述：在springboot项目中的resources中新建mybatis-config.xml文件时，从mybatis文档中复制的代码报错：URI未注册(设置|语言和框架|架构和DTD)二、解决：在Springboot项目的设置->架构和DTD中添加红色的网址（http://mybatis.org/dtd/mybatis-3-config.dtd）
build.gradle文件generateProtoTasks含义天若子 android
在Android项目的build.gradle文件中，generateProtoTasks通常与使用ProtocolBuffers（Protobuf）进行代码生成相关，下面为你详细解释其含义和作用。整体背景ProtocolBuffers是一种用于序列化结构化数据的高效机制，在Android和Java项目中，我们通常会定义.proto文件来描述数据结构，然后使用Protobuf编译器根据这些.pro
如何在React.js中使用Shadcn/UI
如何在React.js中使用Shadcn/UI学习如何在React.js中使用Shadcn/UI构建可自定义且轻量的界面。了解如何将其与Apipost集成，以实现高效的API管理和测试。非常适合希望提升React.js项目的开发者！使用Shadcn/UI构建现代化界面创建简洁的用户界面是前端开发者的主要目标之一。随着组件库的兴起，这一任务变得更加简化。今天，我们将深入探讨Shadcn/UI，这是一
easyUI 猪大爷爱你 easyui 前端 javascript
一.easyUI的简介easyui是一款基于jQuery的前端框架，可以使用其中的组件进行布局以及用来做后台的管理界面。EasyUI是一个前端开发的框架，其将常用的页面开发使用的组件进行了封装，前端开发人员只需将EasyUI的资源导入项目后使用即可，快速提升开发效率。使用：①导入EasyUI的资源②查阅API文档使用EasyUI的组件完成页面开发二.easyUI的不足之处现在据了解到有三种UI框架
安当全栈式PostgreSQL数据库安全解决方案：透明加密、动态凭据与勒索防护一体化实践安当加密 postgresql 区块链数据库
引言：数字化转型下的数据库安全挑战随着PostgreSQL在企业核心业务中的广泛应用，其承载的敏感数据价值日益攀升。然而，近年来针对数据库的攻击事件频发，如SQL注入漏洞（CVE-2025-1094）、勒索病毒攻击、内部越权操作等，直接威胁企业数据资产安全。传统安全方案存在三大痛点：加密改造成本高、账号管理粗放、勒索防护滞后。安当基于多年技术沉淀，推出覆盖数据全生命周期的PostgreSQL安全解
PMP认证考试攻略，让你一次通过！
PMP（ProjectManagementProfessional）认证是全球公认的项目管理领域的权威认证，证明了你在项目管理方面的专业知识和能力。想要顺利通过PMP考试，需要系统的备考计划和方法。以下是一些实用的PMP认证考试攻略，帮助你提高通过考试的成功率：1.了解考试大纲与知识体系PMP考试基于《PMBOK（项目管理知识体系指南）》和其他相关的项目管理标准。考试内容涵盖了以下5个过程组和10
SOFABoot 4.0 正式发布，多项新特性等你来体验！
Part.1「亿点点」新特性基于Java17SOFABoot4.0依赖Java17作为最小支持的JDK版本。如果你的应用目前使用Java8或11，你需要先将自己的JDK版本升级到17才能基于SOFABoot4.0进行开发。二方库升级SOFABoot4.0基于SpringBoot3.0与SpringFramework6构建。在SpringBoot3.0与SpringFramework6引入的二方库升
MOSN 基于延迟负载均衡算法——走得更快，期待走得更稳 go网关负载均衡延迟加载开源
文｜纪卓志（GitHubID：jizhuozhi)京东高级开发工程师MOSN项目Committer专注于云原生网关研发的相关工作，长期投入在负载均衡和流量控制领域前言这篇文章主要是介绍MOSN在v1.5.0中新引入的基于延迟的负载均衡算法#2253。首先会对分布式系统中延迟出现的原因进行剖析，之后介绍MOSN都通过哪些方法来降低延迟，最后构建与生产环境性能分布相近的测试用例来对算法进行验证。在开始
详解tomcat中的jmx监控 web15117360223 面试学习路线阿里巴巴 tomcat java
目录1.概述2.如何开启tomcat的JMX3.tomcat如何实现JMX的源码分析1.概述本文是博主JAVA监控技术系列文章的第二篇，前面一篇文章中我们介绍了JAVA监控技术的基石——jmx：【JMX】JAVA监控的基石-CSDN博客本文我们将从使用和源码实现两个方面聊一下jmx的落地实现范例——tomcat中的jmx。tomcat作为一个webserver，其选用jmx来实现监控功能。之所以选
从cURL到GraphQL：不同API类型概述
从cURL到GraphQL：不同API类型概述API（应用程序编程接口）是现代软件开发的支柱，能够使不同的应用程序进行通信、共享数据并无缝执行任务。了解各种API类型及其实际应用可以为开发人员提供宝贵的见解。本文将探讨不同的API类型、它们的重要性，并通过实际示例说明它们的应用。API类型1.基于cURL的交互虽然cURL不是一种API类型，但它是与API交互的强大工具。cURL（客户端URL）是
教你如何在Java中操作Redis Jacky-YY Redis java redis 开发语言
Redis的Java客户端Redis的Java客户端很多，常用的几种：Jedis：基于Java的Redis客户端，提供了Redis命令的全面支持。Lettuce：高性能的Java客户端库，用于与Redis数据库进行交互。它支持同步、异步和反应式编程模型，提供了丰富的API来操作Redis。Lettuce与Jedis并列成为最热门的RedisJava客户端之一，并且已经成为SpringBoot2.0
2025年广东省职业院校技能大赛高职组“软件测试”赛项—测试计划模板旺仔Sec 高职组软件测试技能竞赛公开试题功能测试单元测试自动化测试性能测试
2025年广东省职业院校技能大赛高职组“软件测试”赛项—测试计划模板文章目录2025年广东省职业院校技能大赛高职组“软件测试”赛项—测试计划模板教务管理系统测试计划1.概述2.测试任务3.测试资源4.功能分解5.测试安排6.相关风险需要教务管理系统测试计划及测试报告参阅答案可联系我！需要教务管理系统测试计划及测试报告参阅答案可联系我！教务管理系统测试计划1.概述1.1.编写目的【说明编写本测试计划
redis基础知识整理以及案例分析小鹿的周先生
redis基础知识整理以及案例分析1.redis1.概念2.下载安装3.命令操作1.数据结构4.持久化操作5.使用Java客户端操作redisRedis1.概念：redis是一款高性能的NOSQL系列的非关系型数据库1.1.什么是NOSQLNoSQL(NoSQL=NotOnlySQL)，意即“不仅仅是SQL”，是一项全新的数据库理念，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关
Torch-MLIR 项目使用教程穆声淼Germaine
Torch-MLIR项目使用教程torch-mlirTheTorch-MLIRprojectaimstoprovidefirstclasssupportfromthePyTorchecosystemtotheMLIRecosystem.项目地址:https://gitcode.com/gh_mirrors/to/torch-mlir1.项目目录结构及介绍Torch-MLIR项目的目录结构遵循典型的
软件测试之Selenium自动化测试实战测试秃头怪 python 软件测试自动化测试测试工具 selenium 单元测试测试用例
视频学习：文末有免费的配套视频可观看点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快ChromeDevTools简介ChromeDevTools是一组直接内置在基于Chromium的浏览器（如Chrome、Opera和MicrosoftEdge）中的工具，用于帮助开发人员调试和研究网站。借助ChromeDevTools，开发人员可以更深入地访问网站，并能够：检查DOM中的元素即时编辑元
Golang应用开发-云原生应用开发 caihuayuan4 面试题汇总与解析大数据 spring sql java
1什么是云原生云原生是一种面向云环境的应用程序开发和部署方法论，旨在提高应用程序的可伸缩性、弹性和可维护性，使应用程序更好地适应云环境中的变化和需求。云原生应用程序通常是以微服务为基础，通过容器化和自动化部署来实现快速部署和可扩展性。云原生应用程序的设计和开发必须考虑以下关键特性：容器化：使用容器技术将应用程序和其依赖项打包在一起，以实现可移植性和跨平台性。自动化部署：使用自动化工具和流程来简化部
Redis——知识点其实不会敲代码面试题真的记不住一点 redis
Redis问答1.认识Redis1.1什么是RedisRedis是一种基于内存的数据库，对数据的读写都在内存上操作，因此读写速度很快，常用于缓存、消息队列、分布式锁等的应用场景Redis提供了很多数据类型来支撑各种场景，例如String、hash、list、set、zset、bitmapas、hyperloglog、GEO，对数据的操作都是原子性的，单线程过程，不存在锁的竞争除此之外，Redis还
Android中perform和handle方法的区别——以handleLaunchActivity与performLaunchActivity为例猿界新星蔡 Android android
在Android系统中，perform和handle方法经常出现在关键流程中，分别承担不同的职责。这种命名约定反映了框架设计中的分层思想，帮助开发者区分任务的调度与实现。本文通过handleLaunchActivity和performLaunchActivity这两个典型方法的源码分析，详细讲解它们的区别和设计意图。1.核心概念perform方法：用于具体执行某项任务的逻辑。专注于任务实现的细节，
flutter 局部刷新控件Selector源码实现原理天若子 flutter flutter 开发语言
Flutter中的Selector组件是provider包提供的一个优化工具，用于在状态管理中仅选择所需数据片段，避免不必要的Widget重建。其实现原理基于以下几个关键点：1.核心设计目标选择性重建：仅当特定数据变化时触发Widget重建，而非整个状态对象变化时都重建。性能优化：通过比较数据片段的前后值，避免无关数据变化导致的冗余重建。2.实现原理a.继承自StatefulWidgetSelec
android bp构建编译C++代码令狐掌门 Android开发笔记 android c++android bp
AndroidBP编译方式介绍在Android构建系统中，Blueprint（简称BP）是一种基于JSON的构建配置文件格式，代替了传统的Android.mk文件。Blueprint文件的主要扩展名是.bp，它是Android的Soong构建系统所使用的配置文件格式。Blueprint文件的作用是定义如何编译、链接和打包项目中的组件，例如库（静态库、动态库）、可执行文件、AIDL文件、资源等。BP
高效API开发：FastAPI中的缓存技术与性能优化 Switch616 Python Web fastapi 缓存性能优化负载均衡 python
高效API开发：FastAPI中的缓存技术与性能优化目录使用缓存优化性能：Redis与Memcached设计合适的缓存策略基于请求结果的缓存与数据库缓存1.使用缓存优化性能：Redis与Memcached缓存技术在高并发Web应用中起着至关重要的作用，能够显著提高API的响应速度，降低数据库的压力，改善系统的整体性能。在PythonWeb开发中，常见的缓存技术包括Redis和Memcached，它
前端开发--node.js 前端_学习之路 nodejs node.js
Node.js是一个基于ChromeV8引擎的JavaScript运行时环境，它使得JavaScript能够在服务器端运行，极大地扩展了JavaScript的应用范围。以下是关于Node.js的详细介绍：特点事件驱动：Node.js基于事件驱动架构，使用事件循环来处理并发操作。这意味着它可以高效地处理大量并发请求，而无需为每个请求创建新的线程，从而提高了性能和响应速度。非阻塞I/O：Node.js
Python大数据处理实验报告（三）小李独爱秋 python 开发语言 pycharm 大数据
实验目的本次实验的目的是练习使用Python编程语言和相关库进行网络爬虫和数据处理任务。具体来说，您将学习以下内容：使用Python中的requests库和BeautifulSoup库来爬取当当网某一本书的网页内容，并将其保存为html格式文件。学习使用Python中的requests库和正则表达式来爬取豆瓣网上某本书的前50条短评内容，并计算评分的平均值。了解如何使用Python中的reques
使用STM32实现火焰检测器 CrMylive. stm32 单片机嵌入式硬件
火焰检测器是一种用于检测火焰的设备，可用于监控火灾安全和预防火灾事故。在本篇文章中，我们将使用STM32微控制器实现一个简单的火焰检测器。STM32是意法半导体（STMicroelectronics）公司推出的一系列32位微控制器产品，具有丰富的外设和强大的处理能力，非常适合用于开发各种嵌入式系统。我们将在本项目中使用STM32F4Discovery开发板，它基于STM32F407VG微控制器，具
基于openEuler搭建Glusterfs集群实验 obboda linux 运维服务器
一、环境准备主机名IP地址备注openEuler-1192.168.121.11节点1（提供两块5G硬盘）openEuler-2192.168.121.12节点2（提供两块5G硬盘）openEuler-3192.168.121.13节点3（提供两块5G硬盘）openEuler-4192.168.121.14客户端二、节点配置1、磁盘分区以节点1为例：[root@openEuler-1~]#lsbl
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

Mahout基于项目的协同过滤算法源码分析（5）--推荐

你可能感兴趣的:(Mahout,源码分析,协同过滤,基于项目的协同过滤)