2.4 推荐器评估的精度和调用


我们也可以得到一个关于recommender问题的更宽广的看法:对生产recommendations我们不用必须估计首选项值。没必要总是对用户提供估计的首选项值。在很多情况下,我们所想要的是一个recommendations的从最好到最差的排序列表。事实上,在有些情况下,我们不是很关心列表的精确排序:一组有点好的recommendations是好的。

用更一般的看法,我们也可以把经典的信息检索测量应用到评估recommenders:精度和调用。这些项目代表性的应用于像搜索引擎这样的程序,这为许多可能结果的查询返回一些最好的结果。


2.4.1 运行一个RecommenderIRStatsEvaluator

Mahout提供了一个简单的途径去计算推荐器的精度等值.

可以试着运行一下代码


RandomUtils.useTestSeed(); 
DataModel model = new FileDataModel(new File("intro.csv")); 
 
RecommenderIRStatsEvaluator evaluator = 
  new GenericRecommenderIRStatsEvaluator(); 
RecommenderBuilder recommenderBuilder = new RecommenderBuilder() { 
  @Override 
  public Recommender buildRecommender(DataModel model)  
      throws TasteException { 
    UserSimilarity similarity = new PearsonCorrelationSimilarity(model); 
    UserNeighborhood neighborhood = 
      new NearestNUserNeighborhood(2, similarity, model); 
    return  
      new GenericUserBasedRecommender(model, neighborhood, similarity); 
  } 
}; 
IRStatistics stats = evaluator.evaluate( 
    recommenderBuilder, null, model, null, 2,  
    GenericRecommenderIRStatsEvaluator.CHOOSE_THRESHOLD,  
    1.0); A 
 
System.out.println(stats.getPrecision()); 
System.out.println(stats.getRecall());  


你可能感兴趣的:(搜索引擎,File,null)