Username_Password_R

用协同过滤算法对电影评分，并使用RMSE算出预测误差的MapReduce实现

MapReduce程序实现

Mean.java：该MapReduce用来计算每部电影的平均评分
Regular.java：该MapReduce用来对数据进行去中心化，即用每一行记录的评分减去该行对应电影的平均分
ExtractTestData.java：该MapReduce用来从数据集中抽取出119条记录作为测试集
MovieSimilar.java：该MapReduce用余弦值作为相似度计算出某部电影与其他所有电影的相似度
MostSimilarMovies.java：该MapReduce用来求出电影相似度最高的20个记录
PredictMovieRating.java：该MapReduce根据20个最高的电影相似度数据预测用户对电影的评分
CalculateDifference.java：该MapReduce用来计算评分的实际值与预测值的差异
CalculateRMSE.java：该MapReduce用来求预测电影的均方根误差RMSE

相关原理请查看实验报告：用协同过滤算法对电影评分，并使用RMSE算出预测误差

1）Mean.java

package mr;

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce用来计算每部电影的平均评分

*/

public class Mean {

public static class FirstMapper extends Mapper {

String [] dataset = new String[4];

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//value：1，2，3.5，1112486027

dataset = value.toString().split(",");

Text mkey = new Text();

Text mvalue = new Text();

//过滤掉标题行

if("movieId".equals(dataset[1]))

return;

mkey.set(dataset[1]);

mvalue.set(dataset[2]);

//key:movieId,value:rating

context.write(mkey, mvalue);

}

}

public static class FirstReducer extends Reducer {

Text mean=new Text();

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

float rate = 0.0f;

int i=0;

for(Text text : values){

try{

//把同一部电影的所有评分加起来

rate += Float.parseFloat(text.toString());

}catch(Exception e){

return;

}

//对每一部电影，统计其有多少个评分

i++;

}

mean.set((rate/i)+"");

//key:movieId,value:电影的平均评分

context.write(key,mean);

}

}

}

2）Regular.java

package mr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import java.util.StringTokenizer;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.InputSplit;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileSplit;

/*

* 该MapReduce用来对数据进行去中心化，即用每一行记录的评分减去该行对应电影的平均分

*/

public class Regular {

public static class FirstMapper extends Mapper {

String [] dataset = new String[4];

Text movieId = new Text();

Text ratingMean = new Text();

Text mkey = new Text();

Text mvalue = new Text();

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

InputSplit inputSplit = context.getInputSplit();

//求出当前读取的输入文件的文件名

String strname = ((FileSplit) inputSplit).getPath().getName();

//若文件名是part-r-00000，则当前读取的输入文件是电影平均评分的文件

if("part-r-00000".equals(strname)){

StringTokenizer token = new StringTokenizer(value.toString());

//value：movieId,rating(平均评分)

if(token.hasMoreElements()){

movieId.set(token.nextToken());

if(token.hasMoreElements()){

ratingMean.set("#"+token.nextToken());

}

}

//key：movieId,#rating(平均评分)

context.write(movieId, (ratingMean));

//若文件名不是part-r-00000，则当前读取的输入文件是数据集的文件

}else{

//value：1，2，3.5，1112486027

dataset = value.toString().split(",");

//过滤掉标题行

if("movieId".equals(dataset[1]))

return;

mkey.set(dataset[1]);

mvalue.set((dataset[0]+","+dataset[2]));

//key:movieId,value:userId,rating

context.write(mkey, mvalue);

}

}

public static class FirstReducer extends Reducer {

float mean = 0.0f;

float rating = 0.0f;

//该reduce函数，对每个key（movieId）,迭代器Iterable包含该movieId对应的所有userId和movieId对应的平均评分

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

List list = new ArrayList();

for(Text text : values){

//求出电影的平均评分（以#开头）

if(text.toString().startsWith("#")){

mean = Float.parseFloat(text.toString().substring(1));

continue;

}

//把movieId对应的所有用户userId及其评分rating保存到list集合

list.add(text.toString());

}

//遍历这个list集合，对每个元素（userId,rating）,用rating-mean求出每个userId的评分去中心化后的评分

for(String str : list){

rating = Float.parseFloat(str.substring(str.indexOf(",")+1))-mean;

str = ","+str.substring(0, str.indexOf(","))+","+rating;

//key:movieId,value:,userId,rating(去中心化后的评分，在value前面加逗号，是便于后面的分割处理）

context.write(key, new Text(str));

}

}

3）ExtractTestData.java

package mr;

import java.io.IOException;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce用来从数据集中抽取出119条记录作为测试集

*/

public class ExtractTestData {

public static class FirstMapper extends Mapper {

String [] dataset = new String[4];

static int count = 1;

static int location = 1;

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//value：1，2，3.5，1112486027

dataset = value.toString().split(",");

Text mkey = new Text();

Text mvalue = new Text();

//过滤掉标题行

if("movieId".equals(dataset[1]))

return;

//若当前读取到的记录的userId=location，且统计记录数的count小于119，则把该记录传到reduce

if(dataset[0].trim().equals(location+"")&&count<=119){

mkey.set(dataset[1]);

mvalue.set(dataset[0]+","+dataset[2]);

//location的增量

location = location+count;

//统计记录数加1

count++;

//key:movieId,value:userId,rating

context.write(mkey, mvalue);

}else

return;

}

}

public static class FirstReducer extends Reducer {

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

//遍历这个迭代器Iterable，输出每一个元素（userId,rating）

for(Text text: values){

text.set(","+text.toString());

//key:movieId,value:,userId,rating（value前面加逗号，是便于后面的分割处理）

context.write(key,text);

}

}

}

/*

//通过这个reduce处理，抽取到的测试集更均匀，但计算量更大

public static class FirstReducer extends Reducer {

Text mkey = new Text();

Text mvalue = new Text();

int count = 1;

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

List list = new ArrayList();

String userId = key.toString();

for(Text text: values){

if(list.size()>10)

break;

list.add(text.toString());

}

if(count<=263){//if((set.size()==userlocation||list.size()==50)&&count<=263){

int size = list.size();

Random rand = new Random();

        boolean[]  bool = new boolean[size];

        int randInt = 0;

        for(int i = 0; i < 3 ; i++) {

               do {

                   randInt  = rand.nextInt(size);

               }while(bool[randInt]);

               bool[randInt] = true;

               String [] dataset = list.get(randInt).split(",");

               mkey.set(dataset[0]);

               mvalue.set(","+userId+","+dataset[1]);

               context.write(mkey, mvalue);

   count++;

        }

}else

return;

}

}*/

4）MovieSimilar.java

package mr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.HashSet;

import java.util.List;

import java.util.Set;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce用余弦值作为相似度计算出某部电影与其他所有电影的相似度

*/

public class MovieSimilar {

public static class FirstMapper extends Mapper {

String [] dataset = new String[3];

Text mkey = new Text();

Text mvalue = new Text();

int count = 1;

List list = new ArrayList();

Set set = new HashSet();

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//获得从main函数传进来的movieId

String movieId = context.getConfiguration().get("movieId");

//value:movieId,userId,rating(去中心化后的评分）

dataset = value.toString().split(",");

//得到数据集的movieId

String dmId = dataset[0].replaceAll("\t|\\s+","").trim();

if(movieId.equals(dmId)){

//把从main函数传进来的要计算其相似度的movieId与去中心化后

//的数据集中的movieId相等的记录保存到list集合中

//如movieId=1,则list集合保存的是数据集中的movieId=1的所有记录

//list(0):1，2，-2.8733，list(1):1，4，-1.2344....

list.add(value.toString());

}else{

//set集合保存除从main函数传进来的要计算其相似度的movieId之外的其它所有的movieId

set.add(dmId);

mkey.set("<"+dmId+","+movieId+">");

mvalue.set(value.toString());

//key:除了要计算的movieId之外的数据集中的movieId),movieId(要计算的movieId)>,

//value:movieId(除了要计算的movieId之外),userId,rating(去中心化后的评分）

//如<2,1> 2,3,2.542

context.write(mkey, mvalue);

}

//若读取到第14206行（总的电影数为14206，即最后一行,不同的数据集有不同的数值）

if(count==14206){

//遍历set集合

for(String i:set){

//遍历list集合

for(String str:list){

String skey = "<"+i+","+movieId+">";

mkey.set(skey);

mvalue.set(str);

//key:集合中的movieId),movieId(要计算的movieId)>

//value:movieId(要计算的movieId),userId,rating(去中心化后的评分）

//如<2,1> 1,3,1.342

context.write(mkey, mvalue);

}

}

//统计当前读取到第几行

count++;

}

}

public static class FirstReducer extends Reducer {

float mean = 0.0f;

float rating = 0.0f;

//key的值是要计算的某一对movieId,values保存了key这对movieId的所有用户及其评分

//如key：<2,1> values:1,3,1.342；2,3,2.542（values中每个元素的第一个值用以区别当前记录是属于哪个movieId的）

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

List list1 = new ArrayList();

Set list2 = new HashSet();

//求出对的第一个值，如<2,1>中的2

String keyn = key.toString().substring(1, key.toString().indexOf(",")).trim();

for(Text text : values){

String str = text.toString();

//求出values中每个元素的第一个值movieId

String movieId = str.substring(0, str.indexOf(",")).trim().replace("\t","");

//若从values中求出的movieId和从key求出的movieId相同则保存到list1集合中，否则保存到list2集合中

if(keyn.equals(movieId.trim())){

//list1集合保存的是所有的movieId等于对第一个movieId值的记录

list1.add(str.substring(str.indexOf(",")+1));

}else{

//list2集合保存的是所有的movieId等于对第二个movieId值的记录

list2.add(str.substring(str.indexOf(",")+1));

}

}

float count = 0.0f,rating1=0.0f,rating2=0.0f;

//下面是求余弦值相似度

//遍历list1集合

for(String str1:list1){

//str1:userId,rating

String[] pair1 = str1.split(",");

//把list1集合中的所有评分的平方累加起来

rating1+=Math.pow(Float.parseFloat(pair1[1].trim()), 2);

for(String str2:list2){

//str2:userId,rating

String[] pair2 = str2.split(",");

//list1集合中的userId和list2集合中的userId相同，即该用户同时对这两部电影都给于了评分

if(pair1[0].equals(pair2[0])){

//把该用户对这两部电影的评分乘积累加起来

count+=(Float.parseFloat(pair1[1].trim())*Float.parseFloat(pair2[1].trim()));

break;

}

}

//遍历list2集合

for(String str2:list2){

String[] pair2 = str2.split(",");

//把list2集合中的所有评分的平方累加起来

rating2+=Math.pow(Float.parseFloat(pair2[1].trim()), 2);

}

String similar = "0";

//分母不为零

if(rating1!=0.0&&rating2!=0.0){

//求出余弦值相似度

similar = count/(Math.sqrt(rating1)*Math.sqrt(rating2))+"";

}

//key:除了要计算的movieId之外的数据集中的movieId),movieId(要计算的movieId)>

//value：similar（余弦值相似度）

context.write(key,new Text(similar));

}

}

5）MostSimilarMovies.java

package mr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.Arrays;

import java.util.Collections;

import java.util.List;

import java.util.StringTokenizer;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce用来求出电影相似度最高的20个记录

*/

public class MostSimilarMovies {

public static class FirstMapper extends Mapper {

Text mkey = new Text();

Text mvalue = new Text();

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

mkey.set("0");

//key:0,value: cosine(电影间的余弦值相似度)

context.write(mkey,value);

}

}

public static class FirstReducer extends Reducer {

int count = 1;

Text tk = new Text();

Text tv = new Text();

//values保存了14025对电影间的相似度记录

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

List list = new ArrayList();

//建立的数组长度为数据集中电影的总数减一

String[] strs = new String[14025];

int i = 0;

//遍历values,将其信息保存到数组中，便于排序

for(Text text:values){

StringTokenizer token = new StringTokenizer(text.toString());

String mkey = token.nextToken().trim();//

String str = token.nextToken().trim();//cosine(电影间的余弦值相似度)

if(str.contains("E")){

//若表示成科学计数法则将其转换成小数的形式，保存到数组中的数据形式为cosine

strs[i] = getdecimal(str)+"\t"+mkey;

}else{

strs[i] = str+"\t"+mkey;

}

i++;

}

//对cosine 组成的字符串排序，得到升序数组

Arrays.sort(strs);

for(String s :strs){

//按顺序保存到list集合

list.add(s);

}

//对顺序保存的list集合做翻转操作，得到其倒序集合

Collections.reverse(list);

for(int k=0;k

//输出前20个倒序后的记录

if(k>=20)

break;

String[] output = list.get(k).split("\t");

tk.set(output[0]);

tv.set(output[1]);

//key:cosine,value:

context.write(tk,tv);

}

}

public static String getdecimal(String value){

int location = Integer.parseInt(value.substring(value.length()-1));

String str = "0.";

for(int i = 1;i

str+="0";

}

str += value.substring(0,10).replace(".", "");

return str;

}

6）PredictMovieRating.java

package mr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce根据20个最高的电影相似度数据预测用户对电影的评分

*/

public class PredictMovieRating {

public static class FirstMapper extends Mapper {

String [] dataset = new String[4];

Text mkey = new Text();

Text mvalue = new Text();

List list = new ArrayList();

List userIdlist = new ArrayList();

int i = 0;

String tmovieId = "";

float[] f1,f2;

int total = 0;

int maxuserId = 0;

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//算一次即可

if(i==0){

//获取从main函数传进来的match参数，并以制表符分割，形式为movieId,userId,userId..._与

//前面movieId最相似的20个movieId及其余弦值，如1,1,3,7_2 0.7362\t4 0.634...

String[] info = context.getConfiguration().get("match").split("\t");

//求出要预测的movieId和其对应的userId

String[] users = info[0].split("_")[0].split(",");

//通过users[0]求出要预测的tmovieId

tmovieId = users[0].trim();

//把第一个userId赋予maxuserId

maxuserId = Integer.parseInt(users[1]);

int userid = 0;

for(int k=1;k

//userIdlist集合保存要预测的userId

userIdlist.add(users[k].trim());

userid = Integer.parseInt(users[k]);

//求出这些userId中的最大值maxuserId

if(maxuserId

maxuserId = userid;

}

for(int j=0;j

if(j==0){

//list集合保存与tmovieId最相似的20个movieId及其余弦值,j=0,要去掉下划线_前面的信息

list.add(info[0].substring(info[0].indexOf("_")+1));

}else{

list.add(info[j]);

}

}

//初始化数组f1和f2，用以后面用户对电影的评分计算

total = userIdlist.size();

f1 = new float[total];

f2 = new float[total];

for(int i=0;i

f1[i]=0.0f;

f2[i]=0.0f;

}

//防止上面步骤每读入一条记录都要执行一次

i=1;

}

//value：userId,movieId,rating,timestamp,如1，2，3.5，1112486027

dataset = value.toString().split(",");

//求出userId

String userId = dataset[0].trim();

//过滤掉标题行

if(userId.equals("userId"))

return;

//求出movieId

String movieId = dataset[1].trim();

//若读取的记录的userId不比要预测的maxuserId大，则算出用户对电影的预测值所需的f1(分子)和f2(分母)

if(Integer.parseInt(userId)<=maxuserId){

//对userIdlist集合中的每个用户，计算其对tmovieId的评分

for(int i=0;i

//若读取的记录的userId等于userIdlist集合中的某个值，则计算该用户对tmovieId的评分

if(userId.equals(userIdlist.get(i).trim())){

//遍历list集合

for(String str:list){

String[] moviesimilarinfo = str.split(",");

//若读取的记录的movieId等于list集合中的某个值，则把其相似度乘以该用户对movieId的评分

//并加到f1数组的第i个元素中，同时把相似度加到f2数组的第i个元素中

if(moviesimilarinfo[0].trim().equals(movieId)){

f1[i]+=(Float.parseFloat(dataset[2].trim())*Float.parseFloat(moviesimilarinfo[1].trim()));

f2[i]+=Float.parseFloat(moviesimilarinfo[1].trim());

//每次处理一条数据，若找到，处理后立即退出循环

break;

}

}

break;

}

}

//读取的记录的userId比要预测的maxuserId大，说明用户对电影的预测值所需的f1和f2已经算好

}else{

float rating=0.0f;

//对userIdlist集合中的每个用户，计算其对tmovieId的评分

for(int j=0;j

mkey.set(tmovieId+","+userIdlist.get(j));

if(f2[j]!=0){

rating = (f1[j]/f2[j]);

}

mvalue.set(","+rating);

//key:tmovieId,userId,value:,rating（电影的预测值，value前面加逗号，是便于后面的分割处理）

context.write(mkey, mvalue);

}

}

public static class FirstReducer extends Reducer {

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

//key:tmovieId,userId,values只保存一个值:,rating

context.write(key, values.iterator().next());

}

7）CalculateDifference.java

package mr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

/*

* 该MapReduce用来计算评分的实际值与预测值的差异

*/

public class CalculateDifference {

public static class FirstMapper extends Mapper {

Text mkey = new Text();

Text mvalue = new Text();

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//value:movieId,userId,rating(包括实际值和预测值)

String[] info = value.toString().split(",");

mkey.set(info[0].trim()+","+info[1].replaceAll("\t|\\s+", "").trim());

mvalue.set(info[2].trim());

//key:movieId,userId,value:rating

context.write(mkey, mvalue);

}

}

public static class FirstReducer extends Reducer {

Text text = new Text();

float rawrating = 0.0f,predictrating = 0.0f;

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

List list = new ArrayList();

//把相同的rating包括实际值和预测值存到list集合中

for(Text text:values){

list.add(text.toString());

}

//假设第一个是实际值，第二个值预测值

rawrating = Float.parseFloat(list.get(0));

predictrating = Float.parseFloat(list.get(1));

//求出实际值与预测值的差值平方

double diff = Math.pow((rawrating-predictrating),2);

//若预测值为0，则在实际值与预测值的差值平方后面加上(predictrating=0.0)，用以区别该预测值为零

//是由于与这部电影最相似的20部电影在指定的用户下都没有评分记录导致的

if(rawrating==0.0||predictrating==0.0){

text.set(diff+" (predictrating=0.0)");

}else{

text.set(diff+"");

}

//key:movieId,userId,value:diff(实际值与预测值的差值平方)或在后面加上(predictrating=0.0)

context.write(key, text);

}

}

}

8） CalculateRMSE.java

package mr;

import java.io.ByteArrayOutputStream;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/*

* 该MapReduce用来求预测电影的均方根误差RMSE

*/

public class CalculateRMSE {

public static class FirstMapper extends Mapper {

Text mkey = new Text();

Text mvalue = new Text();

public void map(Object key, Text value, Context context)

throws IOException, InterruptedException {

//value:movieId,userId diff(实际值与值预测值差值的平方)或在后面加上 (predictrating=0.0)

StringTokenizer token = new StringTokenizer(value.toString());

//去掉含有(predictrating=0.0)的记录，即去掉预测值为零的记录

if(token.countTokens()>=3)

return;

if(token.hasMoreElements()){

token.nextToken();

mkey.set("diff");

if(token.hasMoreElements()){

mvalue.set(token.nextToken());

//key:diff,value:diff(实际值与预测值的差值平方)

context.write(mkey, mvalue);

}

}

public static class FirstReducer extends Reducer {

Text text = new Text();

public void reduce(Text key, Iterable values,Context context)

throws IOException, InterruptedException {

double rmse = 0.0d;

int count = 0;

for(Text text:values){

//遍历values集合，把所有的diff(电影实际值与预测值的差值平方)加到rmse中

rmse+=Double.parseDouble(text.toString().trim());

count++;

}

key.set("RMSE");

text.set(Math.sqrt(rmse/count)+"");

//key:RMSE,value:rmse值

context.write(key, text);

}

}

public static void main(String[] args) throws Exception {

String path = "";

//数据集的文件路径

String dataset = path+"/wsd/input/rating.txt";

//电影的平均评分路径

String mean = path+"/wsd/CF/mean";

//数据去中心化的路径

String regular = path+"/wsd/CF/regular";

//抽取一部分数据集作为测试集的路径

String extracttestdata = path+"/wsd/CF/extracttestdata";

//电影相似度的路径

String moviesimilar = path+"/wsd/CF/moviesimilar/";

//最高的电影相似度的路径

String mostsimilarmovies = path+"/wsd/CF/mostsimilarmovies/";

//用户对电影的评分的路径

String predictmovierating = path+"/wsd/CF/predictmovierating/";

//用户对电影的实际值与预测值的差值平方的路径

String difference = path+"/wsd/CF/difference";

//预测电影的均方根误差RMSE的路径

String rmse = path+"/wsd/CF/rmse";

Path dstPath;

FileSystem dhfs=null;

Configuration conf = new Configuration();

//求所有电影的平均评分

System.out.println("----------------------------mean--------------------------------");

Job Jmean = new Job(conf, "Mean");

Jmean.setJarByClass(Mean.class);

Jmean.setMapperClass(Mean.FirstMapper.class);

Jmean.setCombinerClass(Mean.FirstReducer.class);

Jmean.setReducerClass(Mean.FirstReducer.class);

Jmean.setOutputKeyClass(Text.class);

Jmean.setOutputValueClass(Text.class);

//输入为数据集的路径

FileInputFormat.addInputPath(Jmean, new Path(dataset));

//输出为所有电影的平均评分的路径

FileOutputFormat.setOutputPath(Jmean, new Path(mean));

Jmean.waitForCompletion(true);

//求数据去中心化

System.out.println("----------------------------regular-----------------------------");

Job Regular = new Job(conf, "Regular");

Regular.setJarByClass(Regular.class);

Regular.setMapperClass(Regular.FirstMapper.class);

Regular.setReducerClass(Regular.FirstReducer.class);

Regular.setOutputKeyClass(Text.class);

Regular.setOutputValueClass(Text.class);

//输入为数据集的路径

FileInputFormat.addInputPath(Regular, new Path(dataset));

//输入为所有电影的平均评分的路径

FileInputFormat.addInputPath(Regular, new Path(mean+"/part-r-00000"));

//输出为数据去中心化路径

FileOutputFormat.setOutputPath(Regular, new Path(regular));

Regular.waitForCompletion(true);

//抽取一部分数据集作为测试集

System.out.println("--------------------ExtractTestData--------------------");

Job ExtractTestData = new Job(conf, "ExtractTestData");

ExtractTestData.setJarByClass(ExtractTestData.class);

ExtractTestData.setMapperClass(ExtractTestData.FirstMapper.class);

ExtractTestData.setReducerClass(ExtractTestData.FirstReducer.class);

ExtractTestData.setOutputKeyClass(Text.class);

ExtractTestData.setOutputValueClass(Text.class);

//输入为数据集的路径

FileInputFormat.addInputPath(ExtractTestData, new Path(dataset));

//输出为抽取到的测试集路径

FileOutputFormat.setOutputPath(ExtractTestData, new Path(extracttestdata));

ExtractTestData.waitForCompletion(true);

//通过getfileinfo函数读取抽取到的测试集中的记录，形式：1，3，3.5\n1,6,4.0...（movieId,userId,rating）

String movieinfo = getfileinfo(extracttestdata+"/part-r-00000");

String[] testdata = movieinfo.split("\n");

List list = new ArrayList();

String users = "";

String movieId = "";

//通过这个for循环处理后，list集合保存测试集中movieId及该movieId对应的所有userId

//如测试集有1，3，3.5；1,6,4.0；2,1,4.0；2,3,4.0；2,6,4.0...则list(0):1,3,6;list(1):2,1,3,6...

//第一个为movieId,后面的都是该movieId对应的所有userId

for(int j=0;j

//testdata[j]：1，3，3.5（movieId,userId,rating）

String[] info = testdata[j].split(",");

if(j==0){

//对第一条记录，保存其movieId,并将userId添加到users后面，以逗号分开

movieId = info[0].trim();

users+=info[1]+",";

}else{

//对于后面的记录，若其movieId等于前面的movieId，则继续把userId添加到users后面，以逗号分开

if(movieId.equals(info[0].trim())){

users+=info[1]+",";

}else{

//对于后面的记录，若其movieId与前面的movieId不相等

//则去掉最后面的逗号，并在其前面加上前面保存的movieId，加到list集合中

users = users.substring(0,users.length()-1);

list.add(movieId+","+users);

//users被赋予当前记录的userId

users=info[1]+",";

//movieId被赋予当前记录的movieId

movieId = info[0].trim();

}

//读取到testdata数组的最后一个元素

if(j==testdata.length-1){

//则去掉最后面的逗号，并在其前面加上当前记录的movieId，加到list集合中

users = users.substring(0,users.length()-1);

list.add(info[0].trim()+","+users);

}

}

}

//遍历list集合，求出测试集中所有记录的电影评分

for(String s:list){

//list集合中每个元素的第一个值为movieId

movieId = s.substring(0, s.indexOf(",")).replace("\t|\\s+", "");

//求出电影间的相似度

System.out.println("-----------当前要计算的movieId：--"+movieId+"--------------------");

//把当前要计算的movieId通过configration传进去

conf.set("movieId", movieId);

System.out.println("--当前要计算的movieId:--"+movieId+"---MovieSimilar--------------------");

Job Jmoviesimilar = new Job(conf, "MovieSimilar");

Jmoviesimilar.setJarByClass(MovieSimilar.class);

Jmoviesimilar.setMapperClass(MovieSimilar.FirstMapper.class);

Jmoviesimilar.setReducerClass(MovieSimilar.FirstReducer.class);

Jmoviesimilar.setOutputKeyClass(Text.class);

Jmoviesimilar.setOutputValueClass(Text.class);

//输入为数据去中心化的路径

FileInputFormat.addInputPath(Jmoviesimilar,new Path(regular+"/part-r-00000"));

//输出为当前电影movieId相似度的路径

FileOutputFormat.setOutputPath(Jmoviesimilar, new Path(moviesimilar+movieId));

Jmoviesimilar.waitForCompletion(true);

//求出最高的电影相似度

System.out.println("--当前要计算的movieId:--"+movieId+"----MostSimilarMovies--------------------");

Job Jmostsimilarmovie = new Job(conf, "MostSimilarMovies");

Jmostsimilarmovie.setJarByClass(MostSimilarMovies.class);

Jmostsimilarmovie.setMapperClass(MostSimilarMovies.FirstMapper.class);

Jmostsimilarmovie.setReducerClass(MostSimilarMovies.FirstReducer.class);

Jmostsimilarmovie.setOutputKeyClass(Text.class);

Jmostsimilarmovie.setOutputValueClass(Text.class);

//输入为当前电影movieId相似度的路径

FileInputFormat.addInputPath(Jmostsimilarmovie,new Path(moviesimilar+movieId+"/part-r-00000"));

//输出为当前电影movieId最高相似度的路径

FileOutputFormat.setOutputPath(Jmostsimilarmovie, new Path(mostsimilarmovies+movieId));

Jmostsimilarmovie.waitForCompletion(true);

//通过getfileinfo函数读取当前电影movieId最高相似度的记录，形式：0.872 <2,1>\n0.737 <2,1>...（cosine ）

String mostsimilar = getfileinfo(mostsimilarmovies+movieId+"/part-r-00000");

String[] mostmovieinfo = mostsimilar.split("\n");

String match = s+"_";

for(String str:mostmovieinfo){

StringTokenizer token = new StringTokenizer(str);

String cosine = token.nextToken();

String movie = token.nextToken();

movie = movie.substring(1, movie.indexOf(","));

//对mostmovieinfo数组中的每一个元素，把当前要计算的movieId与其最相似movieId和相似度添加到match后面

match+=(movie+","+cosine+"\t");

}

//通过上面的处理，match保存的是list集合的元素_与当前要计算的movieId最相似的movieId和他们的相似度

conf.set("match", match);

System.out.println(match);

//求出预测的电影评分

System.out.println("--当前要计算的movieId--"+movieId+"-----PredictMovieRating--------------------");

Job Jpredictmovierating = new Job(conf, "PredictMovieRating");

Jpredictmovierating.setJarByClass(PredictMovieRating.class);

Jpredictmovierating.setMapperClass(PredictMovieRating.FirstMapper.class);

Jpredictmovierating.setReducerClass(PredictMovieRating.FirstReducer.class);

Jpredictmovierating.setOutputKeyClass(Text.class);

Jpredictmovierating.setOutputValueClass(Text.class);

//输入为数据集的路径

FileInputFormat.addInputPath(Jpredictmovierating,new Path(dataset));

//输出为用户对当前电影movieId的评分的路径

FileOutputFormat.setOutputPath(Jpredictmovierating, new Path(predictmovierating+movieId));

Jpredictmovierating.waitForCompletion(true);

//删除电影的相似度，若空间足够大，可以不用删除

dstPath = new Path(moviesimilar+movieId);

        dhfs = dstPath.getFileSystem(conf) ;

        if(dhfs.exists(dstPath)){

            dhfs.delete(dstPath, true);

        }



      //删除最高的电影相似度，若空间足够大，可以不用删除

dstPath = new Path(mostsimilarmovies+movieId);

        dhfs = dstPath.getFileSystem(conf) ;

        if(dhfs.exists(dstPath)){

            dhfs.delete(dstPath, true);

        }

}

//求出用户对电影的实际值与预测值的差值平方

System.out.println("-------------------CalculateDifference--------------------");

Job Jcalculatedifference = new Job(conf, "CalculateDifference");

Jcalculatedifference.setJarByClass(CalculateDifference.class);

Jcalculatedifference.setMapperClass(CalculateDifference.FirstMapper.class);

Jcalculatedifference.setReducerClass(CalculateDifference.FirstReducer.class);

Jcalculatedifference.setOutputKeyClass(Text.class);

Jcalculatedifference.setOutputValueClass(Text.class);

//输入为测试集的路径

FileInputFormat.addInputPath(Jcalculatedifference,new Path(extracttestdata+"/part-r-00000"));

for(String s : list){

movieId = s.substring(0, s.indexOf(",")).trim().replace("\t|\\s+", "");

//输入为所有的电影预测值路径

FileInputFormat.addInputPath(Jcalculatedifference,new Path(predictmovierating+movieId+"/part-r-00000"));

}

//输出为用户对电影的实际值与预测值的差值平方的路径

FileOutputFormat.setOutputPath(Jcalculatedifference, new Path(difference));

Jcalculatedifference.waitForCompletion(true);

//求出预测电影的均方根误差RMSE

System.out.println("--------------------CalculateRMSE--------------------");

Job JcalculateRMSE = new Job(conf, "CalculateRMSE");

JcalculateRMSE.setJarByClass(CalculateRMSE.class);

JcalculateRMSE.setMapperClass(CalculateRMSE.FirstMapper.class);

JcalculateRMSE.setReducerClass(CalculateRMSE.FirstReducer.class);

JcalculateRMSE.setOutputKeyClass(Text.class);

JcalculateRMSE.setOutputValueClass(Text.class);

//用户对电影的实际值与预测值的差值平方的路径

FileInputFormat.addInputPath(JcalculateRMSE,new Path(difference+"/part-r-00000"));

//输出为预测电影的均方根误差RMSE的路径

FileOutputFormat.setOutputPath(JcalculateRMSE, new Path(rmse));

JcalculateRMSE.waitForCompletion(true);

}

//从HDFS文件系统中读取文件信息

public static String getfileinfo(String filename) {

    Configuration config = new Configuration();

    FSDataInputStream dis = null;

    String result = "";

    try {

        ByteArrayOutputStream baos = new ByteArrayOutputStream();

        FileSystem hdfs = FileSystem.get(config);

        dis = hdfs.open(new Path(filename));

         //写入ByteArrayOutputStream

        IOUtils.copyBytes(dis, baos, 4096, false);

        result = baos.toString();

     }catch (IOException e) {

        e.printStackTrace();

     }

    finally{

        IOUtils.closeStream(dis);

         }

    return result;

}

C++和Java相比，哪个更适合初学者学习？ c++java
C++和Java都是非常流行的编程语言，但它们在设计理念、应用场景和学习难度上存在显著差异。对于初学者来说，选择哪种语言更适合，取决于学习目标、兴趣和未来的职业规划。以下是对C++和Java的详细对比，帮助初学者做出选择：一、学习难度C++复杂性高：C++继承了C语言的复杂性，支持多种编程范式（如面向对象、泛型编程等），语法复杂，学习曲线陡峭。内存管理：C++需要手动管理内存，容易出现内存泄漏和悬
Ark-TS 语言：鸿蒙生态的高效开发利器，让我们用大白话说一说 harmonyos-next
Ark-TS（华为专门为鸿蒙系统——就是华为自己的手机、平板、智能设备操作系统——设计的编程语言，基于TypeScript，一种比普通JavaScript更严格、能减少错误的语言）是鸿蒙应用开发的主力工具。它就像给开发者配备了一套趁手的工具包，让写代码又快又稳。简单来说，Ark-TS有几个厉害的地方：静态类型检查（写代码时必须给变量指定类型，比如数字、文字，这样电脑能在运行前就发现类型错误，避免程
凌晨三点的代码和引擎轰鸣声前端后端程序员
凌晨三点，我盯着屏幕上第37次报错的算法，随手抓起桌角已经冷透的咖啡猛灌一口。显示器蓝光里，同事阿杰突然弹出一条消息："哥们儿，苏州有个车展能撸代码，去不去？"我对着这句话愣了三秒。车展？在我的认知里，那应该是西装革履的销售围着超模拍宣传片的场合，和我们这种格子衫生物有什么关系？直到阿杰甩来一张海报——黑底荧光绿字刺破视网膜："CISHOWGTSHOW，程序员特别通道，票免费送。"01被编译器耽误
echarts的tooltip自动轮播，dataZoom同步轮播小智玩前端 echarts 前端 javascript
功能：tooltip轮播时，dataZoom也同步轮播，并且鼠标放上去之后，停止轮播；鼠标移出后重新触发轮播；封装成一个函数，直接用就行，代码如下：/*myChart：创建的图表实例startValue：dataZoom的起始值endValue：dataZoom的末尾值dataLength：x轴数据的长度*/autoPlay(myChart,startValue,endValue,dataLeng
解析稳定率达99.99%！合合信息“大模型加速器2.0”助力AI打破“幻觉” 算法大数据人工智能图表表格
随着大模型在社会应用中逐渐普及，人们在享受便利的同时，也面临着“AI幻觉”产生的风险。训练数据是影响大模型“认知能力”的关键要素，近期，上海合合信息科技股份有限公司（简称“合合信息”）TextIn“大模型加速器2.0”版本正式上线，基于领先的智能文档处理技术，对复杂文档的版式、布局和元素进行精准解析及结构化处理，从数据源头降低大模型“幻觉”风险，让大模型在与人类的沟通中“更靠谱”。“大模型加速器2
《深入剖析鸿蒙生态原生应用：一次开发多端部署的技术革新》人工智能深度学习
在数字化时代飞速发展的浪潮中，鸿蒙生态以其独特的技术理念和强大的创新能力，为开发者和用户带来了全新的体验。其中，“一次开发多端部署”作为鸿蒙生态原生应用开发的核心技术之一，不仅是技术上的重大突破，更是对未来应用开发模式的一次深刻变革。鸿蒙生态：全场景时代的新引擎鸿蒙操作系统自诞生以来，就肩负着连接万物、构建全场景智能生态的使命。在传统的应用开发模式下，开发者需要针对不同的终端设备，如手机、平板、电
Android Camera 架构 2501_90226133 android 架构
二、CameraApp层简述三、CameraFramework层简述四、CameraHal3子系统五、下面需要梳理的重点-正在进行一.AndroidCamera整体架构简述自Android8.0之后大多机型采用CameraAPI2HAL3架构,先盗改谷歌的一张图,读完整部代码后再看这张图,真的是很清晰,很简洁,很到位.原图:https://source.android.google.cn/devi
HarmonyOS 5 开发环境介绍 harmonyos-next
一、HarmonyOS5是什么？HarmonyOS5是华为推出的新一代分布式操作系统，基于微内核架构，专注于鸿蒙原生应用开发，不再兼容安卓APK。其核心目标是通过"一次开发、多端部署"的能力，实现全场景设备（手机、平板、智能穿戴、车机、智能家居等）的无缝协同。核心特性包括：分布式架构：设备间可自由组网，共享算力与资源；高性能内核：基于开源鸿蒙（OpenHarmony）优化，支持64位ARM、x86
2025年ITIL 4与六西格玛结合：如何提升服务质量与持续改进 - ITIL认证 itil
在追求卓越运营和持续改进的过程中，ITIL4和六西格玛（SixSigma）是两大关键框架，它们在帮助企业提升服务质量和效率方面发挥着至关重要的作用。随着2025年企业对质量和持续改进的重视日益增加，理解ITIL4与六西格玛之间的关系，将为组织在服务管理和质量控制上提供有力的支持。通过将这两个框架结合使用，企业不仅可以在服务交付中确保更高的质量，还能通过精益方法推动不断的流程改进。首先，ITIL4与
通过ITIL4课程助力业务创新，提升IT服务管理 - ITIL认证 itil
在全球数字化转型的浪潮中，IT服务管理（ITSM）已成为每个企业不可或缺的核心组成部分。无论是优化现有IT流程，还是推动技术创新，ITIL4（InformationTechnologyInfrastructureLibrary4）都为企业提供了一套完整的最佳实践框架。通过ITIL4，企业能够提升服务质量，降低运营成本，并推动业务增长。对于个人而言，掌握ITIL4框架不仅能提升技术能力，还能助力其职
深入探索C++：从基础到高级 c++
深入探索C++：从基础到高级一、C++简介C++是一种通用的、静态类型的、大小写敏感的、自由格式的编程语言，支持过程化编程、面向对象编程和泛型编程。它最初由BjarneStroustrup在1980年代设计，目的是在C语言的基础上增加面向对象的功能。C++广泛应用于系统/应用程序软件、游戏开发、高性能服务器和客户端应用等领域。二、C++的核心特性（一）数据类型C++提供了丰富的数据类型，包括基本数
借Kinect 扫描软件 reconstructMe skanect ksan3d learn deep learning 三维重建
[基础技术]3D扫描教程http://bbs.kechuang.org/read/59979楼主#更多发布于：2013-08-2314:48入门级的3D扫描ReconstructMe硬件kinectXBox360不兼容kinectforwindows或者XtionProLive（XtionProLive开发版包装,有Microphone和RGBsensor）有电动转盘更好，win732位或者64位
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
面试可能会问到的问题dSP xinyizhangwei dsp
1.如何选择外部时钟？DSP的内部指令周期较高，外部晶振的主频不够，因此DSP大多数片内均有PLL。但每个系列不尽相同。1)TMS320C2000系列：TMS320C20x：PLL可以÷2，×1，×2和×4，因此外部时钟可以为5MHz－40MHz。TMS320F240：PLL可以÷2，×1，×1.5，×2，×2.5，×3，×4，×4.5，×5和×9，因此外部时钟可以为2.22MHz－40MHz。T
软件研发如何量化管理考核KPI指标软件工程
明确关键业务目标、量化数据指标、过程管控与反馈、重视协同与激励是软件研发中量化管理考核KPI的主要切入点。其中，过程管控与反馈尤为关键，因为它能帮助团队及时发现进度和质量问题，并快速响应调整策略，让每个阶段的目标与执行更趋于一致。通过持续监控研发过程中各项数据指标，并对出现的偏差进行即时纠偏，可以让团队在激烈的竞争环境中始终保持高效迭代和持续创新的能力，为业务拓展提供源源不断的动力。一、软件研发量
6.Redis 缓存使用问题及解决方案拾柒mm 缓存 redis mybatis
引言Redis作为一种高效的缓存解决方案，广泛应用于各类项目中。然而，使用缓存时也会面临一些问题，特别是数据一致性、缓存穿透、击穿、雪崩等问题。1.数据一致性数据一致性是指在使用缓存时，缓存中的数据与数据库中的数据保持一致。数据不一致可能导致用户获取到过时的信息，影响用户体验。1.1数据操作方案在进行数据增删改操作时，常见的方案有：先更新缓存，再更新数据库：优点：缓存命中率提高，用户可以快速获取到
适合阅读源码的 Java 优质开源框架、库盘点（初级友好项目、中级进阶项目、高级深入项目）我命由我12345 Java -项目 java 开源开发语言 java-ee spring boot spring intellij-idea
一、初级友好项目1、JUnit5基本介绍：JUnit5是单元测试框架，代码简洁，适合学习测试驱动开发（TDD）和设计模式GitHub地址：https://github.com/junit-team/junit5特点：代码量适中，模块化设计，适合学习测试框架的实现原理2、Guava基本介绍：Guava是Google核心库，包含集合、缓存、字符串处理等工具类GitHub地址：https://githu
深入了解 C# 中的 LINQ：功能、语法与应用解析江沉晚呤时 Net core C#solr lucene c#.netcore
1.什么是LINQ？LINQ（LanguageIntegratedQuery，语言集成查询）是C#和其他.NET语言中的一种强大的查询功能，它允许开发者在语言中直接执行查询操作。LINQ使得开发者可以使用C#语法（或VB.NET）直接对集合、数据库、XML等数据源进行查询和操作，而不需要依赖外部查询语言（如SQL）或者复杂的API。LINQ提供了一个统一的查询模型，可以对各种数据源进行查询，包括集
单例模式实现后端
一、是什么单例模式（SingletonPattern）：创建型模式，提供了一种创建对象的最佳方式，这种模式涉及到一个单一的类，该类负责创建自己的对象，同时确保只有单个对象被创建在应用程序运行期间，单例模式只会在全局作用域下创建一次实例对象，让所有需要调用的地方都共享这一单例对象，如下图所示：二、实现在javascript中，实现一个单例模式可以用一个变量来标志当前的类已经创建过对象，如果下次获取当
embed 标签怎么嵌入pdf_如何在网页中嵌入PDF文件 weixin_39822443 embed 标签怎么嵌入pdf
如何在网页中嵌入PDF文件编辑：oa161办公商城您想要到包括代码嵌入到PDFfile.2Type，打开的对象标记，它看起来像这样：<object3Insert的type属性的说明1Locate的位置在您的网页的代码。您的文件类型是PDF。因此，您的代码将看起来像这样：=“application/pdf上”4指定的文件名。要做到这一点，类型：数据=“NAMEofFILE.pdf”地方那句“NA
html 中加载pdf,在HTML中嵌入PDF的推荐方法？梧桐应恨夜来霜 html 中加载pdf
GeorgeMahar..9我们的问题是,出于法律原因,我们不允许在硬盘上临时存储PDF.此外,在浏览器中将PDF显示为"预览"时,不应重新加载整个页面.首先我们尝试了PDF.jS.它适用于Firefox和Chrome浏览器中的Base64.但是,我们的PDF格式慢得令人无法接受.IE/Edge根本不起作用.因此,我们在HTML对象标记中使用Base64字符串进行了尝试.这再次对IE/Edge不起
【Kivy App】Bubble气泡使用方法、常用属性和BubbleButton按钮实例 Botiway 移动APP Kivy python
在Kivy中，Bubble是一个用于显示浮动气泡的UI组件，通常用于显示上下文菜单、提示信息或其他浮动内容。Bubble可以包含多个子组件，例如BubbleButton（气泡按钮）。以下是Bubble的使用方法、常用属性以及BubbleButton的实例。1.基本使用方法首先，确保你已经安装了Kivy库。如果没有安装，可以使用以下命令进行安装：pipinstallkivy然后，你可以在Kivy应用
【css酷炫效果】css酷炫效果100篇合集冰夏之夜影 css 前端
【css酷炫效果】纯CSS实现立体纸张折叠动效缘创作背景动画效果合集【css酷炫效果】实现鱼群游动动态效果【css酷炫效果】纯CSS实现无限旋转加载动画【css酷炫效果】纯CSS实现悬浮放大卡片【css酷炫效果】纯CSS创建流体渐变背景动画【css酷炫效果】纯CSS实现3D翻转卡片动画【css酷炫效果】纯CSS实现文字逐字显现打字效果【css酷炫效果】纯CSS实现霓虹文字呼吸灯效果【css酷炫效果
收入突破 5 万，从大专生到大模型开发-第二篇（下）智码工坊 AI编程程序人生
第二篇下：实战案例拆解——我用AI干掉80%重复工作大家好，我是明聪，98年逆袭的大模型研发工程师，前Java转型幸存者，湖北荆州人，毕业武汉某职校。学习心得：突出“普通人破局”的真实挣扎深夜破防：我也想过放弃1：学RAG时，连续3天卡在向量数据库检索效果，甚至想“回去干Java算了”。直到发现LangChain-Chatchat开源项目，直接套用现成框架，才重拾信心。2：第一次面试被质疑“半路出
Java高级技术星星不打輰 Java java 开发语言
Java高级技术单元测试：Junit单元测试框架针对于最小的功能单元：方法，编写测试代码对于其进行正确性测试自动测试全部方法样例：packagejunittest;publicclassStringUtil{publicstaticintgetLength(Stringstr){if(str==null||"".equals(str)){return-1;}returnstr.length();}
Redis缓存中间件（非关系型数据库）小狼人发JO酸奶缓存 redis 中间件
最近一段时间整理了关于一些知识的总结，其中就拿出Redis来说说，其他的整理的有些杂还在梳理，相信不久就会和大家见面，期待ne.......，不废话了，开始！Redis作为非关系型数据库，终是要涉及到持久化的，毕竟缓存可没落地，很可能丢失的。Redis持久化主要为：RDB全量持久，AOF增量持久：RDB耗时长非实时记录应配合AOF使用，从而避免停机大量丢失数据。Redis重启时：RDB重构内存+A
2025年ITIL 4与敏捷开发的结合：提升IT服务交付的灵活性与响应速度 — ITIL证书 itil
随着敏捷开发和持续交付的兴起，企业对IT服务的交付方式要求越来越高。传统的IT服务管理框架往往难以满足快速变化的业务需求和技术环境，而ITIL4的灵活性和可扩展性使其能够与敏捷开发方法有效结合，从而提升IT服务交付的灵活性、响应速度和质量。本文将探讨ITIL4与敏捷开发方法结合的优势，并介绍如何通过这种结合优化服务交付流程、提高团队协作效率、推动持续改进。ITIL4与敏捷开发的关系敏捷开发强调迭代
“大国品牌”建设全面启动，工业电商生态加速成型人工智能
3月17日，AMT企源与中国工业互联网研究院（简称“工联院”）于北京、上海两地同步举行“大国品牌”电商平台项目启动仪式。工联院相关领导和负责人，AMT企源团队负责人、项目经理和项目骨干，共同出席本次启动仪式。工联院成立于2018年，是工业和信息化部直属的科研机构，承担工业互联网相关的发展战略、规划、政策、标准研究，网络、平台、安全体系建设，国际交流与合作等工作。为落实品牌强国战略，加速优质品牌的培
YashanDB备份数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行备份时，要求数据库运行于OPEN状态且归档模式开启。备份命令仅SYS超级用户或拥有SYSDBA、SYSBACKUP权限的用户才可执行，备份语法详细说明请参考开发手册BACKUPDATABASE。若数据库在
YashanDB恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行恢复时，要求当前数据库实例处于NOMOUNT状态。执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。共享集群部署中，只能在主集群上执行恢复操作（即其角色必须为MASTER\_ROLE，可查询视图
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

用协同过滤算法对电影评分，并使用RMSE算出预测误差的MapReduce实现

你可能感兴趣的:(用协同过滤算法对电影评分，并使用RMSE算出预测误差的MapReduce实现)