小胡涂记

看书标记【R语言数据分析项目精解：理论、方法、实战 9】

看书标记——R语言

Chapter 9 文本挖掘——点评数据展示策略
- - 9.1项目背景、目标和方案
  - - 9.1.1项目背景
    - 9.1.2项目目标
    - 9.1.3项目方案
    - - 1.建立评论文本质量量化指标
      - 2.建立用户相似度模型
      - 3.对用户评论进行情感性分析
  - 9.2项目技术理论简介
  - - 9.2.1评论文本质量量化指标模型
    - - 1.主题覆盖量
      - 2.评论文本分词数量
      - 3.评论点赞数
      - 4.评论中的照片数
      - 5.评论分值偏移
    - 9.2.2用户相似度模型
    - - 1.pearson相关系数
      - 2.欧几里得距离
      - 3.夹角余弦相似度
      - 4.马氏距离
    - 9.2.3情感性分析
    - - 1.文本挖掘基础知识
      - 2.基于规则情感性分析方法
      - 3.词汇极性判断
      - 4.关键词提取
    - 9.2.4R语言实例代码
    - - 1.分词
      - 2.配置词典
      - 3.增加自定义词典
      - 4.增加停用词词典
      - 5.关键词提取TF-IDF
      - 6.词性标注
  - 9.3项目实践
  - - 9.3.1若干自定义函数
    - - 1.数据清理
      - 3.分词
    - 9.3.2文本质量量化指标模型
    - 9.3.3用户相似度模型
    - 9.3.4情感词分析
    - - 1.导入评论数据并清洗分词
      - 2.关联情感词、否定词和程度副词
      - 3.对片段进行窗口期判定及综合打分
    - 9.3.5总结

【R语言数据分析项目精解：理论、方法、实战 9】

Chapter 9 文本挖掘——点评数据展示策略

9.1项目背景、目标和方案

9.1.1项目背景

评论内容无效、评论数据千人一面，有必要对评论显示策略做出一定的调整

9.1.2项目目标

(1）对评论文本的质量进行监控和量化，将一些无效评论的显示顺序滞后。
(2）制定用户相似度模型，将用户的评论给与他相似的用户看，达到千人百面的效果。
(3）对评论所表达的情感进行分析，综合评分和情感两个方面对评论进行排序。

9.1.3项目方案

1.建立评论文本质量量化指标

对评论文本进行分析，评论文本质量量化指标主要考虑如下几个因素。
(1）主题覆盖量
主要考虑评论文本中对产品专有主题的覆盖情况。
(2）评论文本分词数量
评论文本写得越详细、内容越多，对访问者的帮助可能就越大，删除过渡词后，看剩余文本单词的数量，数量越多，该条评论的信息量就越大。
(3）评论点赞数
评论点赞数越多，该条评论对用户就越有用。
(4）评论中的照片数量
很好理解，有照片的评论显然要比没有照片的评论更加真实和有用。
(5）评论分值偏移
用户给该产品人为打的一个主观评价分，但并不是评分分值越高，该条评论的质量就越高，若用户的打分有失公允，那么该条评论的质量也就不算高了。

2.建立用户相似度模型

用户行为及用户属性，相似度计算，建立相似度模型

3.对用户评论进行情感性分析

基于词典的情感分析对评论文本进行分析。

9.2项目技术理论简介

9.2.1评论文本质量量化指标模型

1.主题覆盖量

指定五个主题，每个主题都有收集对应的相关词汇用于描述相关主题。每涉及一项主题为0.2，满分为1。

2.评论文本分词数量

去除停用词，得到相对真实的论文文本，然后分词，统计词频，最后计算五分位数，每个分位数区间的数从小到大赋予0.2、0.4、0.6、0.8、1分。

3.评论点赞数

计算评论点赞数，也计算五分位数，然后赋值0~1分。

4.评论中的照片数

有照片记为1分，反之为0。

5.评论分值偏移

评论分值偏移就是计算评论分值与所有评论中位数的偏移程度。首先计算所有评分的中位数，然后计算每个分值与中位数的差值绝对值，接着分别计算这些差值绝对值的20%、40%、60%、80%分位数，最后以如下标准计分（依中心递减）：在中位数加减20%分位数内为1分、在中位数减去40%分位数和中位数减去20%分位数之间及中位数加上20%分位数和中位数加上40%分位数之间的记为0.8分，以此类推，在每个区间依次递减0.6、0.4和0.2分，而之所以选择中位数作为中心点是为了防止异常值的影响，针对主题也可以与需求方商讨赋予不同的权重。

9.2.2用户相似度模型

用户相似度模型可以让用户优先看到与之相似的用户的评论数，关于相似度的计算，本质上就是计算两个向量的距离，两个向量的距离越近，它们的相似度就越大。

1.pearson相关系数

衡量两个定距变量线性相关性的统计量，优缺点：皮尔逊相关系数较易理解且计算方便，但是在使用过程中需要假设数据是成对地取自于正态分布，并且从指标的几何意义上来说，它反映了两个向量线性方向的相关关系（成比例关系），非线性的相关关系无法体现。

2.欧几里得距离

优缺点：欧几里德距离是所有距离公式中广为人知且最简单的一种，但是就大部分统计问题而言，其效果不甚理想。每个维度对其贡献都是相等的，并且容易受单位量纲的影响，没有考虑到总体变异对距离远近的关联。为了弥补单位量纲上的差异，可以先对每个维度做标准化处理，然后计算欧几里德距离。

3.夹角余弦相似度

与欧几里得距离不同，夹角余弦相似度侧重于两向量之间方向差异的度量，对量纲上的铭感度较小，所以适用于对绝对数值不敏感、主观评价等数据。

4.马氏距离

本质上是数据协方差距离，考虑了不同维度之间的关系。优缺点：马氏距离去除了各维度之间的相关性，这点也是马氏距离最大的优点。若两个向量中多个维度相关性较高，则某个维度的影响会被多次使用，这显然会对最后的结果产生误差。

9.2.3情感性分析

1.文本挖掘基础知识

（1）分词模型：最大概率模型、隐马尔科夫模型、混合模型
（2）词典：若干单词组成的库，可在知网词典获取停用词、副词、否定词

2.基于规则情感性分析方法

针对每个片段判断其情感极性得分，汇总计算得到情感累计得分：

3.词汇极性判断

介绍一种算法SO-PMI，可以有效地从大量词汇中找出那些接近正向或负向的情感词，然后人为地进行最终判定，从而大大减少人工识别的时间。具体步骤如下（选自《基于平滑SO-PMI算法的微博情感词典构建方法研究》）。

4.关键词提取

TF-IDF（词频-逆文档频率），依据TF给单词赋予IDF的权重，结果从大到小排序得到关键性排序列表，TF-IDF与词在文档中出现的次数呈正比，与该词在整个语句中出现次数成反比。这种算法的优点为：简单快速，结果比较符合实际情况。这种算法也有相应的缺点：单纯以“词频”衡量一个词的重要性不够全面，有时重要的词可能出现的次数并不多，而且这种算法无法体现词的位置信息，出现位置靠前的词与出现位置靠后的词，都被视为重要性相同，这是不正确的（一种解决方法是，对全文的第一段和每一段的第一句话给予较大的权重）。

9.2.4R语言实例代码

中文常用的是“jiebaR”程序包。

1.分词

worker()
type："mix"混合模型、"mp"最大概率模型、"hmm"HMM模型、"query"索引模型
dict：DICTPATH系统词典
hmm：HMMPATH，HMM模型路径
user：USERPATH用户词典
idf：IDFPATH ，idf词典
stop_word：STOPPATH停用词词典
write：T，是否将文件分词结果写入文件，默认为FALSE
qmax：20，最大成词的字符数，默认为20个字符
topn：5，关键词数，默认为5个
encoding：“UTF-8”，输入文件的编码，默认为UTF-8
detect：T，是否编码检查,默认为 TRUE
symbol：F，是否保留符号，默认为FALSE
lines：1e+05，每次读取文件为最大行数
output：NULL，输出路径
bylines：F，按行输出
user_weight：“max”，用户权重

#加载包
install.packages("jiebaR")
library("jiebaR")

#加载分词环境
wk<-worker()
wk['爸妈第一次出国，很放心，他们告诉我会很开心，我就心满意足了']
wk   #查看分词引擎配置

2.配置词典

show_dictpath()   #查看默认词典位置
dir(show_dictpath())    #查看目录

#打开系统词典文件jieba.dict.utf8，并打印前10行
scan(file="C:/Program Files/R/R3.2.5/library/jiebaRD/dict/jieba.dict.utf8",what=character(),nlines=10,sep='\n',encoding='utf-8',fileEncoding='utf-8')


#打开用户自定义词典文件user.dict.utf8，并打印前10行
scan(file="C:/Program Files/R/R3.2.5/library/jiebaRD/dict/user.dict.utf8",what=character(),nlines=10,sep='\n',encoding='utf-8',fileEncoding='utf-8')

3.增加自定义词典

需要针对添加某些特定的词，即用户自定义词典。（自定义词典在TXT文件中，需要UTF-8编码，词典中第一行读不进去，需要从第二行开始读）

#增加自定义词典
wk["我喜欢量子号的邮轮"]

#设定空间默认路径
setwd("C:\\Users\\用户路径")
#用户自定义词典名称
userdic<-'trip_dic.txt'
#加载分词引擎，导入自定义词典
wk = worker(user=userdic,bylines=TRUE,lines=5000000)
#分词
wk["我喜欢量子号的邮轮"]

4.增加停用词词典

进一步对文本数据进行处理

#用户自定义词典和停用词词典名称
userdic<-'trip_dic.txt'
stopword<-'stopword_adj.txt'
wk = worker(user=userdic,stop_word=stopword,bylines=TRUE,lines=5000000)   #加载分词引擎，导入自定义词典
wk["我喜欢量子号的邮轮"]

5.关键词提取TF-IDF

#jiebaR
 userdic<-'trip_dic.txt'     #用户自定义词典名称
 stopword<-'stopword_adj.txt'  
 wk <- worker(user=userdic,stop_word=stopword,lines=5000000)   #加载分词引擎，导入自定义词典
 segment<-wk["R的极客理想系列文章，涵盖了R的思想，使用，工具，创新等的一系列要点，以我个人的学习和体验去诠释R的强大。"]    #分词
 segment
  freq(segment)    #计算词频
keys<-worker("keywords",topn=5)   #设置关键词数量
vector_keywords(segment,keys)     #计算关键词分值

TF-IDF的计算

6.词性标注

SO-PMI算法的第一步是找出相应词性的词汇，可以在work函数中设置tag来输出词性。

#用户自定义词典名称
 userdic<-'trip_dic.txt'
 stopword<-'stopword_adj.txt'
 wk = worker(user=userdic,stop_word=stopword,"tag",lines=5000000)    #加载分词引擎，导入自定义词典
 segment<-wk["爸妈第一次出国，很放心，他们告诉我会很开心，我就心满意足了"]   #分词
segment

9.3项目实践

9.3.1若干自定义函数

1.数据清理

“脏数据”指类似于url、空格、换行符、时间、英文字母、空值、字符长度过小等。

######################################################################
#函数功能：清理文本数据
#参数说明text：文本向量
dataclean<-function(text){
     text<-  gsub(pattern="http:[a-zA-Z\\/\\.0-9]+","",text)   #去除url
     text <- gsub(pattern = " ", replacement ="", text)   #gsub是字符替换函数，去空格
     text <- gsub("\t|\r|\v|\f|\n|\\\t", "", text)        #有时需要使用\\\t    
     text<-  gsub(pattern="([0-9]{4}年)?([0-9]*月)?[0-9]{1,}日","",text)
     text<-  gsub(pattern="([0-9]{4}年)","",text)
     text<-  gsub(pattern="([0-9]{1,}月)","",text)
     text<-  gsub(pattern="[0-9]{1,}","",text)
     text <- gsub("[a-zA-Z]", "", text)   #清除英文字符
     text <- text[!is.na(text)]       #清除对应sentence里面的空值（文本内容），要先执行文本名  
     text <- text[!nchar(text) < 2]       #文本长度过小
     return(text)
}
##### 2.分句并打上相应标号

######################################################################
#函数功能：分片段并打上标识
#参数说明：text：文本向量
splitsentence<-function(text){
   commentdata<-data.frame(id=seq(1,length(text),1),term=text)
   commentdata$term<-as.character(commentdata$term)
   #以标点符号作为分隔符把句子分成片段
   subcon<-strsplit(text,",|\\.|!|\\?|;|~|，|。|！|\\？|；|～|…|﹏﹏|。。。。。。|\\.\\.\\.\\.\\.\\.")
   temp<-unlist(lapply(subcon,length))   #计算每条评论片段数
   id<-rep(commentdata$id,temp)    #生成每条评论标号，标号数量和片段数相同
   term<-unlist(subcon)       #把片段结果对象变成向量

   #打上分句id
   groupid<-function(x){
     subid<-seq(1:x)
     return(subid)
   }
   #生成片段标识
   subid<-paste(id,"-",unlist(lapply(temp,groupid)),seq="")
   subcondata<-data.frame(id=id,term=term,subid=subid)
   subcondata$term<-as.character(subcondata$term)
   subcondata$subid<-as.character(subcondata$subid)
   return(subcondata)
}

根据标点符号分段，为每个片段打上标签用于识别是否属于一条评论。

3.分词

######################################################################
#函数功能：分词
#参数说明：useridc：用户自定义词典文件名、stopword：停用词词典文件名、subdf：数据框，需要分词的数据，每一行为一条文本片段
library("jiebaR")
  segword_trn<-function(userdic,stopword,subdf){
  wk = worker(user=userdic,stop_word=stopword,'tag',bylines=TRUE,lines=5000000)     #载入分词空间
  tt<-wk[subdf$term]     #分词函数
  temp_fc<-unlist(lapply(tt,length))      #给每个分词标号
  id_fc<-rep(subdf[,"subid"],temp_fc)
  term_fc<-unlist(tt)
  segterm_fc<-data.frame(id=id_fc,term=term_fc,cx=names(unlist(tt)))
  segterm_fc$id<-as.character(segterm_fc$id)
  segterm_fc$term<-as.character(segterm_fc$term)
  segterm_fc$cx<-as.character(segterm_fc$cx)
  segterm_fc$id_tot<-as.numeric(unlist(lapply(strsplit(segterm_fc$id,'-'),function(x) x[1])))
  return(segterm_fc)
}

载入jiebaR包》载入分词空间及自定义词典和停用词词典》wk函数分词》打标号辨识是否为同一评论。

9.3.2文本质量量化指标模型

library("jiebaR")
library(plyr)
library(dplyr)

userdic<-'trip_dic.txt'        #用户字典
stopword<-'stopword_adj.txt'   #停止词
qualitydic<-'质量标准.csv'     #质量标准
qualityword<-read.csv(qualitydic,header=TRUE,stringsAsFactors=FALSE)    #导入质量指标相关词词典
content<-read.csv("评论数据.csv",header=TRUE,stringsAsFactors=FALSE)    #导入文本
commenttext<-content$term
commenttext<-dataclean(commenttext)   #数据清理
subcondata<-splitsentence(commenttext)   #分句并转换成数据框并且表上subid
segworddata<-segword_trn(userdic,stopword,subcondata)   #分词




#文本质量评分
#1、主题覆盖量
qualitterm<-join(segworddata,qualityword)
qualitynum<-as.data.frame(qualitterm %>% group_by(id_tot) %>% summarise(n_distinct(class,na.rm=TRUE)))
names(qualitynum)[2]<-"quality_num"
qualitynum$qualitynum_flag<-qualitynum$quality_num
attach(qualitynum)
qualitynum[which(quality_num == 1), ]$qualitynum_flag<-0.2
qualitynum[which(quality_num == 2), ]$qualitynum_flag<-0.4
qualitynum[which(quality_num == 3), ]$qualitynum_flag<-0.6
qualitynum[which(quality_num == 4), ]$qualitynum_flag<-0.8
qualitynum[which(quality_num == 5), ]$qualitynum_flag<-1
detach(qualitynum)


#2 文本分词数量
segwordnum<-as.data.frame(segworddata %>% group_by(id_tot) %>% summarise(n_distinct(term,na.rm=TRUE)))
names(segwordnum)[2]<-"segword_num"

segword_num<-segwordnum$segword_num
segword_num_q2<-quantile(segword_num,0.2)
segword_num_q4<-quantile(segword_num,0.4)
segword_num_q6<-quantile(segword_num,0.6)
segword_num_q8<-quantile(segword_num,0.8)
segword_num_q10<-quantile(segword_num,1)

segwordnum$segwordnum_flag<-segwordnum$segword_num

attach(segwordnum)
segwordnum[which(segword_num >=0 & segword_num <=segword_num_q2), ]$segwordnum_flag<-0.2
segwordnum[which(segword_num > segword_num_q2 & segword_num <= segword_num_q4), ]$segwordnum_flag<-0.4
segwordnum[which(segword_num > segword_num_q4 & segword_num <= segword_num_q6), ]$segwordnum_flag<-0.6
segwordnum[which(segword_num > segword_num_q6 & segword_num <= segword_num_q8), ]$segwordnum_flag<-0.8
segwordnum[which(segword_num > segword_num_q8 & segword_num <= segword_num_q10), ]$segwordnum_flag<-1
detach(segwordnum)



#3 评论点赞数
positive_num<-content$positivenum
positive_num_q2<-quantile(positive_num,0.2)+0.001
positive_num_q4<-quantile(positive_num,0.4)+0.001
positive_num_q6<-quantile(positive_num,0.6)+0.001
positive_num_q8<-quantile(positive_num,0.8)+0.001
positive_num_q10<-quantile(positive_num,1)+0.001

positivenum<-data.frame(id_tot=content$id,positive_num=content$positivenum,positivenum_flag=positive_num)

attach(positivenum)
positivenum[which(positive_num >=0 & positive_num <=positive_num_q2), ]$positivenum_flag<-0.2
positivenum[which(positive_num > positive_num_q2 & positive_num <= positive_num_q4), ]$positivenum_flag<-0.4
positivenum[which(positive_num > positive_num_q4 & positive_num <= positive_num_q6), ]$positivenum_flag<-0.6
positivenum[which(positive_num > positive_num_q6 & positive_num <= positive_num_q8), ]$positivenum_flag<-0.8
positivenum[which(positive_num > positive_num_q8 & positive_num <= positive_num_q10), ]$positivenum_flag<-1
detach(positivenum)


#4 评论中照片数量
photonum<-data.frame(id_tot=content$id,isphoto=content$isphoto,photo_flag=content$isphoto)

attach(photonum)
photonum[which(isphoto ==0), ]$photo_flag<-0
photonum[which(isphoto ==1), ]$photo_flag<-1
detach(photonum)


#5评论分值偏移
score_num<-data.frame(id_tot=content$id,score=content$score,score_flag=0)
score<-content$score
median_score<-median(score)
diffscore<-abs(score-median_score)

diffscore_q2<-quantile(diffscore,0.2)+0.001
diffscore_q4<-quantile(diffscore,0.4)+0.001
diffscore_q6<-quantile(diffscore,0.6)+0.001
diffscore_q8<-quantile(diffscore,0.8)+0.001
diffscore_q10<-quantile(diffscore,1)+0.001
###+0.001是为了避免集合空集的情况
attach(score_num)
score_num[which(score>median_score-diffscore_q2 & score<=median_score+diffscore_q2), ]$score_flag<-1
score_num[which((score>median_score-diffscore_q4 & score<=median_score-diffscore_q2)
                |(score>median_score+diffscore_q2 & score<=median_score+diffscore_q4)
               ), ]$score_flag<-0.8
score_num[which((score>median_score-diffscore_q6 & score<=median_score-diffscore_q4)
                |(score>median_score+diffscore_q4 & score<=median_score+diffscore_q6)
               ), ]$score_flag<-0.6
score_num[which((score>median_score-diffscore_q8 & score<=median_score-diffscore_q6)
                |(score>median_score+diffscore_q6 & score<=median_score+diffscore_q8)
               ), ]$score_flag<-0.4
score_num[which((score>median_score-diffscore_q10 & score<=median_score-diffscore_q8)
                |(score>median_score+diffscore_q8 & score<=median_score+diffscore_q10)
               ), ]$score_flag<-0.2
detach(score_num)



#6 整合评论分
qualityscore<-join(qualitynum,segwordnum)
qualityscore<-join(qualityscore,positivenum)
qualityscore<-join(qualityscore,photonum)
qualityscore<-join(qualityscore,score_num)
qualityscore<-qualityscore[,c("id_tot","qualitynum_flag","segwordnum_flag","positivenum_flag","photo_flag","score_flag")]

attach(qualityscore)
qualityscore$score_tot<-qualitynum_flag*0.3+segwordnum_flag*0.2+positivenum_flag*0.2+photo_flag*0.2+score_flag*0.1
detach(qualityscore)

qualityscore[order(qualityscore$score_tot),]

可以具体查看一下得分较高的评论原文。

9.3.3用户相似度模型

uiddesc<-read.csv("用户数据.csv",header=TRUE,stringsAsFactors=FALSE)   #导入用户特征数据

#计算欧式距离
eu_dist<-function(a,b){
  dist<-sqrt(sum((a-b)^2))
  return (dist)
}
sample_uid<-c(4,3,6,4)  #新用户
simindex_chain<-c()   #建立相似度初始向量
#计算新用户与每个评论用户相似度
for (i in 1:nrow(uiddesc)){
    eudist<-eu_dist(sample_uid,unlist(uiddesc[i,-1]))  ###欧式距离
    simindex<-1/(1+eudist)
    simindex_chain<-c(simindex_chain,simindex)
}

#相似度结果
simiindex_df<-data.frame(id=c(1:nrow(uiddesc)),simindex=simindex_chain)
simiindex_df[order(-simiindex_df$simindex),]

根据得分，用户将会优先看到排名在前面的用户的评论。

9.3.4情感词分析

1.导入评论数据并清洗分词

library("jiebaR")
library(plyr)
library(dplyr)
userdic<-'trip_dic.txt'        #用户字典
stopword<-'stopword_adj.txt'   #停止词
postivedic<-"postive.txt"      #正向情感词
negtivedic<-"nagative.txt"     #负向情感词
advworddic<-"程度副词.csv"     #程度副词字典
denyworddic<-"否定词.csv"      #否定词字典

#导入情感词并附上权重
postive=readLines(postivedic,encoding='UTF-8')
nagtive=readLines(negtivedic,encoding='UTF-8')
pos<-data.frame(term=postive,weight=rep(1,length(postive)))
neg<-data.frame(term=nagtive,weight=rep(-1,length(nagtive)))
posneg_tot<-rbind(pos,neg)

advword<-read.csv(advworddic,header=TRUE,stringsAsFactors=FALSE)   #导入程度副词、否定词
denyword<-read.csv(denyworddic,header=TRUE,stringsAsFactors=FALSE)

content<-read.csv("评论数据.csv",header=TRUE,stringsAsFactors=FALSE)  #导入文本
commenttext<-content$term

commenttext<-dataclean(commenttext)   #数据清理
subcondata<-splitsentence(commenttext)  #分句并转换成数据框并且表上subid
segworddata<-segword_trn(userdic,stopword,subcondata)   #分词

2.关联情感词、否定词和程度副词

#关联情感词、程度副词和否定词
tstterm<-join(segworddata,posneg_tot)
tstterm<-join(tstterm,advword)
names(tstterm)[length(names(tstterm))]<-"adv_score"    
tstterm<-join(tstterm,denyword,by='term')
names(tstterm)[length(names(tstterm))]<-"deny_score"
tstterm$adv_score[!complete.cases(tstterm$adv_score)]<--999
tstterm$deny_score[!complete.cases(tstterm$deny_score)]<--999
tstterm$id_tot<-as.numeric(gsub(" ","",tstterm$id_tot))

3.对片段进行窗口期判定及综合打分

#####################################################################
#函数功能：对片段进行情感性打分
#参数说明：idname：片段标号、fliename：带有否定词、副词和正负情感词的文本
word_segment <- function(idname,filename){ 
    #-- 打行号
    #抽取片段
    filepart = subset(filename,id==idname)
    #对片段中每个分词打上id
    wordfile = data.frame(
       filepart
      ,idx=1:nrow(filepart) )
    wordindex = wordfile$idx[!is.na(wordfile$weight)]        #找出正负情感词在片段中的位置
        #-- 上下限表
    citeration = data.frame(
                            wordindex
                           ,left  = wordindex-3
                           ,right = wordindex+3
                           ,leftidx = c(wordindex[1]-4,head(wordindex,-1))
                           ,rightidx = c(tail(wordindex,-1),wordindex[length(wordindex)]+4)
                           ,left_up=c(tail(wordindex-3,-1),wordindex[length(wordindex-3)]+3)
                           )

   #窗口期判定函数
   computevalue <- function(i,citeration,wordindex,filepart){
         left = ifelse(citeration$left[wordindex==i]<0,0,citeration$left[wordindex==i])
         right= citeration$right[wordindex==i]
         leftidx= ifelse(citeration$leftidx[wordindex==i]<0,0,citeration$leftidx[wordindex==i])
         rightidx= citeration$rightidx[wordindex==i]
         left_up=citeration$left_up[wordindex==i]
         wdidx=citeration$wordindex[wordindex==i]
  
         result = cbind(
                        ifelse(right<rightidx
                              ,max((filepart$adv_score[max(left,leftidx+1):max(wdidx,left_up-1)]),na.rm=T)
                              ,max(filepart$adv_score[max(left,leftidx+1):wdidx],na.rm=T)
                              )
                       ,ifelse(right<rightidx
                              ,max(filepart$deny_score[max(left,leftidx+1):max(wdidx,left_up-1)],na.rm=T)
                              ,max(filepart$deny_score[max(left,leftidx+1):wdidx],na.rm=T))
                              )
        return(result)
    }
                           
    #--计算值
    result = data.frame(t(sapply(wordindex,computevalue,citeration,wordindex,filepart)))
    names(result) = c('adv','deny')

    final_result = data.frame(
       id=idname 
      ,posneg=filepart$weight[wordindex]
      ,result
      )

    return(final_result)
}

#####################################################################
#函数功能：综合计算每条评论总得分
#参数说明：texttb：评论文本（打上情感词、否定词和副词标签后的）

#情感词综合打分
valuefun<-function(texttb){
  #抽取正负情感词所在的片段
  idnotnull<-data.frame(id=unique(texttb$id[complete.cases(texttb$weight)]))
  idnotnull$id<-as.character(idnotnull$id)
  tstterm_nnid<-join(texttb,idnotnull,type="inner")

  word_index<-unique(tstterm_nnid$id)
  
  system.time(score_combine<-lapply(word_index,word_segment,tstterm_nnid))
  score_combine_tb<-do.call("rbind", score_combine) 
  score_combine_tb$id<-as.character(score_combine_tb$id)
  score_combine_tb$adv[score_combine_tb$adv==-999]<-1
  score_combine_tb$deny[score_combine_tb$deny==-999]<-1
  score_combine_tb$value<-score_combine_tb$posneg*score_combine_tb$adv*score_combine_tb$deny
  subconvalue<-aggregate(score_combine_tb$value,by=list(score_combine_tb$id),sum)
  subconvalue$idtot<-as.numeric(unlist(lapply(strsplit(subconvalue$Group.1,'-'),function(x) x[1])))
  commentvalue<-aggregate(subconvalue$x,by=list(subconvalue$idtot),sum)
  names(commentvalue)[1]<-'id'
  commentvalue$x<-round(commentvalue$x,2)
  return(commentvalue)
}
system.time(valuetb<-valuefun(tstterm))

9.3.5总结

至此，可以根据用户相似度，让用户看到与他相似用户的评论，并且可以按照文本质量评分及情感性分值根据产品策略进行排序。从技术运维的角度来说，算法的结束并不是技术的终结，后期自定义词库及调整打分权重都需要分析师根据实际样本做出调整，在数据分析领域永远没有完结的项目，除非业务被终结了。

你可能感兴趣的:(R语言资料实现,r语言,数据分析,开发语言)

？？？实现高可用的故障转移策略的工具——Keepalived（含数据库的主从复制、MHA高可用简单配置） Lotus 沈棋 Linux运维_架构运维架构 keepalived
文章目录一、高可用与keepalived介绍1、什么是高可用2、实现高可用的技术1).负载均衡器2).故障转移工具3).数据库高可用性4).存储高可用性5).监控与报警工具6).云服务高可用性3、Keepalived介绍0-1）Keepalived是什么、功能介绍：Keepalived的功能*注：Nginx和LVS在负载均衡上使用的区别：实际应用场景*注：具体如何使用Keepalived和LVS进
【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
540. 有序数组中的单一元素含泪若笑
这道题用二分查找的话需要注意间隔，因为有相同的元素在一起，还有就是要判断好单个的元素在哪里。第一种我看了官方的，觉得比较容易理解和想到，就实现了一下：思路就是判断中间元素是和前一个相等还是后面的相等，1如果和后面的相等，后面的元素以middle为分界点还是偶数个的话，那就说明单个元素在后面，因为我们需要去掉middle的下一个元素去考虑；2如果和前面的相等，后面的元素以middle为分界点还是偶数
费曼学习法—有效输出的方法之一 Sandy时间管理导师
一个知识点如何是真的学到了，并且能掌握的很牢靠，最能给学以致用的方法就是用输出倒逼输入才能做到真正的学以致用。那么如何有效的输出呢？费曼学习法，这个方法简单来说就是通过自己的语言，用最简单的话把一件事情讲清楚，外行人也能听的懂，它看似是我们用直白浅显的语言，把复杂深奥的知识传输给了别人，这个方法之所以能成为世界公认最好的学习法，是因为真的有很多人因为这个方法实现了逆袭，而且真正受益的却是我们自己。
精选推荐：返利APP排行榜前十，优惠力度大比拼优惠券高省
省钱达人必备！返利APP排行榜前十深度推荐在这个物价飞涨的时代里如何成为一名真正的省钱达人？答案或许就藏在返利APP排行榜前十之中。这些应用不仅汇聚了海量的优惠信息和返利政策更通过智能推荐和个性化服务为用户打造了一个专属的省钱购物平台。今天我们就来为大家深度推荐这些优秀的返利APP带你一起探索省钱购物的奥秘让你在享受购物乐趣的同时也能轻松实现省钱目标。大家好，我是高省的波西导师。在开始本文的交流之
PHP面向对象进阶：抽象类、接口与类型声明软考和人工智能学堂 PHP和MySQL php程序设计 android 前端
引言在PHP面向对象编程中，抽象类、接口和类型声明是构建可扩展、可维护应用程序的重要工具。本文将深入探讨这些概念，展示它们如何帮助开发者创建更健壮的代码结构。抽象类（AbstractClasses）抽象类是不能被实例化的类，它定义了子类必须实现的方法模板。基本抽象类示例abstractclassAnimal{protected$name;publicfunction__construct($nam
Python.03 唯怡委员 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程是Linux中资源分配的基本单位，代表程序在内存中的执行实例，拥有独立的地址空间和系统资源。通过ps、top命令查看，kill命令终止，或使用systemctl管理服务进程。线程是进程内的轻量级执行单元，共享进程资源（如内存），切换开销小。Linux通过POSIX线程（pthread）库实现，可用htop查
大数据领域数据架构的实时数据可视化架构 AGI大模型与大数据研究院 AI大模型应用开发实战信息可视化大数据架构 ai
大数据领域数据架构的实时数据可视化架构关键词：大数据架构、实时数据处理、数据可视化、流式计算、数据管道、可视化工具、性能优化摘要：本文深入探讨了大数据领域中实时数据可视化架构的设计与实现。我们将从基础概念出发，逐步分析实时数据处理流程，介绍关键技术和工具，并通过实际案例展示如何构建高性能的实时可视化系统。文章将涵盖数据采集、处理、存储和可视化展示的全链路架构，同时讨论性能优化策略和未来发展趋势。1
uniapp调用高德api zhcinit0 uni-app 小程序前端 vue.js
主要包含：1、uniapp调用高德地图的微信sdk2、实现坐标和经纬度互相转换功能3、实现关键字检索功能说明：页面以uniapp编写，使用uniapp官方map组件，cover-view处理原生组件层级问题。以下是单个页面布局和业务逻辑:{{inputInfo}}详细地址：{{description}}保存{{i.name}}importWhiteHeadfrom'../../components
雅思G类作文
目录（一）建议信（二）申请信（三）投诉信（四）问询信（五）推荐信（六）请求信（七）感谢信（八）邀请信（九）谢绝信（十）日常信雅思A类作文主要针对申请留学的考生，G类作文主要面向计划移民或参加工作培训的考生。G类考生只占5%，找到的资料也不多，文末会分享一篇资料，其中有更多题目可供练习。（一）建议信题目：Ahotelyoustayedinrecentlyaskedgueststowritetothe
【中国电信运营商MBOSS】 flyair_China 数据分析
一、中国电信运营商MBOSS1.1中国四大电信运营商MBOSS1.1.1背景传统运营商系统存在"业务-运维-管理"功能混杂的痛点，导致：-业务响应速度慢（新套餐上线需跨多部门）-运维效率低下（故障定位平均耗时超2小时）-管理决策滞后（经营数据统计延迟达24小时）通过域划分可实现：✅功能解耦：各域专注核心职责✅数据贯通：跨域信息实时交互✅敏捷迭代：单个系统升级不影响全局域"角色定位"域分类服务对象核
uniapp实现自定义图片预览手势缩放滑动下一页等(精简版,原生微信小程序同理) 争取一行微信小程序 uni-app uni-app 微信小程序 javascript
直接上代码<imageclass=
适合宝妈在家做的副业赚钱方法有哪些？盘点宝妈在家可做的六种赚钱方法高省APP大九
作为宝妈，您可能需要在照顾家庭和孩子的同时，也想要找到一种方式增加家庭收入。随着互联网的普及，越来越多的宝妈选择在家做副业来实现这一目标。本文将为您介绍几种适合宝妈在家做的副业赚钱方法，帮助您找到适合自己的赚钱途径。一、电商推广与社交分享电商推广与社交分享是另一种适合宝妈在家做的副业赚钱方式。您可以利用自己的社交圈，通过微信、微博等社交平台分享优质商品链接或优惠券，引导朋友和家人购买。一旦他们通过
【用unity实现100个游戏之34】使用环状（车轮）碰撞器（Wheel Collider）从零实现一个汽车车辆物理控制系统，实现一个赛车游戏向宇it 【制作100个Unity游戏】unity 游戏汽车游戏引擎 3d 材质
最终效果unity赛车效果文章目录最终效果前言一、WheelCollider参数介绍1、基础参数2、SuspensionSpring：悬挂弹簧2.1spring支撑悬挂的弹力2.3damper减震2.4targetposition：表示车轮静止时处于的悬挂上的位置3、forwardfriction前向摩檫力和sidewaysfriction侧向摩檫力二、准备工作1、下载素材2、给车辆添加Rigid
【gateway网关】叫我李老板 gateway 学习 php
网关的核心功能网关（Gateway）作为网络架构中的关键组件，主要承担不同协议或网络之间的数据转换与路由功能。以下是其核心功能的详细说明：协议转换与适配网关能够连接使用不同通信协议的网络或系统，实现数据格式的转换。例如将HTTP请求转换为gRPC协议，或处理SOAP与RESTfulAPI之间的互操作。这种能力在混合云环境或遗留系统集成中尤为重要。流量路由与负载均衡基于请求内容（如URL路径、HTT
广东科德投资服务费怎么退?答案是:可以退! 申请退款流程公布!有法可依！成功退费方法及案例讲述法律维权小卫士
在投顾公司服务费是可以退的。如果认为投顾公司存在违规操作或欺诈行为或者承诺的收益未能实现、服务内容与宣传不符、投顾建议缺乏准确性等，可以通过有效的退款流程来申请退回服务费。结尾咨询法助顾问退款流程具体退款流程可能包括提交相关的聊天记录和交易证据，签署退款文件并填写到账信息等步骤。完成这些步骤后，服务费用将会在约定的时间内原路退回。同时，根据《消费者权益保护法》的相关规定，消费者在购买、使用商品和接
树立管道思维，把握你的生命线清荷_b306
《管道的故事》-树立管道思维，把握你的生命线01.今日导读亲爱的同学们，很高兴遇见你，我是简老师。今天继续为你解读《管道的故事》这本书的第二部分内容。昨天，我们通过管道的故事，重点向大家介绍了提桶思维和管道思维。知道了要想实现财务自由，就要拥有可靠的管道收入，否则，月薪再高也无用。一旦失去工作，就会失去收入来源。那么，我们该如何改变原有的思维，从而去掌控自己的生命线呢？今天，我们继续在《管道的故事
并发编程原理与实战（十八）ReentrantLock API全面解析
上一篇讲解了Lock接口核心API和相比于synchronized的关键优势，本文来进一步学习Lock接口的具体实现类ReentrantLock。认识ReentrantLock基本行为和语义下面我们先看ReentrantLock的定义。/***Areentrantmutualexclusion{@linkLock}withthesamebasic*behaviorandsemanticsasthe
从0到1解析微信推客小程序源码与实现指南开发加微信：hedian116 微信小程序架构
一、什么是微信推客小程序微信推客小程序是一种基于微信生态系统的社交电商工具，它允许用户通过分享商品链接或小程序页面来推广商品，并在交易成功后获得相应佣金。这类小程序通常包含商品展示、分享功能、订单跟踪和佣金结算等核心模块。二、推客小程序的核心功能模块用户系统：微信授权登录用户身份识别（普通用户/推客）个人信息管理商品展示模块：商品分类浏览商品详情页搜索功能推广功能：生成专属推广链接分享到微信好友/
UniApp TabBar 用户头像方案：绕过原生限制的实践金翅 uni-app
需求场景：在UniApp项目中，需要将TabBar首页项(index)的图标替换为当前用户的网络图片，并实现：放大且圆形显示。点击该图标时，页面滚动回顶部。切换到其他分类时，首页Tab项恢复为普通首页图标。尝试方案与问题：自定义TabBar：○可实现功能：网络图片、样式定制、点击事件。○致命缺点：页面切换时TabBar闪烁，页面重新加载，体验极差。❌放弃原生TabBar：○优点：切换流畅无闪烁，体
uniapp相关地图 API调用 cherishSpring uniapp uni-app apache 服务器
目录一、注意事项：manifest.json需增加配置二、获取用户收货地址[uni.chooseAddress]三、获取当前的地理位置、速度[uni.getLocation]四、打开地图选择位置、查看位置(导航)[uni.chooseLocation][uni.openLocation]五、使用腾讯地图逆地址解析接口实现城市自动定位回显一、注意事项：manifest.json需增加配置"mp-we
优惠券返利大揭秘：如何利用优惠券返利平台赚取额外收入高省APP大九
在当今的消费社会中，优惠券返利平台正成为越来越多消费者节省开支、增加收入的新途径。这些平台不仅为消费者提供了大量的优惠券，还能在购物后返还一部分金额，实现了真正意义上的“购物即赚钱”。那么，如何利用这些优惠券返利平台赚取额外收入呢？下面就来为您揭秘。大家好！我是高省APP最大团队&联合创始人蓓蓓导师！【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。
从零到百万用户：推客小程序开发全栈指南 ywyy6798 推客系统开发推客小程序开发推客小程序推客系统推客分销推客分销系统推客分销系统开发
一、推客小程序概述推客小程序是一种基于微信生态的社交电商工具，它结合了社交分享与电商功能，让用户可以通过分享商品链接获取佣金，实现"自购省钱，分享赚钱"的商业模式。这类小程序在近年来发展迅猛，成为许多商家拓展销售渠道的重要方式。推客小程序的核心功能特点：商品展示与推荐：精选商品展示，支持分类浏览社交分享功能：一键分享商品到微信好友、朋友圈佣金体系：清晰的佣金计算与结算规则订单追踪：实时追踪推广效果
推客系统开发全攻略：从架构设计到落地实现
一、推客系统概述与市场背景推客系统（也称为"推客营销系统"或"社交电商系统"）是近年来随着社交电商崛起而迅速发展的一种新型营销工具。该系统通过将传统电商与社交网络相结合，利用用户的社交关系链进行商品推广，实现裂变式增长。市场现状分析：全球社交电商市场规模预计2025年将达1.2万亿美元中国社交电商用户规模已超7亿，渗透率达60%以上头部平台如拼多多、小红书等已验证推客模式可行性推客系统核心价值：降
推客小程序系统开发全面解析：从0到1构建社交电商平台 ywyy6798 大数据短剧小程序开发推客系统推客小程序推客系统开发推客小程序开发
一、系统概述与市场背景推客小程序是近年来在微信生态中迅速崛起的社交电商模式，它通过"分享赚钱"的激励机制，将普通用户转化为产品的推广者，形成病毒式传播效应。这类系统特别适合中小型企业、个体商户以及内容创作者，能够以较低成本实现用户增长和销售转化。1.1推客模式的核心价值对于商家：降低获客成本，利用用户社交关系实现精准营销对于推广者：通过分享商品获得佣金收益，实现副业创收对于消费者：通过熟人推荐获得
hadoop 集群问题处理一切顺势而行 hadoop 大数据分布式
1.1.JournalNode的作用在HDFSHA配置中，为了实现两个NameNode之间的状态同步和故障自动切换，Hadoop使用了一组JournalNode来管理共享的编辑日志。具体来说，JournalNode的主要职责包括：共享编辑日志：JournalNode节点组成了一个分布式系统，用于存储HDFS的编辑日志（EditLogs）。这两个日志文件记录了对HDFS所做的所有更改，如文件创建、删
C++11与MFC多线程控制：暂停与继续实践征途阿韦
本文还有配套的精品资源，点击获取简介：本项目深入探讨了在C++编程中，特别是在MFC框架下，如何管理和控制线程的暂停、继续和退出。涵盖了C++11标准库中std::thread的使用以及在MFC中CWinThread的继承和Run方法的重写。介绍了使用同步对象如条件变量、事件和信号量等实现线程暂停与继续的策略，并强调了线程退出的正确方式和多线程编程中的挑战，如同步、通信、避免死锁和竞态条件。1.C
Windows安装子系统部署服务并实现外部访问，WSL安装Ubuntu、CentOS、openEuler子系统，最全保姆级教程，手把手教会你。 Mr.L-OAM linux系统运维服务器运维
1环境准备1.1系统设置打开powershellwin+r输入poweroff如果后面操作提示需要提升权限，此处在搜索栏输入powershell右键以管理员身份运行官网文档1.1.1适用于Linux的Windows子系统dism.exe/online/enable-feature/featurename:Microsoft-Windows-Subsystem-Linux/all
出租车智能4G视频监控管理解决方案索迪迈科技车载监控录像机人工智能客流统计计算机视觉远程监控
一、方案背景随着城市交通的不断发展，出租车作为城市公共交通的重要组成部分，其运营安全和服务质量备受关注。为了加强对出租车的管理，提高运营安全性，提升服务质量，同时保障乘客和司机的合法权益，建立一套高效的出租车视频监控管理系统具有重要意义。二、系统概述本出租车视频监控管理解决方案旨在通过在出租车上安装视频监控设备，实现对车辆内外情况的实时监控、录像存储、数据传输以及远程管理。系统主要由车载终端设备、
英伟达：要取代我？其实CUDA也支持RISC-V EEPW电子产品世界 risc-v
第五届RISC-V中国峰会于2025年7月16至19日在上海张江科学会堂隆重举办，在峰会的圆桌讨论中，主持人曾经提出这样一个问题：你认为RISC-V未来会取代GPU吗？在现场观众投票中，支持会取代的现场观众占据将近半数。不过在随后的主题演讲中，英伟达副总裁FransSijstermanns特别提到了英伟达在自家的计算平台实现了RISC-V应用处理器部署。在做这次演讲准备的时候，FransSijst
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那