詹sir的BLOG

关于在线评论有用性的论文研读笔记---41-50篇

41.The power of numbers: an examination of the relationship between numerical cues in online review comments and perceived review helpfulness. (Journal of Research in Interactive Marketing)

42.Emotions for attention in online consumer reviews: the moderated mediating role of review helpfulness. （Industrial Management & Data Systems）

43.Elaboration likelihood model, endogenous quality indicators, and online review helpfulness. (Decision Support Systems)

44.Prediction and modelling online reviews helpfulness using 1D Convolutional Neural Networks. (Expert Systems with Applications)

45.Complementary or Substitutive? A Novel Deep Learning Method to Leverage Text-image Interactions for Multimodal Review Helpfulness Prediction. (Expert Systems with Applications)

46.The Role of Sentiment Tendency in Affecting Review Helpfulness for Durable Products: Nonlinearity and Complementarity. （Information Systems Frontiers）

47.Mining the determinants of review helpfulness: a novel approach using intelligent feature engineering and explainable AI. (Data Technologies and Applications)

48.A prediction framework on the helpfulness of reviews for processing Chinese and English hotel reviews. （International Journal of Contemporary Hospitality Management）

49.I Like My Anonymity: An Empirical Investigation of the Effect of Multidimensional Review Text and Role Anonymity on Helpfulness of Employer Reviews. （Information Systems Frontiers）

50.How does mobile device usage influence review helpfulness through consumer evaluation? Evidence from TripAdvisor. （Decision Support Systems）

41.The power of numbers: an examination of the relationship between numerical cues in online review comments and perceived review helpfulness. (Journal of Research in Interactive Marketing)

这篇文章主要从文本特征方面去研究在线评论有用性的，但是在大数据背景下这篇文章不一定实用，这篇文章也是采取问卷调查的形式来做的研究。文章基于SOR（刺激-组织-反应）模型和线索总和理论来说明了数字信息以及消费者心理反应对评论有用性的作用。文章假设评论文本中包含数字能影响评论有用性、数字可以激发阅读者的信任和认知从而提高评论有用性。

实验的方法也很简单，首先是经典问卷调查，积极消极评论、带数字不带数字分开四条评论，首先做个预实验，先评价一下积极评论与消极评论的有用性水平，确定有区别后然后再去评价有无数字的区别。结论自然是有数字的评论更加有用。

第二个实验则是用问卷星去收集数据，主要是想看看认知层面和信任层面对评论有用性的影响，然后跑了一个线性回归得出认知层面和新人层面会影响评论有用性，中介效应跑了个我看不懂的模型，效果也显著。

总的来说这种问卷型的文章都比较好懂，但是在大数据背景下，这个特征是否实用还是打一个问号的，因为我去某东上看了一些评论，基本都不包含数字，而且怎么提取数字特征也要打一个问号。嗯，就扯这么多把。

42.Emotions for attention in online consumer reviews: the moderated mediating role of review helpfulness. （Industrial Management & Data Systems）

这篇文章在研究评论有用性的基础上，同时进一步研究了评论有用性对评论参与度的影响。文章采用了豆瓣的影评来进行研究，文章采取爬虫爬取了总计5万条评论。

文章的研究分了两块，第一块是评论有用性的研究，因变量文章选择了文章受到的总有用性投票，自变量的选择上文章选择了积极情感词的占比和消极情感词的占比、评论者专业知识以及常见的控制变量，包括长度、极性、极性方差、是否有图片、设备、注册年限、粉丝数量、好友数量等。在模型的选择上文章采用了负二项回归来进行拟合，结果也很Nice。

在评论有用性上，正向情感对评论有用性起负向作用，负面情感对评论有用性起积极作用。评论者约有经验，则该评论者书写的评论中积极情感表现的作用更强，负向情感作用更弱。模型3和4则表明评论情感对评论参与度也有显著影响。

同时文章也证明了积极情感和消极情感通过评论有用性的中介作用来间接影响评论参与度，并且影响都是负向的。文章进一步分析了评论情感只有在程度高时才会有显著的负效应，低情感和中性情感都不会显著的影响的评论参与度。

总结一下，这篇文章模型分析的方法值得学习，首先是常规的负二项回归然后是路径分析，然后是调节效应的研究厘清了三种情感程度对评论参与度的影响。还有就是作图方法，如下图所示，这是其他论文中很常见的一种可视化方法，可以在论文中学习。

43.Elaboration likelihood model, endogenous quality indicators, and online review helpfulness. (Decision Support Systems)

这篇文章也是研究评论有用性影响因素的文章，这篇文章基于ELM模型来分析评论有用性，ELM模型指出评论阅读者阅读一条评论时有两条分析路径，分别是中心路径和外围路径，文章分析指出质量指标和情感指标在传统是都是启发式线索，但是随着评论阅读者的深入思考一条评论之后，这些启发式线索就会变成中心线索，需要阅读者进行思考，因此文章提出了一个修正的ELM模型，同时提出了两个问题：未观察的质量特征和不同情绪水平的情感如何影响评论有用性。

有用性的文章分析框架比较流程化，自变量、因变量、模型。因变量文章采用了有用性投票的总数。自变量则包含四部分，未观察的质量特征、质量特征、情感特征和控制变量，文章的分析模型中比较费解的就是为观察到的质量特征。可观察的质量特征包括：长度、可读性、主题包含数、评论者排名。情感特征首先文章考虑了正负情感，其次考虑了情感的情绪程度，不管是积极情感还是消极情感，情感词语中包含的情绪程度是不同的，这是这篇文章的一个创新点，不过AROUSAL这个维度在NLP中怎么去度量的文章说的好像不是很清楚，也可能是我没有看懂，但是这个还是很值得学习的新特征。重头还是未观察的质量特征，这篇文章考虑了内生性的问题，解决内生性问题传统计量经济学采用的是工具变量法，但不是很方便，这篇文章不用工具变量法，直接从质量特征中提取了新变量作为未观察的质量特征，最终模型的结果也很nice。

文章获取了三个网站的三个数据集，因此模型结果有三个，最终结果现实情感的情绪分类对有用性是有显著预测作用的，同时未观察的质量特征中长度和排名也是显著的。文章的主题提取结果并不显著，文章用了NMF的方法去提取主题结果效果并不是很好，但是可能也有模型的限制因素在里面，后面可以考虑机器学习的方法来进行分析。

总的来讲文章的情感特征提得很不错，内生性特征的提取也很具有启发性，行文思路也很清晰，值得学习。

44.Prediction and modelling online reviews helpfulness using 1D Convolutional Neural Networks. (Expert Systems with Applications)

这篇文章从机器学习的角度去分析了在线评论的有用性，这种类型的文章我之前读的比较少，因此这篇文章我认真的研读了一番。过去研究评论有用性的文章都是从评论文本的特征出发，尽可能的从评论文本、评论者特征等方面去提取出可能影响评论有用性的特征，并构建模型来对评论有用性进行预测，但是过去更多的研究采取的线性模型，也有支持向量机、随机森林等非线性模型的引入来进行预测，很少有从神经网络方面对评论有用性进行研究的。这篇文章采用了神经网络中比较经典的CNN进行研究。

CNN在计算机视觉领域有广泛的应用，在自然语言领域也可以采用1D-CNN进行模型的训练。文章首先对常见的文献进行了一个很系统的总结，分别从数据来源，产品类型以及文献所采用的各种特征来进行分析，第一张图是特征提取方面的文献，基本都是采用TOBIT回归模型。第二张图是采用机器学习方法来进行模型训练的。从文献方面来说，用神经网络来训练模型的还是比较少的。

这篇文章采用了WORD2VEC、CNN、DENSE LAYER的网络结构来进行模型训练，在线评论的数据来源是Ciao，文章收集了1千多条的评论，然后经过数据清洗后，再经过词向量训练，然后丢进模型进行训练，训练中还有很多细节，比如训练集、测试集划分，网络参数的设定等。

训练集的准确率接近80%表现还行，但是文章更深入一步，文章指出之前的研究注重了训练的效果，没有对W2V训练出来的特征所反应的评论内容进行更深一步的研究，文章利用PCA的方法将W2V的特征压缩成2维，然后画在图上看分类的情况，然后利用KMeans聚类将样本聚成了4类，文章分类后利用TF-IDF的方法提取出每一类文本中的关键词，来分析由CNN学习到的特征进行聚类的效果。

总而言之，文章利用机器学习的方法对评论有用性进行研究值得学习，在未来的改进上可以采用GLOVE,FASTTEXT等词向量学习方法来进行研究。

45.Complementary or Substitutive? A Novel Deep Learning Method to Leverage Text-image Interactions for Multimodal Review Helpfulness Prediction. (Expert Systems with Applications)

这篇文章是从深度学习的视角去研究评论有用性的，和以往的文章的研究范式不一样，以前的文章是通过提取评论文本或者评论者的特征，构成面板型数据然后采用机器学习的方法或者计量经济学的方法来进行模型训练。而深度学习对文本的处理则是先将评论文本用词嵌入的方法先将文本表示成向量，然后用神经网络的模型来进行训练。

第44篇文章是单独从文本的角度出发，利用W2V模型学习出词向量，然后用CNN/DNN的方法去进行学习，现在这篇文章的技术就比较硬核，这篇文章不仅考虑了文本，而且考虑了图片，之前其实也有考虑了图片的深度学习的文章，可以看我之前博客的第11篇论文，那篇文章的做法就比较取巧，直接将词向量和图片标签的词向量拼成一个矩阵，然后直接跑模型进行拟合。

首先先看看这篇文章的架构图，先文本预处理，然后用预训练好的VGG16和BERT模型来对图片和文本进行学习，文章这里有点模糊，没有说明预训练的详细过程，预训练也是一块很重要的内容，我对深度学习这块也不是很了解，后面再来学习填补这一块知识。然后学习到向量之后再用LSTM和注意力机制把最终的向量表示出来。最后一层由两个损失函数，一部分是补充效应损失函数，另一部分是替代效应损失函数，这是这篇文章的创新点，能够学习出评论文本与评论图片的交互效应，之前的文章从来没有研究过评论文本与评论图片的交互效应的，其实这在面板数据特征提取方面可以很好的进行参考一下。

然后在基线模型上，文章5.2部分说的很明白，很多我就不赘述了，最终的结果是本文自创的CS-IMD方法取得了最好的AUC成绩，同时文章更进一步，用各种基线模型表示出来的特征放入传统的机器学习模型中进行拟合训练，这里应该就是表示学习的内容了，一直在听表示学习但是不知道是什么意思，这篇文章让我悟了一下，文章最终的结果是用CS-IMD进行表示学习的结果然后丢进XGB里表现的结果是最好的。同时文章也进行了很多灵敏度分析，这里不再赘述。

这篇文章是复旦大佬写的，技术涉及很多我的盲区，不管是行文、理论还是结果都是相当NICE的，只是很勉强的看懂了在干嘛，后面技术好了可以再回来研究研究。

46.The Role of Sentiment Tendency in Affecting Review Helpfulness for Durable Products: Nonlinearity and Complementarity. （Information Systems Frontiers）

这篇文章是比较经典的研究评论有用性的文章，整体文章难度不是很高，研究范式也比较规范，这种文章我的研读思路就是看他的自变量、因变量、模型、研究假设以及结论和结果。这篇文章是为了研究评论感情倾向对顾客满意度和评论有用性的影响，情感倾向对这两个因变量有线性的效用和非线性的效应，评论长度对评论有用性的影响前面的文章已经研究的很通透了，有线性、非线性还有研究评论长度阈值的，研究还是很丰富的。

首先是文章的数据来源，文章采用了汽车之家的68万条评论数据来进行研究。其次是文章的自变量，首先是情感取向（直接用SNOWNLP提取情感概率标签），长度、平均句子长度、汽车历程、汽车价格、是否有回复、评论时间。因变量是投票比例和满意度，投票比例是用浏览量做分母，满意度是顾客对汽车八个方面的星级评分的平均数。

从自变量上看是没有什么新式的，文章研究了顾客情感对满意度和有用性的影响，同时研究了长度对有用性的影响，同时还研究了满意度与长度和情感的交叉项对评论有用性的影响，最后一个研究是文章的创新点，第45篇文章研究了评论图片和评论文本的互补效应和替代效应，这个效应在计量文章中还比较少见，这篇文章就研究了情感取向、长度和满意度的交互效应。

在模型上，文章选择了OLS回归来做研究，最终文章得出结论顾客的情感取向和满意度是有互补作用的，高的情感取向和情感满意度能更好的提高评论的有用性。但是评论长度的交互效应并不显著。得出的结论还是很漂亮的

文章的计量模型表格很多，很多结论之前的研究都有，创新在于交互效应的研究以及对顾客满意度的研究。后面的研究中可以去研究更多的交互效应，很有启发性。

47.Mining the determinants of review helpfulness: a novel approach using intelligent feature engineering and explainable AI. (Data Technologies and Applications)

这篇文章也是一篇从机器学习的角度去探讨评论有用性的文章，从标题可以看出这篇文章强调了特征工程以及机器学习模型的可解释性，机器学习模型具有很强的预测能力，但是和计量经济学模型不同，计量经济学模型得到的结果可以从多个方面去解释一个特征，能够得到特征对于因变量的明显含义，具有很强的可解释性，但是机器学习模型对于模型的特征却很难得进行解释，因此这是机器学习方法得一个弊端，但是其强力的预测能力又让许多学者想要尝试去破解这个黑箱，这篇文章就是在进行了特征工程以及模型训练之后，对模型进行了解释，这是这篇文章的一个创新点。

文章首先从TRIPADVISOR中爬取了38000多条评论数据，然后通过特征工程的方式提取了一系列的自变量，包括排名、星级、星级极性、评论者特征等常见特征，在情感方面有VADER/SENTINET/BERT提取了三种情感打分值，还有可读性指标、拼写错误率和评论中提及的产品属性。

文章的因变量就是有用性投票总数，这篇文章的一个重头戏是放在机器学习模型的解释以及可视化上面，这篇文章画了很多可视化图形，每一张图我都花了点时间去研究了一下。

这幅图是评论星级不一致性以及相应的评价有用性投票折线图，左边是实际均值，右边是预测均值，可以看出负面评论的有用性投票均值是会高于正向评论的。

然后是一个气泡图，横轴是评论者历史平均有用性投票，纵轴是评论极性，气泡大小代表了数据集样本量的大小，颜色的深浅代表了有用性投票预测值的大小，可以看出评论者专业水平是会影响到有用性投票的，同时评论极性也有比较明显的影响。

然后是一幅情感取向对评论有用性的影响，可以看出情感越负向，对评论有用性的影响就越大。当然我不知道这幅图应该叫做什么图。

然后是一幅用LGBM跑的一个特征重要性图。

以及用SHAP画的一个特征重要性的影响图。红色代表对评论有用性的积极影响，反之消极，可以去分析每个特征对评论有用性的影响。例如评论长度，越长就对评论有用性的影响更显著。同时文章还做了各个模型的特征重要性排名图。

总而言之，文章的创新点在于用BERT提取了感情得分，并且对机器学习模型进行了解释，可以从这篇文章看出，一些在计量经济学中显著的特征可能在机器学习模型中并不重要，因为机器学习模型能够学习出特征于因变量之间复杂的非线性关系，在实际工作中准确的预测能力是至关重要的，因此我们在注重解释性的同时也要去提取能够提高模型表现的特征。这篇文章对我的启发性很大。

48.A prediction framework on the helpfulness of reviews for processing Chinese and English hotel reviews. （International Journal of Contemporary Hospitality Management）

这篇文章是从机器学习的视角去研究评论有用性的，同时和以前的文章不同，文章的数据采集了中文和英文两种数据集，然后借助霍夫斯泰德文化五维度理论以及模型特征重要性去解释了为什么两个不同文化属性的国家在评论有用性的判定模式上存在区别。

这篇文章的插图除了这个框架图基本都放在附录里面，看的很难受，看评论有用性的文章首先我先看了文章选取的因变量，因变量的度量方式文章总结了有四种：有用性投票总数、有用性投票比例、二分类以及语义相似度度量。文章采用了有用性投票除以评论发布时间并进行有用性阈值分类的方式，一方面避免了发布时间对投票总数的影响，另一方面变成了二分类问题。

在因变量上，文章选择了三方面内容，分别是酒店、评论、评论者三方面的特征，特征都是常规特征，但是一个问题是不同的语言不能放在同一个程序中去度量，因此textblob/snownlp/jieba等程序库被用来度量不同的特性，主观性上采用了刘焕庸的主观性度量库，这个在之前的一篇中文文章中有提到过，这篇文章给出了Github地址，比较良心（GitHub - liuhuanyong/ZhuguanDetection: Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。），因此文章处理不同文字的思路就是用不同的程序库提取相同的特征，这样就放进同一个模型中去训练了。

训练上，文章首先用全部数据丢进同一个模型跑，然后用ERT模型先把评论区分成高质量和低质量评论，然后对高质量评论再进行训练，发现这种分类方法能够提高模型的表现，并且做了表格对比。这种做法值得借鉴一下，先用简单的模型把评论先过个筛子，然后再去训练可以节省很多内存。

同时文章还用随机森林对中英文数据集跑了分类预测和特征重要性，然后用霍夫斯泰德文化维度理论去解释了为什么特征重要性排名不同，得出了一个关于消费者的结论。但是这里有一个问题是不同的模型会有不同的特征排名，怎么可以这么轻易的就得出一个关于消费者文化的结论呢！我觉得太草率了，可以多尝试几个集成模型，如果排名类似，那么解释起来更加具有说服力。

总结一下，多国数据集的方法可以尝试考虑一下，同时过筛子的做法也可以尝试一下，用理论去解释特征重要性的做法也可以尝试一下，但是武断给出结论需要避免。

49.I Like My Anonymity: An Empirical Investigation of the Effect of Multidimensional Review Text and Role Anonymity on Helpfulness of Employer Reviews. （Information Systems Frontiers）

这篇文章是传统类型的研究评论有用性的文章，标题取得很fashion，首先是匿名性，其次是求职者评论，点名了这是一篇面向求职者评论有用性的文章。和之前的评论有用性研究不同的是，之前的研究更加关注商品的评论有用性的影响范围，而这篇文章则是从求职者视角出发来研究什么样的评论对求职者是有用的。

首先是这篇文章的数据来源，文章采用了GLASSDOOR的网站获取了6万条评论，这个网站是求职者专门的网站，可以看到在职人员和离职人员对任职公司正反两面的评价。在因变量上，文章直接直接采用了有用性投票总数。

在自变量上，GLASSDOOR网站将评论的正面评价和负面评价分为了两个部分，因此一条评论中评论者既要书写正面评价也要书写反面评价，因此变量长度就分为了两个部分，同时还选取了匿名性变量，看评论者是否在网站上表明自己的职位。同时还有一系列控制变量，包括星级、情感、主观度、就职经验等多个维度来进行评价。

在模型选择上，选择了传统的TOBIT回归模型，最终的结论是评论长度都会积极影响有用性，匿名性也会积极影响有用性，同时匿名性对评论长度对评论有用性的作用有调节效应。总体结论很nice，但是他这篇文章发现评论星级与评论有用性呈正U型关系，但是文章没有提及这点。

同时文章还进一步的对匿名与非匿名的评论做了主题分析，丰富了文章的工作。总的来说文章还算中规中矩，很扎实。

50.How does mobile device usage influence review helpfulness through consumer evaluation? Evidence from TripAdvisor. （Decision Support Systems）

这篇文章研究了移动设备对评论有用性的影响以及一些中介效应。之前的研究中也有一部分会把顾客发表评论的设备作为一个自变量加入到模型中去的，但是都没有从理论层面去解释移动设备这个变量是如何去影响评论有用性的，还有一些中介效应也值得去研究。因变量用有用性投票总数来进行度量。

文章的因变量都比较常规，情感星级时间地点排名价格极性等等，其中有一个变量比较新，就是评论者购买商品的时间和书写评价的时间之间的差值，研究显示评论时间差距越大消费者就会越理性，倾向于给好评且感情比较温和，因为较长时间过后消费者对于一些产品细节可能会有遗忘。

文章采用了TRIPADVISOR的数据进行分析。首先文章进行了均值分析，结果表示星级不一致性、评论长度、情感、是否包含照片、多维星级评价都存在差异。同时文章在回归分析上有一个我没见过的做法，就是在因变量的选择上，不止选择了有用性投票同时还选择了评论极性等常见了因变量，来验证移动设备的实用对这些自变量的影响。结合均值分析更具有说服力。同时在最终模型上发现移动设备的使用对评论有用性有负面影响。

并且文章进一步研究了中介效应，并且做了BOOTSTRAP检验，这个功能应该是内置在软件里面的。

下一步文章结合了评论时间差来做了相同的回归实验和中介效应实验，发现移动设备通过中介效应会仙湖的影响评论长度和多维星级这两个方面，文章把这两个方面归因于使用成本，但是文章没有说明白手机设备使用成本是什么东西。对于管理者而言可以建议评论字数，并且把多维星级评价设置为必填项。

总的来讲这篇文章可以作为综述的补充，但是在行文方面感觉略微牵强。

你可能感兴趣的:(论文研读笔记,python,开发语言)

Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
python# python:3.5 aarch64构建镜像 Ling丶落 centos
构建失败从ubuntu中尝试构建FROMpython:3.5-slimLABELMAINTAINER="[email protected]"#installrelatedpackagesENVENVIRONMENTDOCKER_PRODWORKDIR/workCOPY./dataset.py/work/dataset.pyCOPY./model.py/work/model.pyCOPY./PyA
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
Java、python中高级开发工程师岗位框架要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ java python 开发语言
一、主流框架使用频率框架/技术出现频率说明SpringBoot89%几乎成为Java后端开发的标配，用于快速构建微服务和独立应用。SpringCloud76%微服务架构必备，提供服务发现、配置管理、网关等核心组件。MyBatis/MyBatis-Plus72%最流行的ORM框架，MyBatis-Plus进一步简化开发。Spring68%基础框架，中高级岗位要求深入理解IoC、AOP原理。Hiber
Java NIO 模型笔记笑衬人心。 JAVA学习笔记 java nio 笔记
目录JavaNIO概述JavaBIOvsNIONIO三大核心组件Channel（通道）Buffer（缓冲区）Selector（选择器）Channel详解Buffer详解Selector详解NIO工作流程图示例代码讲解NIO模型的优缺点NIO与Netty简介总结JavaNIO概述JavaNIO（NewI/O）是从Java1.4开始引入的一套新的I/OAPI。主要用于构建高性能、高并发的网络通信程序。
PPOCRLabel 环境配置教程 ysh9888 人工智能算法计算机视觉 opencv
PPOCRLabel环境配置教程_哔哩哔哩_bilibili1安装conda2新建环境condacreate--nameppocrpython=3.8--channelhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/condaactivateppocrpipinstall-rrequirements.txt-ihttps://pypi
response.split(“\n“)[0].strip() 是什么 ZhangJiQun&MXP 教学 2021 AI python python 机器学习人工智能语言模型自然语言处理
response.split(“\n”)[0].strip()是什么returnresponse.split("\n")[0].strip()这行代码在Python中通常用于对字符串进行处理并返回处理后的结果response.split("\n")：split()是Python字符串对象的一个方法，用于根据指定的分隔符将字符串拆分成一个列表。在这行代码中，"\n"作为分隔符，表示按照换行符来拆分字
Python函数 python知识
1文档字符串函数定义下的第一个字符串是文档字符串，用于解释函数。可以通过help(function_name)或function_name.__doc__来查看。2函数返回单个返回值：return一个值无返回值：函数执行完毕没有return语句，或者return后面没有值，会隐式地返回None返回多个值：实际上是返回一个包含所有值的元组(tuple)3参数函数声明：使用def关键字来创建函数默认参
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
llama-cpp-python使用教程 try2find llama python 开发语言
以下是llama-cpp-python的完整使用教程，涵盖安装、基础用法、高级功能（如GPU加速、多模态等）和常见问题解决。1.安装1.1基础安装（CPU版）pipinstallllama-cpp-python-ihttps://pypi.tuna.tsinghua.edu.cn/simple1.2启用GPU加速（CUDA）CMAKE_ARGS="-DGGML_CUDA=ON"pipinstall
【Python】列表嵌套字典多规则排序魔都吴所谓 Python 算法工具 python 服务器 java
数据a=[{"project":"pro_613","branchList":[]},{"project":"pro_614","branchList":[]},{"project":"pro_612","branchList":[]},{"project":"pro_631","branchList":[]},{"project":"pro_617","branchList":[]},{"pro
Redis存储Cookie实现爬虫保持登录 requests | selenium
前言前面已经介绍了requests和selenium这两种方式的基础知识和模拟登录,但是我们需要每次都进行登录,这明显是很麻烦并且不合理的,所以这次我分享一下怎么可以让我们的程序进行一次登录之后,和普通浏览器一样下次不进行登录直接进行对网站数据的爬取下面的我分享的内容需要前置知识,如果同志有知识不理解,可以查看我以前写的文章Python爬虫request三方库实战-CSDN博客Python爬虫XP
Requestium - 将Requests和Selenium合并在一起的自动化测试工具测试界晓晓软件测试测试工具 selenium 自动化软件测试功能测试自动化测试程序人生
Requests是Python的第三方库，主要用于发送http请求，常用于接口自动化测试等。Selenium是一个用于Web应用程序的自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。本篇介绍一款将Requests和Selenium结合在一起的自动化测试工具-Requestium简介Requestium是一个Python库，它将Requests、Selenium和P
深度解析：venv和conda如何解决依赖冲突难题咕咕日志 conda python
文章目录前言一、虚拟环境的核心价值1.1依赖冲突的典型场景1.2隔离机制实现原理二、venv与conda的架构对比2.1工具定位差异2.2性能基准测试（以创建环境+安装numpy为例）三、venv的配置与最佳实践3.1基础工作流3.2多版本Python管理四、conda的进阶应用4.1环境创建与通道配置4.2混合使用conda与pip的风险控制4.3跨平台环境导出五、工具选型决策树5.1场景化推荐
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
PyTorch中 item()、tolist()使用详解和实战示例点云SLAM PyTorch深度学习 pytorch 人工智能 python 深度学习张量的操作 item tolist
在PyTorch中，.item()和.tolist()是两个常用于从Tensor中提取Python原生数据的方法，尤其在调试、日志记录或将结果传给非张量库时非常有用。下面是它们的详解与代码示例。1..item()方法用途：将仅包含一个元素的张量（即标量张量）转换为对应的Python原生数据类型（float,int,等）。限制：只能用于只包含一个元素的Tensor，否则会报错。示例代码：import
解决部分机型浏览器使用pdf.js 出现 undefined is not an object(evaluating ‘response.body.getReader‘) 报错问题 HHH 917 pdf javascript pdf 前端
问题undefinedisnotanobject(evaluating‘response.body.getReader’)参考小王子的笔记本的技术博客仔细分析源码后发现，PDFjs的getDocument方法不仅可以接收URL作为参数，还可以接收多种类型：而fetch方法返回的Response对象恰恰拥有arrayBuffer方法，可以将数据转为ArrayBuffer对象解决PDF.getDocu
SVN笔记之SVN启动模式
SVN开源代码的版本控制系统一、生命周期创建版本库→检出→更新→执行变更→复查变化→修复错误→解决冲突→提交更改二、SVN启动模式首先,在服务端进行SVN版本库的相关配置手动新建版本库目录mkdir/opt/svn利用svn命令创建版本库svnadmincreate/opt/svn/runoob使用命令svnserve启动服务svnserve-d-r目录--listen-port端口-r:配置方式
subversion安装、备份、安全认证实践笔记——宋轶聪 etune subversion svn apache tortoisesvn 工作存储
在windows上配置svn的方法在linux10.117.100.130上安装svnsvn库的导入导出查看svn服务器版本SVN备份策略Svn服务配置和维护常用命令linux下启动和停止win下启动和停止svn把svn加为系统服务配置apache通过http访问svnsvn命令行====================================在windows上的配置方法=========
STM32 开发笔记：从环境搭建到任务调度嵌入式的小萌新 stm32 笔记嵌入式硬件
今天体验了一把augment确实好用，记录一下STM32开发笔记：从环境搭建到任务调度️环境准备必需工具STM32CubeMX：图形化配置工具，用于初始化MCU外设和生成基础代码STM32CubeCLT：包含编译工具链（arm-none-eabi-gcc）和烧录工具（STM32_Programmer_CLI）CMake：跨平台构建系统，用于管理项目编译流程OpenOCD：开源调试器（可选，用于DA
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1