jiangsanfeng1111

用Maven构建Mahout项目

转载出处：

http://blog.fens.me/hadoop-mahout-maven-eclipse/

前言

基于Hadoop的项目，不管是MapReduce开发，还是Mahout的开发都是在一个复杂的编程环境中开发。Java的环境问题，是困扰着每个程序员的噩梦。Java程序员，不仅要会写Java程序，还要会调linux，会配hadoop，启动hadoop，还要会自己运维。所以，新手想玩起Hadoop真不是件简单的事。

不过，我们可以尽可能的简化环境问题，让程序员只关注于写程序。特别是像算法程序员，把精力投入在算法设计上，要比花时间解决环境问题有价值的多。

Maven介绍和安装
Mahout单机开发环境介绍
用Maven构建Mahout开发环境
用Mahout实现协同过滤userCF
用Mahout实现kmeans
模板项目上传github

1. Maven介绍和安装

请参考文章：用Maven构建Hadoop项目

开发环境

Win7 64bit
Java 1.6.0_45
Maven 3
Eclipse Juno Service Release 2
Mahout 0.6

这里要说明一下mahout的运行版本。

mahout-0.5, mahout-0.6, mahout-0.7，是基于hadoop-0.20.2x的。
mahout-0.8, mahout-0.9，是基于hadoop-1.1.x的。
mahout-0.7，有一次重大升级，去掉了多个算法的单机内存运行，并且了部分API不向前兼容。

注：本文关注于“用Maven构建Mahout的开发环境”，文中的 2个例子都是基于单机的内存实现，因此选择0.6版本。Mahout在Hadoop集群中运行会在下一篇文章介绍。

2. Mahout单机开发环境介绍

如上图所示，我们可以选择在win中开发，也可以在linux中开发，开发过程我们可以在本地环境进行调试，标配的工具都是Maven和Eclipse。

3. 用Maven构建Mahout开发环境

1. 用Maven创建一个标准化的Java项目
2. 导入项目到eclipse
3. 增加mahout依赖，修改pom.xml
4. 下载依赖

1). 用Maven创建一个标准化的Java项目


~ D:\workspace\java>mvn archetype:generate -DarchetypeGroupId=org.apache.maven.archetypes 
-DgroupId=org.conan.mymahout -DartifactId=myMahout -DpackageName=org.conan.mymahout -Dversion=1.0-SNAPSHOT -DinteractiveMode=false

进入项目，执行mvn命令


~ D:\workspace\java>cd myMahout
~ D:\workspace\java\myMahout>mvn clean install

2). 导入项目到eclipse

我们创建好了一个基本的maven项目，然后导入到eclipse中。这里我们最好已安装好了Maven的插件。

3). 增加mahout依赖，修改pom.xml

这里我使用hadoop-0.6版本，同时去掉对junit的依赖，修改文件：pom.xml


<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.conan.mymahout</groupId>
<artifactId>myMahout</artifactId>
<packaging>jar</packaging>
<version>1.0-SNAPSHOT</version>
<name>myMahout</name>
<url>http://maven.apache.org</url>

<properties>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
<mahout.version>0.6</mahout.version>
</properties>

<dependencies>
<dependency>
<groupId>org.apache.mahout</groupId>
<artifactId>mahout-core</artifactId>
<version>${mahout.version}</version>
</dependency>
<dependency>
<groupId>org.apache.mahout</groupId>
<artifactId>mahout-integration</artifactId>
<version>${mahout.version}</version>
<exclusions>
<exclusion>
<groupId>org.mortbay.jetty</groupId>
<artifactId>jetty</artifactId>
</exclusion>
<exclusion>
<groupId>org.apache.cassandra</groupId>
<artifactId>cassandra-all</artifactId>
</exclusion>
<exclusion>
<groupId>me.prettyprint</groupId>
<artifactId>hector-core</artifactId>
</exclusion>
</exclusions>
</dependency>
</dependencies>
</project>

4). 下载依赖

~ mvn clean install

在eclipse中刷新项目：

项目的依赖程序，被自动加载的库路径下面。

4. 用Mahout实现协同过滤userCF

Mahout协同过滤UserCF深度算法剖析，请参考文章：用R解析Mahout用户推荐协同过滤算法(UserCF)

实现步骤：

1. 准备数据文件: item.csv
2. Java程序：UserCF.java
3. 运行程序
4. 推荐结果解读

1). 新建数据文件: item.csv


~ mkdir datafile
~ vi datafile/item.csv

1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.5
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0

数据解释：每一行有三列，第一列是用户ID，第二列是物品ID，第三列是用户对物品的打分。

2). Java程序：UserCF.java

Mahout协同过滤的数据流，调用过程。

上图摘自：Mahout in Action

新建JAVA类：org.conan.mymahout.recommendation.UserCF.java


package org.conan.mymahout.recommendation;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.mahout.cf.taste.common.TasteException;
import org.apache.mahout.cf.taste.impl.common.LongPrimitiveIterator;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.EuclideanDistanceSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;

public class UserCF {

    final static int NEIGHBORHOOD_NUM = 2;
    final static int RECOMMENDER_NUM = 3;

    public static void main(String[] args) throws IOException, TasteException {
        String file = "datafile/item.csv";
        DataModel model = new FileDataModel(new File(file));
        UserSimilarity user = new EuclideanDistanceSimilarity(model);
        NearestNUserNeighborhood neighbor = new NearestNUserNeighborhood(NEIGHBORHOOD_NUM, user, model);
        Recommender r = new GenericUserBasedRecommender(model, neighbor, user);
        LongPrimitiveIterator iter = model.getUserIDs();

        while (iter.hasNext()) {
            long uid = iter.nextLong();
            List list = r.recommend(uid, RECOMMENDER_NUM);
            System.out.printf("uid:%s", uid);
            for (RecommendedItem ritem : list) {
                System.out.printf("(%s,%f)", ritem.getItemID(), ritem.getValue());
            }
            System.out.println();
        }
    }
}

3). 运行程序
控制台输出:


SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
uid:1(104,4.274336)(106,4.000000)
uid:2(105,4.055916)
uid:3(103,3.360987)(102,2.773169)
uid:4(102,3.000000)
uid:5

4). 推荐结果解读

向用户ID1，推荐前二个最相关的物品, 104和106
向用户ID2，推荐前二个最相关的物品, 但只有一个105
向用户ID3，推荐前二个最相关的物品, 103和102
向用户ID4，推荐前二个最相关的物品, 但只有一个102
向用户ID5，推荐前二个最相关的物品, 没有符合的

5. 用Mahout实现kmeans

1. 准备数据文件: randomData.csv
2. Java程序：Kmeans.java
3. 运行Java程序
4. mahout结果解读
5. 用R语言实现Kmeans算法
6. 比较Mahout和R的结果

1). 准备数据文件: randomData.csv


~ vi datafile/randomData.csv

-0.883033363823402,-3.31967192630249
-2.39312626419456,3.34726861118871
2.66976353341256,1.85144276077058
-1.09922906899594,-6.06261735207489
-4.36361936997216,1.90509905380532
-0.00351835125495037,-0.610105996559153
-2.9962958796338,-3.60959839525735
-3.27529418132066,0.0230099799641799
2.17665594420569,6.77290756817957
-2.47862038335637,2.53431833167278
5.53654901906814,2.65089785582474
5.66257474538338,6.86783609641077
-0.558946883114376,1.22332819416237
5.11728525486132,3.74663871584768
1.91240516693351,2.95874731384062
-2.49747101306535,2.05006504756875
3.98781883213459,1.00780938946366

这里只截取了一部分，更多的数据请查看源代码。

注：我是通过R语言生成的randomData.csv


x1<-cbind(x=rnorm(400,1,3),y=rnorm(400,1,3))
x2<-cbind(x=rnorm(300,1,0.5),y=rnorm(300,0,0.5))
x3<-cbind(x=rnorm(300,0,0.1),y=rnorm(300,2,0.2))
x<-rbind(x1,x2,x3)
write.table(x,file="randomData.csv",sep=",",row.names=FALSE,col.names=FALSE)

2). Java程序：Kmeans.java

Mahout中kmeans方法的算法实现过程。

上图摘自：Mahout in Action

新建JAVA类：org.conan.mymahout.cluster06.Kmeans.java


package org.conan.mymahout.cluster06;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.apache.mahout.clustering.kmeans.Cluster;
import org.apache.mahout.clustering.kmeans.KMeansClusterer;
import org.apache.mahout.common.distance.EuclideanDistanceMeasure;
import org.apache.mahout.math.Vector;

public class Kmeans {

    public static void main(String[] args) throws IOException {
        List sampleData = MathUtil.readFileToVector("datafile/randomData.csv");

        int k = 3;
        double threshold = 0.01;

        List randomPoints = MathUtil.chooseRandomPoints(sampleData, k);
        for (Vector vector : randomPoints) {
            System.out.println("Init Point center: " + vector);
        }

        List clusters = new ArrayList();
        for (int i = 0; i < k; i++) {
            clusters.add(new Cluster(randomPoints.get(i), i, new EuclideanDistanceMeasure()));
        }

        List<List> finalClusters = KMeansClusterer.clusterPoints(sampleData, clusters, new EuclideanDistanceMeasure(), k, threshold);
        for (Cluster cluster : finalClusters.get(finalClusters.size() - 1)) {
            System.out.println("Cluster id: " + cluster.getId() + " center: " + cluster.getCenter().asFormatString());
        }
    }

}

3). 运行Java程序
控制台输出:


Init Point center: {0:-0.162693685149196,1:2.19951550286862}
Init Point center: {0:-0.0409782183083317,1:2.09376666042057}
Init Point center: {0:0.158401778474687,1:2.37208412905273}
SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
Cluster id: 0 center: {0:-2.686856800552941,1:1.8939462954763795}
Cluster id: 1 center: {0:0.6334255423230666,1:0.49472852972602105}
Cluster id: 2 center: {0:3.334520309711998,1:3.2758355898247653}

4). mahout结果解读

1. Init Point center表示，kmeans算法初始时的设置的3个中心点
2. Cluster center表示，聚类后找到3个中心点

5). 用R语言实现Kmeans算法
接下来为了让结果更直观，我们再用R语言，进行kmeans实验，操作相同的数据。

R语言代码：


> y<-read.csv(file="randomData.csv",sep=",",header=FALSE) 
> cl<-kmeans(y,3,iter.max = 10, nstart = 25) 
> cl$centers
          V1         V2
1 -0.4323971  2.2852949
2  0.9023786 -0.7011153
3  4.3725463  2.4622609

# 生成聚类中心的图形
> plot(y, col=c("black","blue","green")[cl$cluster])
> points(cl$centers, col="red", pch = 19)

# 画出Mahout聚类的中心
> mahout<-matrix(c(-2.686856800552941,1.8939462954763795,0.6334255423230666,0.49472852972602105,3.334520309711998,3.2758355898247653),ncol=2,byrow=TRUE) 
> points(mahout, col="violetred", pch = 19)

聚类的效果图：

6). 比较Mahout和R的结果
从上图中，我们看到有黑，蓝，绿，三种颜色的空心点，这些点就是原始的数据。

3个红色实点，是R语言kmeans后生成的3个中心。
3个紫色实点，是Mahout的kmeans后生成的3个中心。

R语言和Mahout生成的点，并不是重合的，原因有几点：

1. 距离算法不一样：
Mahout中，我们用的 “欧氏距离(EuclideanDistanceMeasure)”
R语言中，默认是”Hartigan and Wong”
2. 初始化的中心是不一样的。
3. 最大迭代次数是不一样的。
4. 点合并时，判断的”阈值(threshold)”是不一样的。

6. 模板项目上传github

https://github.com/bsspirit/maven_mahout_template/tree/mahout-0.6

大家可以下载这个项目，做为开发的起点。

 
~ git clone https://github.com/bsspirit/maven_mahout_template
~ git checkout mahout-0.6

我们完成了第一步，下面就将正式进入mahout算法的开发实践，并且应用到hadoop集群的环境中。

. HTML 中的注释和特殊字符花林似霰f html 前端
在HTML页面中，一些特殊的符号很难或者不方便直接使用，此时我们就可以使用下面的字符来替代。最常使用为>空格记住这三个，其它随用随查原始字符entity原始字符entity""&&''> ¡¡¢¢££¤¤¥¥¦¦§§¨¨©©ªª«&l
单元测试方法及其运用一休哥助手软考系统架构师单元测试
引言随着软件规模和复杂度的不断提升，开发人员面临着如何保证软件质量与稳定性的挑战。单元测试作为软件测试中不可或缺的一环，能够在早期发现代码中的问题，从而提高软件的可靠性。本文将结合我参与的一个软件项目，详细介绍单元测试中的静态测试与动态测试方法，以及如何确定白盒测试的覆盖标准和组织实施回归测试。1.项目背景及个人角色在我参与的一个在线教育平台开发项目中，团队的目标是构建一个高度可扩展的课程管理和学
2024架构设计师论文题目数字化信息化智能化解决方案 2024架构
论文1大数据lamda架构1、简要说明你参开发的软件项目,吸你所承担的主要作2、lamada体系架构将数据流分为批处理层(对应的英文、加速层文、服务层。简要叙这三个层次的用途和特点3、详细阐述你参与开发的软件项目如何基于lamada体系架构进行大数据处理的架构论文2模型驱动架构设计方法及其用1、简要说明你参与分析和研发的软件项目,吸你所承担的要工作2、简要阐述采用模型驱动架构思想进行软件开发的全过
用Python实现字符串反转程序媛了了 python java 前端
字符串反转代码：#第一种：最简单的切片方法defpythonit():n=input("请输入一段文本：")a=n[::-1]print(a)pythonit()#第二种：列表循环法，利用sort()函数defpython():n=input("请输入一段文本：")list=[]foriinn:list.append(i)list.sort(reverse=True)print("".join(l
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, 小李飞刀李寻欢 Notebook huggingface bert 分类大模型
场景：训练bert-base-chinese下游任务：分类。在一个服务器可以用，但GPU只有一个卡，只能换一个服务器，换个服务器又要重装环境，但后者下载模型有问题，手动用git-lfs下载后指定位置报错：Traceback(mostrecentcalllast):/examples/pytorch/text-classification/run_glue.py",line622,inmain()/
【脑洞小剧场】零帧起手创业小公司之第一次用户反馈 Foyo Designer 技术职场小剧职场和发展程序人生学习方法改行学it 程序员创富
点击查看小剧场合集https://blog.csdn.net/foyodesigner/category_12896948.html阳光透过窗帘的缝隙，懒洋洋地洒在办公室的每一个角落，却似乎无法驱散产品经理程立新心头的阴霾。他坐在电脑前，眼神空洞地盯着屏幕，心里五味杂陈。昨天项目匆匆上线，本以为会是公司迈向成功的一大步，没想到今天一早就迎来了用户的“狂轰滥炸”。场景一：产品经理的“差评风暴”“这…
自写控制台清除内容函数clrscr() z1095582370 c语言
编程小白，最近学了双缓冲，倒腾了好几天，终于是学会了。这里想要给大家分享的是控制台清除内容的函数clrscr()在网上找了好久，有的说这个函数是TC特有的（虽然不知道TC是啥），还有些说是在conio.h头文件里但VS2019绝对是没有的，所以只能只能写这里可能有人会说用system(“cls”)就好，clrscr()很复杂，但我最近几天被折磨的BUG就是因为这个system(“cls”)导致的，
DeepSeek、Grok、ChatGPT4.5和Gemini四大AI模型深度解析：谁才是你的最佳助手 lifire_H 人工智能 chatgpt DeepSeek Grok
在AI技术爆发的今天，DeepSeek、Grok、ChatGPT4.5和Gemini这四大主流模型各显神通。本文大白话帮你理清它们的优缺点，看完就知道该选谁干活了！一、四大金刚的看家本领1.DeepSeek：省钱小能手这个国产AI最擅长精打细算，训练成本只要557万美元（其他家动不动上亿），就像用奥拓的钱造出了奥迪。它在金融、医疗等专业领域特别灵光，处理中文合同比老外AI强得多。不过看图能力还停留
软件或互联网项目中的风险管理怎么做项目管理
软件或互联网项目中的风险管理的核心在于全面识别风险、科学评估风险、动态监控调整。其中，全面识别风险要求项目团队在项目启动前就系统地调查内外部可能影响项目进度、质量、成本及用户体验的各类风险；科学评估风险则需要借助定性与定量相结合的方法，将风险发生的概率与影响程度转化为具体数据，为风险优先级排序提供依据；动态监控调整强调在项目执行过程中实时追踪风险变化，及时启动应急预案，从而确保项目在面对不确定性时
RocketMQ开发实战篇 Jeremy_1022 RocketMQ rocketmq
一、生产者开发指南1.JavaAPI使用详解在使用RocketMQ进行消息生产时，首先需要引入相关的依赖。在Maven项目中，可以在pom.xml文件中添加以下依赖：org.apache.rocketmqrocketmq-client4.9.0接下来，创建一个简单的生产者示例：importorg.apache.rocketmq.client.producer.DefaultMQProducer;i
Zookeeper性能优化与调优技巧精讲 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Zookeeper性能优化与调优技巧精讲1.背景介绍1.1什么是Zookeeper?ApacheZooKeeper是一个开源的分布式协调服务,为分布式应用程序提供高可用性和强一致性的协调服务。它主要用于解决分布式环境中的数据管理问题,如统一命名服务、配置管理、分布式锁、集群管理等。ZooKeeper的设计目标是构建一个简单且高效的核心,以确保最大程度的可靠性和可扩展性。1.2Zookeeper的应
从零开始：基于LLM大模型构建智能应用程序的完整指南 AI天才研究院 ChatGPT 人工智能
目录从零开始：基于LLM大模型构建智能应用程序的完整指南什么是LLM大模型如何利用LLM大模型构建智能应用程序1.收集和准备数据2.构建LLM大模型3.集成和部署4.监测和维护使用特定于私有领域的数据增强LLM检索增强生成(RAG)数据预处理、分块和检索技术零射击与少量射击提示和指导LLM大模型使用LLM进行推荐和聚类任务改善组织内的搜索体验考虑以上所有解锁的利基应用程序参考最近，围绕大型语言模型
Java后端开发规范糖心何包蛋爱编程 java 开发语言
在Java后端开发中，遵循一套明确的规范和最佳实践是非常重要的，这不仅可以提高代码的质量和可维护性，还可以促进团队协作和项目的长期发展。因此，对于有志于学习Java语言的朋友而言，从学习初期便着力培养良好的代码编写习惯，是通往成功掌握这门语言的关键一步。一、开发环境1.Java82.IntelliJIDEA二、Java命名1.maven模块名小写，多个单词使用-连接。正确:example-moud
中信银行太原分行开展3.15金融知识进社区志愿活动 lsrsyx 金融
为扎实开展“我为群众办实事”实践活动，深入推进金融知识进社区工作，中信银行太原分行在第62个学雷锋纪念日到来之际，以“315消费者权益保护日”为契机，联合小店街道汾东南路社区温情开展了一场集爱心慰问、贴心服务与金融知识普及于一体的志愿服务活动，用实际行动传递温暖，提升老年群体金融素养。活动伊始，太原分行的志愿者们带着精心准备的慰问品，走进老年人的家中，主动帮忙打扫卫生，擦拭家具、清扫地面、整理杂物
使用Jest和React Testing Library测试React组件邹澜鹤Gardener
使用Jest和ReactTestingLibrary测试React组件去发现同类优质开源项目:https://gitcode.com/项目介绍这个开源项目是TestingJavaScript.com课程的一部分，专注于教你怎么用最智能、最高效的方式去测试任何JavaScript应用，特别是针对React组件的测试。它提供了一系列示例代码，涵盖了从基础的React渲染到复杂的Redux连接组件以及自
Python个人学习笔记（14）：函数（匿名函数、内置函数（下）、三元表达式） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
九、匿名函数lambda表达式语法规则：变量=lambda参数1,参数2,…:返回值例：用lambda简化下述操作deffunc(a,b):returna+bret=func(1,2)print(ret)代码：fn=lambdaa,b:a+bprint(fn)print(fn(12,13))结果：at0x000001E751EAAF20>25可以帮我们一句话创建函数可以与某些内置函数一起用十、内置
使用 Node.js 对接 StockTV 全球金融市场 API 马来西亚、印度 CryptoPP node.js 金融大数据数据分析
使用Node.js对接StockTV全球金融市场API在当今全球化的金融市场中，获取准确、实时的金融数据对于投资者和开发者来说至关重要。StockTV提供了一个强大的API接口，涵盖了全球股票、外汇、期货和加密货币等多方面的数据。本文将介绍如何使用Node.js对接这个API，并通过示例代码展示如何获取和处理数据。一、项目准备1.环境搭建在开始之前，确保你的开发环境中已经安装了Node.js和np
Windows控制台函数：控制台输出函数WriteConsoleA（）闪电麦坤95 Windows API 控制台函数 windows c++开发语言 c语言
目录什么是WriteConsoleA？函数签名参数详解返回值一个最简单的例子跟ReadConsoleA对比再试一个有趣的例子为什么传地址给lpNumberOfCharsWritten？注意事项什么是WriteConsoleA？WriteConsoleA是一个WindowsAPI函数，用来把文字写到控制台屏幕上。就像你在C++用std::cout输出东西，但它是直接跟Windows的控制台打交道。把
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
用PS将歪掉的人头调整成正向 Zԅ(¯ㅂ¯ԅ) PS 图像处理
1.选择套索工具将人头框选出来2.shift+F6羽化3.Ctrl+J复制出来4.Ctrl+T找到中心调整点（若没有调整点，执行编辑＞首选项＞工具＞勾选在使用'变换'时显示参考点）5.将调整点挪动到下巴位置6.旋转调整头的角度7.调整好后按下回车8.添加蒙版9.选择画笔工具，前景色选择黑色，涂抹穿帮位置。10.Ctrl+H隐藏参考线
机器学习算法在司法预测中的应用【附保姆级代码】一键难忘机器学习算法人工智能
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~机器学习算法在司法预测中的应用司法预测作为法律领域的前沿研究
【大模型新书】基于RAG的生成式AI：使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道 AI大模型-大飞人工智能大模型学习 AI产品经理语言模型大模型 RAG 大模型教程
书籍简介最小化AI幻觉，构建准确的自定义生成式AI管道，利用嵌入式向量数据库和集成的人类反馈来实现检索增强生成（RAG）购买本书的纸质版或Kindle版即包含免费的PDF格式电子书主要特点实现RAG的可追溯输出，将每个响应与其源文档链接，构建可靠的多模态对话智能体在管道中集成RAG、实时人类反馈改进和知识图谱，交付准确的生成式AI模型在动态检索数据集与微调静态数据之间平衡成本与性能书籍描述基于RA
使用 OkHttp 与 FastJSON 发送 POST 请求李少兄 Java okhttp java
目录前言一、依赖配置Maven依赖配置Gradle依赖配置二、常量定义三、学生对象定义四、常规情况：发送单个学生信息代码实现代码解释五、多线程情况：发送多个学生信息线程池基础知识代码实现代码解释六、注意事项和优化建议常规情况异步请求处理多线程情况前言在现代Java开发中，与外部服务进行数据交互是极为常见的需求。其中，发送HTTPPOST请求以提交数据更是屡见不鲜。OkHttp作为一款高效且功能强大
vue+django 前后端数据同步 weixin_44079503 django vue.js python
目标：在views.py中，准备好数据后，通过Vue的v-model双向绑定功能在index.html中显示。当数据修改后，点击按钮提交后，以对象的形式向views.py传递并更新后端数据。总体思路：views.py用字典存数据暴露api的get方法，在页面加载时双向绑定数据修改数据提交后，点按钮把数据对象用json字符串传过来用simplejson.loads还原对象后，更新字典值步骤：准备数据
PyTorch深度学习框架进阶学习计划 - 第21天：自然语言处理基础凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程 AIGC 自然语言处理
PyTorch深度学习框架进阶学习计划-第21天自然语言处理基础今天我们将深入学习自然语言处理(NLP)的基础概念，重点关注词嵌入技术、序列建模原理以及主流模型之间的区别和优缺点。通过理解这些基础知识，你将能够更好地应用PyTorch构建NLP应用。1.词嵌入原理与实现词嵌入(WordEmbeddings)是NLP中的核心概念，它将单词映射到连续向量空间，使得语义相似的词在向量空间中距离较近。为什
在与SQL server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器。请验证实例名称是否正确并且SQL server已配置为允许远程连接。error40 错误53 繁华哟面试学习路线阿里巴巴服务器网络 microsoft stm32 数据结构
目录项目场景：问题描述：原因分析：解决方案：1，开启SQLserver服务菜单——>MicrosoftSQLServer2014——>SQLServer2014配置管理器?SQLserver服务——>SQLserver(MSSQLSERVER)
新手PCB打样避坑指南：如何选择高性价比厂商 lboyj 人工智能大数据
在电子硬件开发中，PCB打样是验证设计可行性的关键一步。然而，面对市场上数百家PCB厂商，新手往往陷入“选厂难”的困境：既要保证质量，又要控制成本，还要兼顾交期。本文将从核心需求出发，结合行业口碑与技术实测，深度解析猎板PCB等优质厂商的优势，助你快速锁定匹配项目需求的合作伙伴。一、新手选厂的核心考量：从“踩雷”到“精准匹配”1.**工艺能力：决定设计落地的天花板**新手常误以为“低价=划算”，却
Qt Creator插件系统详解及插件开发实战丰年稻香 QT qt 插件
一、前言QtCreator作为Qt官方IDE，其插件系统允许开发者深度扩展IDE功能。本文以QtCreator4.11（基于Qt5.12.12构建）为例，结合其独特的依赖解析机制，详解插件开发全流程。通过本文，您不仅能掌握基础开发方法，还能深入理解插件系统的底层逻辑。二、环境配置与源码编译1.基础环境搭建•Qt版本选择必须使用Qt5.12.12，与QtCreator4.11保持二进制兼容（官方推荐
二十二、QT记事本辰卓 qt 开发语言 c++
1.项目概述1.1功能介绍支持文本创建，打开，保存，关闭的功能UI样式美化添加打开快捷键，添加保存快捷底部显示行列号及文本字符编码Ctrl加鼠标滚轮支持字体放大缩小1.2界面预览2.3工程概述MainWindows还是Widget在Qt中，创建"MainWindow"与"Widget"项目的主要区别在于他们的用途和功能范围：1.MainWindow：这是一个包含完整菜单栏、工具栏和状态栏的主窗口应
TestHubo在Windows环境下安装与配置教程城南花开时 TestHubo安装教程
TestHubo是一款开源免费的全栈测试工具，包括项目管理、用例管理、测试计划、统计分析等模块，支持功能测试、接口测试、WEB测试、APP测试、性能测试等类型，产品功能完善，简洁易用、开源免费，本文将介绍如何在Windows环境下安装与配置，以快速上手。1、服务端安装下载，Windows安装包下载地址：TestHubo-下载，下载安装包如tiklab-testhubo.x.x.x.exe。安装，
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它