arrow8071

hadoop + mahout 安装配置

最近一直捣鼓Mahout，终于在Hadoop下成功跑起来了。由于涉及的点比较多，这里先记录整理一下，做参考备忘使用。

一、操作系统

Ubuntu Desktop 13.04 （RaringRingtail）

官网地址：

http://releases.ubuntu.com/13.04/

国内镜像地址:

中科大 http://ubuntu1304.cdn.mirrors.ustc.edu.cn/ubuntu-releases/13.04/

网易 http://mirrors.163.com/ubuntu-releases/13.04/

二、需要安装的软件

编号	软件名称	版本	下载地址
1	Java	jdk-6u45-linux-i586.bin	http://www.oracle.com/technetwork/java/javase/downloads/jdk6downloads-1902814.html
2	SSH	1）openssh-client_6.1p1-4_i386.deb 2）openssh-server_6.1p1-4_i386.deb 3）ssh_6.1p1-4_all.deb	https://launchpad.net/ubuntu/+source/openssh/1:6.1p1-4/+build/4401534
3	Hadoop	hadoop-1.1.2.tar.gz	http://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-1.1.2/
4	Maven	Maven 3.0.5	http://maven.apache.org/download.cgi
5	Mahout	mahout-distribution-0.7-src.tar.gz	http://mirror.bjtu.edu.cn/apache/mahout/0.7/

三、安装过程

1、配置用户

1）为后续配置hadoop方便，添加hduser用户和hadoop组，并将hduser添加到hadoop组中。

$sudo addgroup hadoop

$sudo adduser–ingroup hadoop hduser

2）修改该目录访问权限，然后使用hduser用户将上述软件拷贝到/usr/local目录下。

$sudo chown 777/usr/local

以下操作均使用hduser进行。

2、安装JAVA

1) 在/usr/local目录下解压：

$./jdk-6u45-linux-i586.bin

此时java的安装路径为：/usr/local/jdk1.6.0_45；

2) 配置hduser主目录下(hduser@ubuntu:~$)的.bashrc文件，在该文件的最后添加如下两行：

exportJAVA_HOME=/usr/local/jdk1.6.0_45

exportPATH=$PATH:$JAVA_HOME/bin

4) 注销用户后重新登录，验证java安装是否正确：

$java –version

出现如下信息后说明安装正确，

java version "1.6.0_45"

Java(TM) SE Runtime Environment (build 1.6.0_45-b06)

Java HotSpot(TM) Client VM (build 20.45-b01, mixed mode,sharing)

3、安装SSH

1) 安装openssh-client_6.1p1-4_i386.deb：

$sudo dpkg -iopenssh-client_6.1p1-4_i386.deb

2) 安装openssh-server_6.1p1-4_i386.deb：

$sudo dpkg -iopenssh-server_6.1p1-4_i386.deb

3) 安装ssh_6.1p1-4_all.deb：

$sudo dpkg -issh_6.1p1-4_all.deb

4) 为hduser生成公用密钥

$ssh-keygen –t rsa –P“”

5) 发布密钥

$cat~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

6) 测试连接localhost

$ssh localhost

hduser@ubuntu:~$ sshlocalhost

The authenticity of host'localhost (127.0.0.1)' can't beestablished.

ECDSA key fingerprintis4d:90:91:c7:d4:20:55:5f:2a:53:62:78:c0:43:ef:d8.

Are you sure you want tocontinue connecting (yes/no)?

输入yes，即可实现无密码访问localhost，这是后来配置集群模式的基础。

4、安装Hadoop

以下五步操作对单节点和集群是相同的，每台机器都需要操作。

1) 在/usr/local目录下解压

$sudo tarxvzfhadoop-1.1.2.tar.gz

2) 为方便管理，修改目录名

$mv hadoop-1.1.2hadoop

3) 更新.bashrc文件，在该文件的最后添加如下两行：

export HADOOP_HOME=/usr/local/hadoop

export PATH=$PATH:$HADOOP_HOME/bin

4) 配置/usr/local/hadoop/conf/hadoop-env.sh文件

将文件中下面行进行修改，

#exportJAVA_HOME=/usr/lib/j2sdk1.5-sun

修改为，

exportJAVA_HOME=/usr/local/jdk1.6.0_45

5) 为hadoop建立临时工作目录，赋予hduser的权限

$sudo mkdir–p/app/hadoop/tmp

$sudochownhduser:hadoop /app/hadoop/tmp

以下的步骤区分单节点和集群，为调试方便，先配置单节点，单节点成功后再修改为集群方式。

4.1 单节点安装

下面文件都在/usr/local/hadoop/conf目录。

1) 配置core-site.xml

<name>hadoop.tmp.dir</name>

<value>/app/hadoop/tmp</value>

</property>

<name>fs.default.name</name>

<value>hdfs://localhost:54310</value>

</property>

</configuration>

2) 配置mapred-site.xml

<name>mapred.job.tracker</name>

<value>localhost:54311</value>

</property>

</configuration>

3) 配置hdfs-site.xml

<name>dfs.replication</name>

</property>

</configuration>

4) 格式化HDFS

$hadoopnamenode–format

终端输出信息如下所示：

13/05/0218:01:43INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG:StartingNameNode

STARTUP_MSG: host = ubuntu/127.0.1.1

STARTUP_MSG: args = [–format]

STARTUP_MSG: version = 1.1.2

STARTUP_MSG: build =https://svn.apache.org/repos/asf/hadoop/common/branches/branch-1.1 -r1440782;compiled by 'hortonfo' on Thu Jan 31 02:03:24 UTC 2013

************************************************************/

13/05/0218:01:43INFO namenode.NameNode: SHUTDOWN_MSG:

/************************************************************

SHUTDOWN_MSG:Shuttingdown NameNode at ubuntu/127.0.1.1

************************************************************/

5) 启动hadoop

$start-all.sh

6) 查看hadoop状态

方法1：使用jps命令,终端输出信息如下所示，注意不能缺项。

$jps

7554NameNode

7759DataNode

8317Jps

8049JobTracker

8251TaskTracker

7968SecondaryNameNode

方法2：使用浏览器

查看namenode状态：http://localhost:50070

查看JobTracker状态：http://localhost:50030

查看TaskTracker状态：http://localhost:50060

7) 在/usr/local/hadoop/下运行一个简单的MapReduce任务

$bin/hadoopfs -put conf input

$bin/hadoopjarhadoop-examples-*.jar grep input output 'dfs[a-z.]+’

查看运行结果:

$bin/hadoop fs -get output output

$catoutput/*

终端输出信息如下：

cat:output/_logs:Is a directory

1 dfs.replication

1 dfs.server.namenode.

1 dfsadmin

4.2 多节点安装

1) 节点信息：2个节点，其中一个节点为master，另一个节点为slave，master节点的IP地址是：192.168.233.132，slave节点的IP地址是：192.168.233.135。

2）配置各节点主机信息

修改每个节点的主机信息，在/etc/hosts文件中增添如下两行：

192.168.233.132master

192.168.233.135 slave

3）将master节点ssh公钥向slave节点发布

$ssh-copy-id -i$HOME/.ssh/id_rsa.pubhduser@slave

发布后使用ssh slave命令确认一下从master向slave连接不需要输入用户名和密码。

4) 配置master节点的conf/masters文件

该文件指定启动SecondaryNameNode的节点。另外，运行start-dfs.sh脚本的节点是namenode节点，运行start-mapred.sh脚本的节点是jobtracker节点，运行start-all.sh的节点是namenode和jobtracker节点。

此处将master设置为启动SecondaryNameNode的节点，即在conf/masters文件中添加如下行：

master

5) 配置master节点的conf/slaves文件

各slave节点只作为DataNodes和TaskTrackers,该文件为start-dfs.sh所使用，通过该文件管理其中所有的slave节点。

此处指定master节点和slave节点都作为HadoopSlaves，即在conf/slaves文件中添加如下行：

master

slave

6) 在各节点上配置如下三个文件，core-site.xml, mapred-site.xml, hdfs-site.xml

#core-site.xml，指定namenode

<name>hadoop.tmp.dir</name>

<value>/app/hadoop/tmp</value>

</property>

<name>fs.default.name</name>

<!—注意此处，由localhost改为master -->

<value>hdfs://master:54310</value>

</property>

</configuration>

#mapred-site.xml指定jobtracker

<name>mapred.job.tracker</name>

<!—注意此处，由localhost改为master-->

<value>master:54311</value>

</property>

</configuration>

#hdfs-site.xml

<name>dfs.replication</name>

<!—注意此处，因为有两个slave节点，所以由1改为2 -->

</property>

</configuration>

7) 格式化HDFS

在格式化之前，先将/app/hadoop/tmp目录下所有内容删除。

$rm–rf /app/hadoop/tmp/*

$hadoopnamenode –format

8) 启动/停止集群
启动，在master节点上运行下面两个命令：
$start-dfs.sh//该命令启动namenode，以及conf/slaves文件指定的DataNode。
$start-mapred.sh//该命令启动jobtracker，以及conf/slaves文件指定的tasktracker。
在master节点上使用jps命令查看，相似内容如下，
11273 JobTracker
10920 DataNode
10715 NameNode
11128 SecondaryNameNode
11600 Jps
11481 TaskTracker
在slave节点上使用jps查看，相似内容如下，
7951 Jps
7879 TaskTracker
7543 DataNode
如果缺少NameNode，DataNode，SecondaryNameNode，JobTracker，TaskTracker中的某一项，说明hadoop没有正确启动，可以到hadoop/logs目录下查看相应的log文件查找原因。

停止，停止的顺序与启动的顺序相反，即，
$stop-mapred.sh
$stop-dfs.sh

5、安装Maven

1) 解压

$tar zxvfapache-maven-3.0.5.tar.gz

2) 修改.bashrc文件

exportM3_HOME=/usr/local/apache-maven-3.0.5

exportPATH=$M3_HOME/bin:$PATH

3) 以hduser用户重新登录，查看是否安装成功

$mvn--version

终端提示信息如下：

ApacheMaven 3.0.5(r01de14724cdef164cd33c7c8c2fe155faf9602da; 2013-02-19 05:51:28-0800)

Mavenhome: /usr/local/apache-maven-3.0.5

Java version:1.6.0_45, vendor: Sun Microsystems Inc.

Javahome: /usr/local/jdk1.6.0_45/jre

Defaultlocale: en_US, platform encoding: UTF-8

OSname: "linux", version:"3.8.0-19-generic", arch:"i386", family: "unix"

6、安装Mahout

1）获取最新版代码，保存至/usr/local/目录下

$svn co http://svn.apache.org/repos/asf/mahout/trunk

$mv trunkmahout

2) 在/usr/local/mahout目录下执行，

$mvn cleaninstall-DskipTests=true

3) 在/usr/local/mahout/core目录下执行

$mvn compile

$mvn install

4) 在/usr/local/mahout/example目录下执行

$mvn compile

5) 修改~/.bashrc文件，增加下面内容

exportMAHOUT_HOME=/usr/local/mahout

exportPATH=$PATH:$MAHOUT_HOME/bin

四、运行Mahout实例

1）这里使用Mahout自带的Clustering of Synthetic controldata 实例；

2）下载synthetic_control.data文件，保存至$MAHOUT_HOME目录下；

http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data

注意检查文件大小，正确值为288374Bytes。

3) 在master节点上启动hadoop,启动后注意使用jps查看一下

$start-all.sh

4) 在HDFS中建立testdata目录

$hadoop fs -mkdirtestdata

5) 将本地的synthetic_control.data文件拷贝到HDFS的testdata目录下

$hadoopfs -put$MAHOUT_HOME/synthetic_control.data testdata

6) 运行mahoutjob

$mahoutorg.apache.mahout.clustering.syntheticcontrol.kmeans.Job

7) 查看运行结果

$hadoop fs -getoutput$MAHOUT_HOME/examples

$cd$MAHOUT_HOME/examples/output

$ls

终端上有如下信息说明结果正确。

clusteredPoints clusters-10-final clusters-4 clusters-7 data

clusters-0 clusters-2 clusters-5 clusters-8 _policy

clusters-1 clusters-3 clusters-6 clusters-9

五、Q&A

Q1) ssh: connectto host localhost port22: Connection refused

A1) ssh没有正确安装，按照上述步骤重新安装。

Q2) hduser is notin the sudoersfile. This incident willbe reported.

A2) 使用root用户，修改/etc/sudoers文件属性：chomod u+w /etc/sudoers,然后在该文件中添加如下内容：hduser ALL=(ALL:ALL) ALL，保存文件后，将文件属性改回：chomod u-w /etc/sudoers。

Q3)org.apache.hadoop.hdfs.server.datanode.DataNode:java.io.IOException:Incompatible namespaceIDs in /app/hadoop/tmp/dfs/data:namenode namespaceID =182065604; datanode namespaceID = 1620713375

A3) 每次namenodeformat会重新创建一个namenodeId,而tmp/dfs/data下包含了上次format下的id,namenode format清空了namenode下的数据,但是没有清空datanode下的数据,导致启动时失败,所要做的就是每次fotmat前,清空tmp下的所有内容。

Q4) NameNode is insafe mode

A4) 使用下面的命令解除：hadoopdfsadmin -safemode leave

Q5) Warning: $HADOOP_HOME isdeprecated.

A5) 将exportHADOOP_HOME_WARN_SUPPRESS=TRUE添加到每个节点的/etc/hadoop/hadoop-env.sh配置文件中。

Q6)org.apache.mahout.math.CardinalityException:My cardinality is: 0, but the otheris: 60

A6) 输入数据文件不完整，重新下载确认文件大小。

参考文献：

1、在ubuntu中配置SSH(解决connectto host localhost port 22:Connection refused问题) http://blog.csdn.net/feliciafay/article/details/6561414

2、解决ssh的"Writefailed: Broken pipe"问题,http://www.cnblogs.com/dudu/archive/2013/02/07/ssh-write-failed-broken-pipe.html

3、http://hadoop.apache.org/docs/r1.1.2/single_node_setup.html#PseudoDistributed

4、https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout

5、https://cwiki.apache.org/confluence/display/MAHOUT/Clustering+of+synthetic+control+data

6、http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

7、http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/

计算机考研408数据结构大题高频考点与真题解析竹木有心数据结构
一、线性表（顺序表与链表）1.1顺序表操作与算法设计高频考点：插入/删除操作的边界处理：检查下标越界与存储空间溢出子数组操作：合并、拆分、逆置等多数组综合问题：如寻找三元组最小距离真题示例：2020年408真题题目：给定三个升序数组S1、S2、S3，求所有可能的三元组(a,b,c)的最小距离D=|a−b|+|b−c|+|c−a|。解法：算法思想：三指针法遍历数组，每次移动当前最小元素的指针核心代码
探地雷达F-K偏移算法详解与Python实现 T2ccc 探地雷达算法 python
探地雷达F-K偏移算法详解与Python实现文章目录探地雷达F-K偏移算法详解与Python实现前言一、探地雷达成像原理与偏移的必要性二、F-K偏移的基本原理2.1波的传播与频率-波数域2.2F-K偏移的基本思路三、F-K偏移算法的数学推导3.1二维傅里叶变换3.2波场外推3.3Stolt映射（核心步骤）3.4逆变换四、F-K偏移的Python代码实现4.1辅助函数和数据准备4.2F-K偏移核心函
Akamai 与 AWS 风控分析与绕过技术探讨 qq_33253945 aws 云计算爬虫网络爬虫算法安全
1.引言本文将深入探讨Akamai风控和AWS签名算法的技术细节。请注意，文中内容仅供技术研究和学习交流使用。2.Akamai风控核心要素Akamai的主要风控机制包含以下几个关键点：Canvas指纹识别每个浏览器环境都有其独特的Canvas指纹这是风控系统的核心识别方式之一用户行为分析鼠标移动轨迹检测操作行为模式识别相关参数的实时计算与验证JA3指纹TLS握手特征识别客户端环境特征分析代码执行流
算法训练：2.移除元素(快慢指针) 貝森不想秃小白算法训练算法
算法原题:27.移除元素-力扣（LeetCode）移除数组元素移除一个元素时，需要将该元素之后的所有元素依次向前移动一个位置，以填补被移除元素的空位，对于静态数组来说，数组的长度是不会发生变化的，多余的数组元素不进行处理：例如{1,2,3,4}移除3,数组会得到{1，2，4，4}解题思路暴力移除通过for循环嵌套，访问到目标元素就将其后面的所有元素向前移动一格，循环往复快慢指针（本节主要内容）快慢
芒格的双轨分析：结合定性和定量的投资方法 SuperAGI2025 DeepSeek ai
芒格的"双轨分析"：结合定性和定量的投资方法关键词：芒格、双轨分析、定性分析、定量分析、投资方法、系统分析摘要：芒格的“双轨分析”是一种结合定性和定量分析的投资方法，旨在通过综合分析企业的内在价值和市场趋势，帮助投资者做出更科学的投资决策。本文将详细介绍双轨分析的背景、核心概念、算法原理、系统架构及实际应用，帮助读者全面理解并掌握这一方法。第一部分:芒格的双轨分析基础第1章:投资分析的演变与双轨分
基于AI智能算法的无人机城市综合治理 GeoSaaS 智慧城市人工智能无人机科技大数据智慧城市 gis
随着人工智能技术的飞速发展，无人机技术与AI的结合正在成为城市治理的新趋势。无人机不仅能够提供城市上空的高清视角，而且通过搭载的智能算法，可以实现自动化的监控、分析和响应，极大地提升了城市管理的效率和智能化水平。无人机技术在城市治理中的应用无人机技术在城市治理中的应用主要集中在以下几个方面：违法建筑监测：无人机可以快速覆盖大范围区域，自动识别并记录违建情况，提高执法效率。环卫垃圾识别：通过AI算法
常见的深度学习优化器青灯剑客算法 python 人工智能机器学习自然语言处理深度学习
一直用优化器解决问题，但是没有对它进行一个系统的总结。。不对，系统的总结进行过，只是时过境迁，早已忘却。一、照进我脑海的几个家伙一开始学习的当然是SGD，只是学着学着就忘记了。后来呢，接触到网上介绍的几种常用的优化器，看着原理挺给力，可是记了好几次都记不住。直到遇到《百面机器学习》，它从最基本的原理出发，给了我一点灵感。（1）几种常用的优化器，详情见这里链接34（2）二、以为自己遇见了大海老师说，
自然语言处理：文本聚类老赵爱学习 python 文本聚类 k均值聚类算法高斯混合模型的最大期望值算法无监督朴素贝叶斯模型自然语言处理人工智能
介绍大家好，博主又来和大家分享自然语言处理领域的知识了。今天给大家分享的内容是自然语言处理中的文本聚类。文本聚类在自然语言处理领域占据着重要地位，它能将大量无序的文本按照内容的相似性自动划分成不同的类别，极大地提高了文本处理和信息提取的效率。就好比在一个大型图书馆中，文本聚类能够像智能管理员一样，把各种书籍按照主题分类摆放，方便读者快速找到所需资料。而实现文本聚类的方法有很多，其中k均值聚类算法、
PyTorch 和 Python关系一只积极向上的小咸鱼 python pytorch 人工智能
1PyTorch和Python关系PyTorch和Python是两个不同但相互关联的工具，主要用于机器学习和深度学习领域。以下是它们之间的关系和各自的作用：Python编程语言:Python是一种高级编程语言，以其简洁易读的语法而闻名。广泛使用:Python在数据科学、人工智能、Web开发、自动化等多个领域有着广泛的应用。库和生态系统丰富:Python拥有丰富的第三方库和工具，如NumPy、pan
【工厂老板必看】智能切割算法帮您省 30% 原材料！附真实案例——一维下料问题算法、cad c#二次开发山水CAD筑梦人 CAD C#二次开发算法
一、行业痛点：原材料浪费有多严重？现象：传统人工排料导致大量边角料，例如：某钢材厂每月因切割不合理损失15万元木材加工厂平均浪费率高达25%核心问题：无法兼顾切割数量与材料利用率人工计算耗时且容易出错二、解决方案：贪心算法和遗传算法切割优化系统技术原理（通俗解释）：用贪心算法和遗传算法通过编程，自动生成最优切割方案，比人工排料效率高100倍以上！核心优势：省材料：原材料总根数减少20%-40%降成
贪心算法——c# 山水CAD筑梦人 C#学习笔记贪心算法算法
贪心算法通俗解释贪心算法是一种"每一步都选择当前最优解"的算法策略。它不关心全局是否最优，而是通过局部最优的累积来逼近最终解。优点是简单高效，缺点是可能无法得到全局最优解。一句话秒懂自动售货机找零钱：用最少数量的硬币凑出指定金额。比如找零198美分，它会优先用25美分的大硬币，不够再用小的，直到凑够金额。背景故事想象你在加拿大超市当收银员（CAD场景）：顾客买了东西你需要快速找出零钱198分收银台
智能车辆控制技术：MPC与轨迹规划实战项目柚木i
本文还有配套的精品资源，点击获取简介：本压缩包集合了车辆转向控制与轨迹规划的MATLAB代码，包含模型预测控制（MPC）策略、MPT工具箱应用、车辆动力学模型构建、轨迹规划实现、mp-QP算法应用及MATLAB编程实践。旨在通过源码分析，提供智能车辆控制技术的深入学习与研究平台，涉及横向和纵向运动控制、系统模型的定义、控制策略的制定及仿真流程。1.模型预测控制（MPC）基础与应用模型预测控制（MP
Python与人工智能：为何它们是天作之合？纪至训至 python 人工智能开发语言
引言在人工智能（AI）飞速发展的今天，Python已成为这一领域的“明星语言”。从机器学习到深度学习，从自然语言处理到计算机视觉，Python的身影无处不在。那么，Python究竟为何能成为AI开发的首选工具？本文将探讨Python与AI之间的深度关联，并解析其背后的原因。1.Python的简洁性与可读性AI开发的核心在于快速迭代和实验，而Python以其简洁的语法和直观的代码结构著称。开发者无需
Manus详解，看这一篇就够了程序员鑫港 langchain 数据库人工智能 AI 大模型 Agent 智能体
Monica公司发布了AIAgent智能体产品——Manus，是一款具备突破性技术的通用型AI代理，根据Manus官网（https://manus.im）技术白皮书和网络公开资料，整理Manus核心技术和应用信息如下，欢迎讨论。技术架构多智能体协作系统Manus采用规划代理、执行代理和验证代理的分工机制，模拟人类工作流程，提升复杂任务的处理效率。规划代理采用蒙特卡洛树搜索（MCTS）算法优化任务拆
多目标优化算法之NSGA-II、NSGA-III（附Matlab免费代码）优化算法侠Swarm-Opti 智能优化算法算法 matlab 开发语言优化算法 NSGA
引言NSGA-II和NSGA-III都是非支配排序遗传算法的变种，用于解决多目标优化问题，但它们在多个方面存在差异。相同点基本框架相似：两者都基于遗传算法的框架，包括初始化种群、非支配排序、选择、交叉和变异等操作非支配排序：都采用非支配排序技术，将种群中的个体划分为不同的前沿，识别非支配解集不同点适用目标数量不同：NSGA-II：适用于相对较少的目标数量，通常在2到4个目标之间，在处理较少目标的问
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
Python实现数据结构与算法——反转字符串 Mantana 数据结构与算法字符串算法数据结构递归法
题目描述：编写一个函数，其作用是将输入的字符串反转过来。输入字符串以字符数组char[]的形式给出。不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用O(1)的额外空间解决这一问题。你可以假设数组中的所有字符都是ASCII码表中的可打印字符。示例1：输入：["h","e","l","l","o"]输出：["o","l","l","e","h"]示例2：输入：["H","a"
深度掌握 ReactJS 高级概念：前端开发者必备前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读这篇文章汇总了ReactJS中值得深入研究的高级概念。读完后，不仅在前端面试中能更胸有成竹，还能自行开发一个类似ReactJS的UI库。目录Rendering的含义与过程Re-rendering发生的机制及原因VirtualDOM的原理Reconciliation算法的运行方式ReactJS的性能优化方案1
我的AI工具箱Tauri版-建筑平面图生成装修设计 Mr数据杨 Tauri工具箱 ComfyUI
本模块利用先进的AI绘画大模型，将房屋平面设计图转化为高质量的室内装修效果图，让装修设计更加直观、高效。用户只需提供房屋的平面布局，并选择合适的AI绘画模型，系统即可智能生成涵盖客厅、卧室、厨房、卫生间等最多12个房间的高品质设计样图，完整呈现房屋的整体装修效果。本工具支持多种设计风格，如现代简约、北欧风、中式传统、美式复古、日式禅意等，满足不同用户的个性化装修需求。借助AI算法的自动化生成能力，
数据结构与算法——哈希表，数组加强哈希表，双链表加强哈希表 Book_熬夜！数据结构与算法散列表哈希算法数据结构 javascript 算法
文章目录哈希表1.数组实现hash表2.双链表实现hash表哈希表key是唯一的，value可以重复哈希表和我们常说的Map（键值映射）不是同一个东西。【Map】是一个Java接口，仅声明了若干个方法，并没有给出方法的具体实现；HashMap这种数据结构根据自身特点实现了这些操作。可以说hashmap的get、put、remove等方法复杂度为O(1)，但是map接口的复杂度不一定，需要看他底层数
动态边界冒泡排序优化 Cybernetic Sage 算法排序算法
下午在复习排序算法时，突发奇想自己按照鸡尾酒排序算法思路写一遍，然后动态边界冒泡排序（DynamicBoundaryBoubbleSort）就这么诞生了。它的思路与鸡尾酒排序不同的是：每次扫描后根据最后一次交换的位置动态调整边界减少无效比较，在数组部分有序的情况下，效率应该比鸡尾酒排序更高。代码如下：#includeusingnamespacestd;constintN=1005;inta[N];
简说JVM 祁小白2024 jvm java 后端
目录前言正文JVM内存区域划分JVM执行方式JVM的类加载机制类加载器类加载器的类型自定义类加载器垃圾回收垃圾回收的问题垃圾回收的范围垃圾回收机制垃圾回收算法释放垃圾内存空间前言在Java的技术体系中，有两个至关重要的组件，分别是JVM（Java虚拟机）和Javac（Java编译器），它们在Java程序的生命周期中扮演着截然不同但又紧密关联的角色。Javac编译器的职责是将开发者编写的.java源
机器学习算法在司法预测中的应用【附保姆级代码】一键难忘机器学习算法人工智能
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中~机器学习算法在司法预测中的应用司法预测作为法律领域的前沿研究
【算法学习之路】9.单调栈零零时算法学习之路算法学习 c++开发语言单调栈数据结构
栈和队列前言一.简介二.操作（以底到顶递增为例）三.元素大小判断（以底到顶递增为例）四.单调栈的应用12前言我会将一些常用的算法以及对应的题单给写完，形成一套完整的算法体系，以及大量的各个难度的题目，目前算法也写了几篇，题单正在更新，其他的也会陆陆续续的更新，希望大家点赞收藏我会尽快更新的！！！一.简介单调栈的元素是严格单调递增和递减也就是说从栈底到栈顶元素的值逐渐增大或减小，多用于求解元素的左右
蓝桥杯省赛真题C++B组2024-握手问题 .ccl 蓝桥杯 c++算法
一、题目【问题描述】小蓝组织了一场算法交流会议，总共有50人参加了本次会议。在会议上，大家进行了握手交流。按照惯例他们每个人都要与除自己以外的其他所有人进行一次握手(且仅有一次)。但有7个人，这7人彼此之间没有进行握手(但这7人与除这7人以外的所有人进行了握手)。请问这些人之间一共进行了多少次握手?注意A和B握手的同时也意味着B和A握手了，所以算作是一次握手。二、思路方法一：对于这种题，我一般是来
PyTorch深度学习框架60天进阶学习计划 - 第19天：时间序列预测凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程迁移学习 python
PyTorch深度学习框架60天进阶学习计划-第19天：时间序列预测目录时间序列预测概述滑动窗口数据构造方法归一化策略对比：MinMaxvsZ-ScoreLSTM基础原理Attention机制与LSTM结合LSTM-Attention模型实现TeacherForcing技术与应用Prophet基准模型对比多步预测的滚动验证方法综合实战：股票价格预测1.时间序列预测概述时间序列预测是机器学习中的一个
PyTorch深度学习框架60天进阶学习计划 - 第18天：模型压缩技术凡人的AI工具箱深度学习 pytorch 学习 python 人工智能
PyTorch深度学习框架60天进阶学习计划-第18天：模型压缩技术目录模型压缩技术概述知识蒸馏详解软标签生成策略KL散度损失推导温度参数调节结构化剪枝技术通道剪枝评估准则L1-norm剪枝算法APoZ剪枝算法量化训练基础量化类型与精度PyTorch量化API剪枝与量化协同优化Torch.fx动态计算图修改自动化模型压缩流程实现实战案例：ResNet模型压缩性能评估与分析进阶挑战与思考1.模型压缩
hive 数字转换字符串_Hive架构及Hive SQL的执行流程解读 weixin_39756416 hive 数字转换字符串
1、Hive产生背景MapReduce编程的不便性HDFS上的文件缺少Schema(表名，名称，ID等，为数据库对象的集合)2、Hive是什么Hive的使用场景是什么？基于Hadoop做一些数据清洗啊(ETL)、报表啊、数据分析可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。Hive是SQL解析引擎，它将SQL语句转译成M/RJob然后在Hadoop执行。由Facebook开源，
代码随想录算法训练营day2| 209.长度最小的子数组|59.螺旋矩阵II|区间和|开发商购买土地 70ng 算法矩阵线性代数 leetcode java
209.长度最小的子数组找出该数组中满足其总和大于等于target的长度最小的子数组[numsl,numsl+1,...,numsr-1,numsr]，并返回其长度**。**如果不存在符合条件的子数组，返回0。classSolution{publicintminSubArrayLen(inttarget,int[]nums){intfast=0;//快指针intslow=0;//慢指针intsum
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

hadoop + mahout 安装配置

你可能感兴趣的:(hadoop,算法,机器学习)