小杰911

【大数据学习篇8】热门品类Top10分析

在HBase命令行工具中执行“list”命令，查看HBase数据库中的所有数据表。学习目标/Target

掌握热门品类Top10分析实现思路

掌握如何创建Spark连接并读取数据集

掌握利用Spark获取业务数据

掌握利用Spark统计品类的行为类型

掌握利用Spark过滤品类的行为类型

掌握利用Spark合并相同品类的行为类型

掌握利用Spark根据品类的行为类型进行排序

掌握将数据持久化到HBase数据库

熟悉通过Spark On YARN运行程序

概述

品类指商品所属分类，用户在访问电商网站时，通常会产生很多行为，例如查看商品的信息、将感兴趣的商品加入购物车和购买商品等，这些行为都将作为数据被网站存储。本章我们将通过对电商网站存储的用户行为数据进行分析，从而统计出排名前10的热门品类。

1. 数据集分析

某电商网站2019年11月产生的用户行为数据存储在文件user_session.txt，该文件中的每一行数据都表示一个用户行为。

{"user_session":"0000007c-adbf-4ed7-af17-d1fef9763d67","event_type":"view","category_id":"2053013553090134275", "user_id":"560165420","product_id":"8900305","address_name":"Maryland","event_time":"2019-11-18 09:16:19"}

user_session：用于标识用户行为的唯一值。

event_type：表示用户行为的类型，包括view（查看）、cart（加入购物车）和purchase（购买）行为。

category_id：表示商品品类ID。

user_id：表示用户ID。

product_id：表示商品ID。

address_name：表示产生事件的区域。

event_time：表示产生事件的具体时间。

2. 实现思路分析

分别统计各个品类商品的查看次数、加入购物车次数以及购买次数。

将同一品类中商品的查看、加入购物车以及购买次数进行合并。

自定义排序规则按照各个品类中商品的查看、加入购物车和购买次数进行降序排序，获取排名前10的品类，就是热门品类Top10。排序时，优先按照各个品类商品的查看次数降序排列，如果查看次数相同，则按照各个品类商品的加入购物车次数进行降序排列。如果查看次数和加入购车次数都相同，那么按照各品类商品的购买次数进行降序排列。

将同一品类中商品的查看、加入购物车和购买次数映射到自定义排序规则中进行排序处理。

读取数据集中的行为类型（event_type）和品类ID（category_id）数据，为了便于后续聚合处理时，将相同Key的Value值进行累加，计算每个品类中不同行为出现的总次数，这里需要对输出结果的数据格式进行转换处理，将行为类型和品类ID作为Key，值1作为Value。

统计各个品类的查看、加入购物车和购买次数。

将聚合结果进行过滤处理，并分为三部分数据，分别是各个品类查看次数、各个品类加入购物车次数和各个品类购买次数。对过滤后的三部分数据进行转换处理，去除数据中的行为类型字段。此步目的是为了后续合并操作时，明确同一品类中不同行为类型所处位置。

将Key值相同的Value进行合并处理，目的是为了将相同品类的查看次数、加入购物车次数和购买次数合并到一行。

对每个品类中查看次数（viewcount）、加入购物车次数（cartcount）和购买次数（purchasecount）进行排序处理，在排序过程会涉及三类值的排序，因此这里需要使用Spark的二次排序，在排序操作时使用自定义排序的方式进行处理。

3. 实现热门品类Top10

3.1 创建项目

本项目在Windows环境下通过IntelliJ IDEA工具构建Maven项目实现，需要提前在Windows环境下安装JDK1.8环境。

创建Maven项目

打开IntelliJ IDEA开发工具进入IntelliJ IDEA欢迎界面。

在IntelliJ IDEA欢迎界面单击下拉框“Configure”，依次选择“Project Defaults”→“Project Structure”选项，配置项目使用的JDK。

配置Maven项目的组织名（GroupId）和项目工程名（ArtifactId）。

配置项目名称（Project name）和项目本地的存放目录（Project location）。

Maven项目创建完成后的目录结构。

导入依赖

在项目pom.xml文件中添加如下配置内容：对项目中Netty依赖进行多版本管理，避免本地运行出现多个版本的Netty导致程序出现NoSuchMethodError异常。引入JSON依赖，用于解析JSON数据。引入HBase依赖，用于操作HBase数据库。引入Spark依赖，用于开发Spark数据分析程序。指定Maven编译的JDK版本。配置程序打包方式并指定程序主类。

创建项目目录

在项目SparkProject中新建Package包。

在“New Package”窗口的文本输入框“Enter new package name”中输入“cn.itcast.top10”设置Package名称，用于存放实现热门品类Top10分析的类文件。

在Package包“cn.itcast.top10”新建类。

在“Create New Class”窗口的文本输入框“Name”中输入“CategoryTop10”设置类名称，在类中实现热门品类Top10分析。

3.2创建Spark连接并读取数据集

在类CategoryTop10中定义main()方法，该方法是Java程序执行的入口，在main()方法中实现Spark Core程序。

public class CategoryTop10 { public static void main(String[] arg){ //实现热门品类Top10分析 } }

在main()方法中，创建JavaSparkContext和SparkConf对象，JavaSparkContext对象用于实现Spark程序，SparkConf对象用于配置Spark程序相关参数。

SparkConf conf = new SparkConf(); //设置Application名称为top3_area_product conf.setAppName("top10_category"); JavaSparkContext sc = new JavaSparkContext(conf);

在main()方法中，调用JavaSparkContext对象的textFile()方法读取外部文件，将文件中的数据加载到textFileRDD。

JavaRDD textFileRDD = sc.textFile(arg[0]);

3.3 获取业务数据

在main()方法中，使用mapToPair()算子转换textFileRDD的每一行数据，用于获取每一行数据中的行为类型和品类ID数据，将转换结果加载到transProductRDD。

JavaPairRDD,Integer> transformRDD = textFileRDD.mapToPair(new PairFunction, Integer>() { @Override public Tuple2, Integer> call(String s) throws Exception { JSONObject json = JSONObject.parseObject(s); String category_id = json.getString("category_id"); String event_type = json.getString("event_type"); return new Tuple2<>(new Tuple2<>(category_id,event_type), new Integer(1)); } });

3.4 统计品类的行为类型

在main()方法中，使用reduceByKey()算子对transformRDD进行聚合操作，用于统计每个品类中商品被查看、加入购物车和购买的次数，将统计结果加载到aggregationRDD。

JavaPairRDD, Integer> aggregationRDD = transformRDD.reduceByKey( new Function2() { @Override public Integer call(Integer integer1, Integer integer2) throws Exception { return integer1 + integer2; } });

3.5 过滤品类的行为类型

在main()方法中，首先使用filter()算子过滤aggregationRDD每一行数据中行为类型为加入购物车和购买的数据，只保留行为类型为查看的数据，然后使用mapToPair()算子对过滤结果进行转换，获取每一行数据中品类被查看次数和品类ID数据，最终将转换结果加载到getViewCategoryRDD。

JavaPairRDD getViewCategoryRDD =aggregationRDD .filter(new Function, Integer>, Boolean>() { @Override public Boolean call(Tuple2, Integer> tuple2) throws Exception { String action = tuple2._1._2; return action.equals("view"); } }).mapToPair(new PairFunction, Integer>, String, Integer>() { @Override public Tuple2 call(Tuple2, Integer> tuple2)throws Exception { return new Tuple2<>(tuple2._1._1,tuple2._2); } });

在main()方法中，首先使用filter()算子过滤aggregationRDD每一行数据中行为类型为查看和购买的数据，只保留行为类型为加入购物车的数据，然后使用mapToPair()算子对过滤结果进行转换，获取每一行数据中品类被加入购物车次数和品类ID数据，最终将转换结果加载到getCartCategoryRDD。

JavaPairRDD getCartCategoryRDD = aggregationRDD .filter(new Function, Integer>, Boolean>() { @Override public Boolean call(Tuple2, Integer> tuple2) throws Exception { String action = tuple2._1._2; return action.equals("cart"); } }).mapToPair(new PairFunction, Integer>, String, Integer>() { @Override public Tuple2 call(Tuple2, Integer> tuple2) throws Exception { return new Tuple2<>(tuple2._1._1,tuple2._2); } });

在main()方法中，首先使用filter()算子过滤aggregationRDD每一行数据中行为类型为查看和加入购物车的数据，只保留行为类型为购买的数据，然后使用mapToPair()算子对过滤结果进行转换，获取每一行数据中品类被购买次数和品类ID数据，最终将转换结果加载到getPurchaseCategoryRDD。

JavaPairRDD getPurchaseCategoryRDD = aggregationRDD .filter(new Function, Integer>, Boolean>() { @Override public Boolean call(Tuple2, Integer> tuple2) throws Exception { String action = tuple2._1._2; return action.equals("purchase"); } }).mapToPair(new PairFunction, Integer>, String, Integer>() { @Override public Tuple2 call(Tuple2, Integer> tuple2) throws Exception { return new Tuple2<>(tuple2._1._1,tuple2._2); } });

3.6 合并相同品类的行为类型

在main()方法中，使用leftOuterJoin（左外连接）算子合并getViewCategoryRDD、getCartCategoryRDD和getPurchaseCategoryRDD，用于合并同一品类的查看次数、加入购物车次数和购买次数，将合并结果加载到joinCategoryRDD。

JavaPairRDD>> tmpJoinCategoryRDD =getViewCategoryRDD.leftOuterJoin(getCartCategoryRDD); JavaPairRDD>,Optional>> joinCategoryRDD = tmpJoinCategoryRDD.leftOuterJoin(getPurchaseCategoryRDD);

Optional类是一个包含有可选值的包装类，它既可以含有对象也可以为空，主要为了解决空指针异常的问题，因为某些品类中的商品可能被查看但并未被购买或加入购物车。

3.7 根据品类的行为类型进行排序

在包“cn.itcast.top10”中创建文件CategorySortKey.java，用于实现自定义排序。在类CategorySortKey中继承比较器接口Comparable和序列化接口Serializable，并实现Comparable接口的compareTo()方法。

import java.io.Serializable; public class CategorySortKey implements Comparable,Serializable{ ...... @Override public int compareTo(CategorySortKey other) { if(viewCount - other.getViewCount() != 0) { return (int) (viewCount - other.getViewCount()); } else if(cartCount - other.getCartCount() != 0) { return (int) (cartCount - other.getCartCount()); } else if(purchaseCount - other.getPurchaseCount() != 0) { return (int) (purchaseCount - other.getPurchaseCount()); } return 0; } }

在main()方法中，使用mapTopair()算子转换joinCategoryRDD，将joinCategoryRDD中品类被查看次数、加入购物车次数和购买次数映射到自定义排序类CategorySortKey，通过transCategoryRDD加载转换结果。

JavaPairRDD transCategoryRDD = joinCategoryRDD .mapToPair(new PairFunction>,Optional>>,CategorySortKey,String>() { @Override public Tuple2 call(Tuple2>, Optional>> tuple2) throws Exception { String category_id = tuple2._1; int viewcount = tuple2._2._1._1; int cartcount = 0; int purchasecount = 0; if (tuple2._2._1._2.isPresent()){ cartcount = tuple2._2._1._2.get().intValue();} if (tuple2._2._2.isPresent()){ purchasecount = tuple2._2._2.get().intValue(); } CategorySortKey sortKey = new CategorySortKey(viewcount, cartcount, purchasecount); return new Tuple2<>(sortKey,category_id); } });

在main()方法中，通过sortByKey()算子对transCategoryRDD进行排序操作，使transCategoryRDD中品类被查看次数、加入购物车次数和购买次数根据自定义排序类CategorySortKey指定的排序规则进行排序，将排序结果加载到sortedCategoryRDD。

JavaPairRDD sortedCategoryRDD = transCategoryRDD.sortByKey(false);

在main()方法中，使用take()算子获取sortedCategoryRDD前10个元素，即热门品类Top10分析结果，将分析结果加载到top10CategoryList。

List> top10CategoryList = sortedCategoryRDD.take(10);

3.3.8 数据持久化

封装工具类:

（1）在项目SparkProject的 java目录新建Package包“cn.itcast.hbase”，用于存放实现数据持久化的Java文件。在包“cn.itcast.hbase”下创建文件HbaseConnect.java，用于实现封装HBase数据库连接工具类，在类中实现连接HBase数据库的操作。

（2）在项目SparkProject的包“cn.itcast.hbase”中创建文件HbaseUtils.java，用于实现封装HBase数据库操作工具类，在类中实现创建HBase数据表和向HBase数据表中插入数据的操作。

持久化热门品类Top10分析结果

在类CategoryTop10中添加方法top10ToHbase()，用于将热门品类Top10分析结果持久化到HBase数据库中，该方法包含参数top10CategoryList，表示热门品类Top10分析结果数据。

public static void top10ToHbase(List> top10CategoryList) throws Exception{ HbaseUtils.createTable("top10","top10_category"); String[] column = {"category_id","viewcount","cartcount","purchasecount"}; String viewcount = "" , cartcount = "", purchasecount = "", category_id = ""; int count = 0; for (Tuple2 top10: top10CategoryList) { count++; viewcount = String.valueOf(top10._1.getViewCount()); cartcount = String.valueOf(top10._1.getCartCount()); purchasecount = String.valueOf(top10._1.getPurchaseCount()); category_id = top10._2; String[] value = {category_id,viewcount,cartcount,purchasecount}; HbaseUtils.putsToHBase("top10","rowkey_top"+count,"top10_category",column,value); } }

在类CategoryTop10的main()方法中，调用方法top10ToHbase()并传入参数top10CategoryList，用于在Spark程序中实现top10ToHbase()方法，将热门品类Top10分析结果持久化到HBase数据库中的数据表top10。

try { top10ToHbase(top10CategoryList); } catch (Exception e) { e.printStackTrace(); } HbaseConnect.closeConnection(); sc.close();

4. 运行程序

在IntelliJ IDEA中将热门品类Top10分析程序封装成jar包，并上传到集群环境中，通过spark-submit将程序提交到YARN中运行。

封装jar包:

在IntelliJ IDEA主界面单击右侧“Maven”选项卡打开Maven窗口。

在Maven窗口单击展开Lifecycle折叠框，双击Lifecycle折叠框中的“package”选项，IntelliJ IDEA会自动将程序封装成jar包，封装完成后，若出现“BUILD SUCCESS”内容，则证明成功封装热门品类Top10分析程序为jar包。

在项目SparkProject中的target目录下会生成SparkProject-1.0-SNAPSHOT.jar文件，为了便于后续与其它程序区分，这里将默认文件名称修改为CategoryTop10.jar。

将jar包上传到集群:

使用远程连接工具SecureCRT连接虚拟机Spark01，在存放jar文件的目录/export/SparkJar/（该目录需提前创建）下执行“rz”命令，上传热门品类Top10分析程序的jar包CategoryTop10.jar。

将数据集上传到本地文件系统:

使用远程连接工具SecureCRT连接虚拟机Spark01，在存放数据文件的目录/export/data/SparkData/（该目录需提前创建）下执行“rz”命令，将数据集user_session.txt上传至本地文件系统。

在HDFS创建存放数据集的目录:

将数据集上传到HDFS前，需要在HDFS的根目录创建目录spark_data，用于存放数据集user_session.txt。

hdfs dfs -mkdir /spark_data

上传数据集到HDFS:

将本地文件系统目录/export/data/SparkData/下的数据集user_session.txt上传到HDFS的spark_data目录下。

hdfs dfs -put /export/data/SparkData/user_session.txt /spark_data

提交热门品类Top10分析程序到YARN集群:

通过Spark安装目录中bin目录下的shell脚本文件spark-submit提交热门品类Top10分析程序到Hadoop集群的YARN运行。

spark-submit \

--master yarn \

--deploy-mode cluster \

--num-executors 3 \

--executor-memory 2G \

--class cn.itcast.top10.CategoryTop10 \

/export/SparkJar/CategoryTop10.jar /spark_data/user_session.txt

查看程序运行状态:

程序运行时在控制台会生成“Application ID”（程序运行时的唯一ID），在浏览器输入“192.168.121.132:8088”，进入YARN的Web UI界面，通过对应“Application ID”查看程序的运行状态，当程序运行完成后State为FINISHED，并且FinalStatus为SUCCEES。

查看程序运行结果：

在虚拟机Spark01执行“hbase shell”命令，进入HBase命令行工具。

在HBase命令行工具中执行“list”命令，查看HBase数据库中的所有数据表。

> list TAB

test

top10

2 row(s) in 0.1810 seconds

在HBase命令行工具执行“scan 'top10'”命令，查询数据表top10中的数据。

本文主要讲解了如何通过用户行为数据实现热门品类Top10分析，首先我们对数据集进行分析，使读者了解用户行为数据的数据结构。接着通过实现思路分析，使读者了解热门品类Top10分析的实现流程。然后通过IntelliJ IDEA开发工具实现热门品类Top10分析程序并将分析结果存储到HBase数据库，使读者掌握运用Java语言编写Spark Core和HBase程序的能力。最后封装热门品类Top10分析程序并提交到集群运行，使读者掌握运用IntelliJ IDEA开发工具封装Spark Core程序以及Spark ON YARN模式运行Spark Core程序的方法。

日精进213天管西芹
敬爱的李老师，智慧的班主任，亲爱的跃友们大家好：2019年2月12号我是(管西芹），我的日精进行动第213天和大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1.比学习:读书每天读点心里学.学习无处都在。书中学习耐力，学习方法。2、比改变：所有的改变都是内心的态度，和主动的去做。说到不如做到。心变世界就变。观世界才有世界观。利他思维。沉默是也是一种改变。接纳，容纳所有
学习易效能前后的我小高_59f5
一、为何学习易效能我报名线下课一个很重要的原因是想陪孩子一起改变，由于我没给孩子做好榜样，她身上也由很多不好的习惯，比如熬夜、拖延、时间观念差，正好她今年刚毕业，我想这是一个改变自己的好机会，我希望她接触一些高能量的人，帮助她确立目标和人生方向。二、学习回来的收获：1.积极主动刘鑫老师说他有今天的改变得益于“积极主动”四个字，所以在课程结束选组长时，我就答应了小组伙伴的推荐，由于我们组是课堂作业P
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
大家好，今天是2020年8月4日，是我学习成长1000天打卡的第201天。今天继续和大家学习《家里的黄金》人类最重要的资产是头脑总结篇之五第三部分开采你的黄金一、把你的定位和角色从消费者转移到供应商代表，你将会像沃尔玛一样分得利润并赚到金钱。而不是像传统消费者一样只是花钱。将自己定位为供应商代表，能让你将家用产品和服务的支出转变为收入，还能在此过程中拥有自己的人生。二，所有营销手段都有相同的目标建
PyQt5学习笔记 Shane1111111 qt 学习笔记
来源：王铭东老师的B站教程链接：PyQt5快速入门_哔哩哔哩_bilibili基本控件QRadioButtonQLineedit#清空xxx.clear()#插入新内容到最右光标处xxx.insert("内容")布局1.水平布局创建组#hobby主要是保证他们是一个组。hobby_box=QGroupBox("爱好")设置hobby_box的布局将组中内容添加到该组的容器中将组hobby_box添
见识行成
刚开始听说见识，是农村里常说的老话：头发长，见识短！说的是女人的不足。后来上小学读过一篇文章叫井底观天，讲的一只出生在井底的青蛙，认为全世界就是这口井，井口就是全部的天空。后来遇到一只来喝水的小鸟，告诉它世界很大，要带它去看看。但是它只相信自己看到的接触的。这个故事充分的说明了见识的差距对个人的影响。最后来说我上个主题营看的《好好学习》这本书，其中有一个小点：重新定义问题。见识高的人面对问题会系统
PyQT5 新手入门学习笔记 UncleShuShuShu python的坑 python pyqt5
一、PyQt5的起点第一个简单的pyqt程序#创建一个label程序（QLabel模块）importsysfromPyQt5.QtWidgetsimportQApplication,QLabelif__name__=='__main__':app=QApplication(sys.argv)label=QLabel('helloworld')#label的setText方法:label=Qlabe
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
2022年4月22日《纪律教育》培训总结—梁晓燕+春蕾五幼 bf1938403052
一、感受相信很多人对行为主义教育体会都很深刻吧，但这种教育并不理想，并没有达到期望的效果。反而会激化问题，使得当事人更加厌恶去学，抵触学，甚至想尽办法逃离学习，丧失学习兴趣。适合的方式会事半功倍，不当的方式会难上加难。二、收获孩子的成长都是阶段性，不同阶段有不同的表现，我们也有不同的教育方式，静下心，耐心陪孩子，了解孩子。对孩子相应年龄抱与其年龄相仿的期望值，不要有太高的期望值，不要以“爱”的名义
2020-01-09 感恩123
张芝若原创分享218天今天在办公室里说起我们班的三个学习有困难的学生，我表达了对这三位孩子的一种愧疚。林梦琪是一个留守儿童，接受知识又很难，每当看到他站起来读书很不流畅，班里边其他同学都在干巴巴的等着他，我会不耐烦的给他空过去。发现一道很简单的课文她都没背会，读起来可能也会吭吭呲呲，我会不耐烦，没有耐心，也没有时间领着她，读着别人已经背会的课文。有时候还会当着他的面说出父母不负责任的话。林浩辰是林
Rust入门之并发编程基础（三）
Rust入门之并发编程基础（三）题记：6月底7月初，结束北京的工作生活回到二线省会城市发展了，鸽了较久了，要继续坚持学习Rust，坚持写博客。背景我们平时使用计算机完成某项工作的时候，往往可以同时执行多个任务，比如可以编程的时候同时播放音乐，就算是单核CPU也是如此。这是因为现代计算机操作系统会使用**“中断机制”**来执行任务，任务可以分为：“CPU密集型“或者“计算密集型””IO密集型“根据这
思考笔记1392/2023-10-22 农N代fun
黄奇帆老师的一篇文章《当下中国的发展，很多看起来是问题，实际上是成果。》其中一段关于数字经济的内容学习，因为作为数字化、智能化这个行业一线搬砖工人，对这一方面知识还是相当有感触，特别是今天读到这一段落，以黄奇帆老师的身份一定程度上也算是代表着国家级对这个行业顶层计划阐明发展方向了。（节选一）制造业数字化，就是要推进产业互联网、工业互联网。推进产业互联网将大大促进数字经济发展。我国曾提出数字经济三大
湘容儿成长日记第883天孩子只是想确认我对她的爱墨mo晴
亲子共读第949天2021年6月4日亲子共读地點：歺桌亲子共读时间：晚上亲子共读时长：15分钟亲子共读内容：湖上的月光烛（老槐树）我时常会遇到这样的问题，就是孩子明明可以自己做好的事，却一定要求让我帮她。而比较一根筋的我，就是拒绝孩子的这个提议，虽我不会过多的评判，我会冷静的告诉她，自己的事自己做。那么问题就来了，有生活中我也常有让孩子帮忙的事，站在我的角度我是希望她能够多学习一点，学会生活的点滴
2023-7-7晨间日记德三努
今天是什么日子起床：6：00就寝：23：00天气：晴心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：勤学习，勤工作，勤锻炼本月重要成果：卧薪尝胆，闻鸡起舞今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务努力完成各项工作。财务检视人际的投入开卷有益-学习/读书/听书听书60分钟健康与饮食今日步数：7102今日锻炼：走路今日饮食：按时吃饭一日三餐。好习惯打卡1、按时吃饭一日三餐。2、按时
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
Spring - BeanFactory 和 ApplicationContext 有什么区别撸帝
学习完整课程请移步互联网Java全栈工程师BeanFactory可以理解为含有bean集合的工厂类。BeanFactory包含了种bean的定义，以便在接收到客户端请求时将对应的bean实例化。BeanFactory还能在实例化对象的时生成协作类之间的关系。此举将bean自身与bean客户端的配置中解放出来。BeanFactory还包含了bean生命周期的控制，调用客户端的初始化方法（initia
10万钻贝计划·50d，入70钻贝，学习在路上薇语
收益截图：话说我很疯狂，真的。工作上，偶尔遇上的学习机会也是，可是，虽然忙，我还是乐意参与的。这段时间，同事请产假孕假，导致严重超工作量，今天是尝试的第二天，整整两天马不停蹄的工作，确实很酸爽。可偏偏，我还报名了心理B证培训，一个年级28号人，仅有的两个名额，我抢了一个，太主动了。问题是，这培训会用到若干个周五和周六，这问题就来了。一是，班主任的工作，每个周五我需要提前做好预案，在周四把所有事情安
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
2019-1-2晨间日记薄小仨
今天是什么日子起床：07:40就寝：22:30天气：晴心情：良好纪念日：无任务清单昨日完成的任务，最重要的三件事：1、系统升级完成2、阅读文章3、支持的系统问题修改改进：阅读速度慢并且看后记住的东西少，需要慢慢改正习惯养成：每天阅读周目标·完成进度1、每天阅读六篇文章2、每天早睡（10:30之前）3、每天跑3公里4、每天仰卧起坐1005、每天俯卧撑2006、坚持每天打卡学习·信息·阅读1、主要阅读
六项精进打卡2018.11.13 自省YQ
姓名杨强常州新日催化剂有限公司【日精进打卡第104天】【知～学习】《六项精进》1遍共104遍《大学》1遍共104遍【行～实践】一、修身：（对自己个人）1.坚持锻炼2、坚持反省。二、齐家：（对家庭和家人）1.洗碗2.陪儿子做作业三、建功1.安装调节阀2.更换2号热电偶3.5号试漏。积善｝：发愿整理从2018年7月29日起1年内365起善事。今日1善，累计103善。【省～觉悟】1.每天必须规定自己一定
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
入门大模型神器：开源项目Happy LLM保姆级教程！
Happy-LLMHappy-LLM——从零开始的大语言模型原理与实践教程。本项目是一个系统性的LLM学习教程，将从NLP的基本研究方法出发，根据LLM的思路及原理逐层深入，依次为读者剖析LLM的架构基础和训练过程。同时，我们会结合目前LLM领域最主流的代码框架，演练如何亲手搭建、训练一个LLM，期以实现授之以鱼，更授之以渔。希望大家能从这本书开始走入LLM的浩瀚世界，探索LLM的无尽可能。特点•
《有关写书评文章的写作框架》千江雪_2932
11月5日书评比读后感难写，对于新手来说，要先掌握好写书评的套路和写作框架，然后先按着框架写，要不写着写着就写成读后感去了。因为想要写书评，所以，正在不断学习的过程中，今天发现有这么一篇文章，作者把书评的写作框架和过程说的非常的清楚。所以学习笔记了。写文章都要谋篇布局，写书评也是一样的，先列出主题和文章框架。以下是最简单也是最常见的书评文章框架。1、开篇破题2、引出书的内容梗概及作者简介3、用一个
2018-06-23 亮亮sxm
孙小猛～河北惠友集团【日精进打卡第102天】【知～学习】《六项精进》3遍共306遍《大学》3遍共306遍【经典名句分享】比完成活儿更重要的是完善干活人的人格【行～实践】一、修身：（对自己个人）读书学习分享《稻盛和夫》二、齐家：给家人打电话三、建功：（对工作）给新员工培训安全消防知识，灭火器，设备等使用方法｛积善｝：发愿从2018年3月11日起尽力行善事。今日1善~【省～觉悟】稻盛和夫《活法》最励志
Java云原生安全矩阵：从代码到运行时的量子级防御墨夶 Java学习资料6 java 云原生安全
核心架构：SpringSecurity与Envoy的“量子态防御”基于声明式安全的“波函数坍缩”API网关的“暗物质过滤”代码示例：SpringSecurity的量子态权限控制威胁检测的“超弦理论”基于行为分析的“量子隧穿”异常检测实时日志的“引力波监测”代码示例：机器学习驱动的异常行为检测加密与密钥管理的“暗能量引擎”敏感数据的“量子态加密”密钥的“黑洞事件视界”保护代码示例：BCrypt与JW
某些辅导班与美好同行
早晨锻炼回来，看到小区一托管学生生活与学习的辅导班里，学生正在吃早饭，孩子们手拿食物往嘴里塞着，眼睛却都紧紧黏在辅导班里墙上那个电视大屏幕上。边吃边看电视，不禁又触发了我作为老师的很多感慨。老早以前就出现的孩子们注意力不集中问题，到现在也没解决。我们曾探究这其中的原因，也听专家报告，知道这是由于孩子们从小做事不专一造成的，而边吃饭边看电视是其中重要一项。在很多家庭里，孩子们都有这个习惯。没想到家长
适合女人9个小生意地摊有哪些？具体介绍氧惠好物
现在很多大学生在学习之余，还会去摆地摊。地摊看着好像不怎么赚钱的样子，但其实成本低、利润大，做起来之后月入三四千不是问题。那适合女人9个小生意地摊有哪些?购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位团队长体验！也期待你的加入
入门勤学奋进小郎君
了解机器学习标签需要通过机器学习模型判断出的结果特征机器学习模型进行判断的条件（可以是很多的变量）模型机器学习判断的工具降低损失线性回归y=mx+b其中：y指的是温度（以摄氏度表示），即我们试图预测的值。m指的是直线的斜率。x指的是每分钟的鸣叫声次数，即输入特征的值。b指的是y轴截距。2018-10-31_155803.png但是这样会对一些样本有误差，而我们的目的就是得到将误差降到最低的模型降低
2022-1-21晨间日记 9bf9e9e46349
今天是什么日子起床：10:10就寝：X天气：小雪心情：高兴纪念日:摩羯座流星雨任务清单昨日完成的任务，最重要的三件事：改进：有习惯养成：每天玩手机周目标·完成进度没有学习·信息·阅读没有健康·饮食·锻炼有人际·家人·朋友有工作·思考没有最美好的三件事1.看流星雨2.吃饭3.看日落思考·创意·未来学习
北京-4年功能测试2年空窗-报培训班学测开-第三十八天 amazinging 性能优化学习 python
今天自习，但今天溜得早，六点半就坐不住了（其实是五点多，但硬坐）早上起来，六点多就在家学上了，但困，理论知识真不适合刚起床看，应该做些能让身体协调起来的，比如写题。最后我就放弃看理论了，我整理理论。之后到自习室学习，今天白天主要写题，写循环与数据结构与方法综合应用题。有的简单有的难，很容易放弃。放弃之后自己也意识到不能这样，于是又复盘，下午又乖乖开始执行复盘的结果，最后前前后后共花了三四个小时写完
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

【大数据学习篇8】 热门品类Top10分析