段智华

SPARK 2.2.1 基于HIVEQL的人力资源系统的数据处理的案例与解读

SPARK 2.2.1 HIVEQL的人力资源系统的数据处理的案例与解读

本节给出一个简单的公司人力资源系统的数据处理案例。人力资源管理系统的管理内容组织结构如图3-10所示。

图 3 - 10

人力资源系统的数据源包含职工基本信息、部门基本信息、职工考勤信息、

职工工资清单等，数据文件存放在本地目录/usr/local/hrs。

1)       职工基本信息：存放职工的基本信息，包含职工姓名，职工id，职工性

别，职工年龄，入职年份，职位，所在部门id等信息；people.txt数据内容如下：

Michael,1,male,37,2014,developer,2

Andy,2,female,33,2016,manager,1

Justin,3,female,23,2016,recruitingspecialist,3

John,4,male,22,2017,developer,2

Herry,5,male,27,2017,developer,1

Brewster,6,male,37,2014,manager,2

Brice,7,female,30,2016,manager,3

Justin,8,male,23,2017,recruitingspecialist,3

John,9,male,22,2018,developer,1

Herry,10,female,27,2017,recruitingspecialist,3

 

2)       部门基本信息：存放部门信息，包含部门名称，编号；department.txt数据内容如下：

management,1

researchanddevelopment,2

HumanResources,3

 

3)       职工考勤信息：存放职工的考勤信息，包含年、月信息，职工加班，迟到，旷工，早退小时数信息；attendance.txt数据内容如下：(其中月份的模拟数据使用随机数)

1,2017,12,0,2,4,0

2,2017,8,5,0,5,3

3,2017,3,16,4,1,5

4,2018,3,0,0,0,0

5,2018,3,0,3,0,0

6,2017,3,32,0,0,0

7,2017,3,0,16,3,32

8,2015,19,36,0,0,0,3

9,2017,5,6,30,0,2,2

10,2017,10,6,56,40,0,22

1,2016,12,0,2,4,0

2,2014,38,5,40,5,3

3,2016,23,16,24,1,5

4,2016,23,0,20,0,0

5,2016,3,0,3,20,0

6,2016,23,32,0,0,0

7,2014,43,0,16,3,32

8,2016,49,36,0,20,0,3

9,2016,45,6,30,0,22,2

10,2014,40,6,56,40,0,22

 

4)       职工工资清单：存放职工每月的工资清单信息；salary.txt数据内容如下：

1,6000

2,15000

3,6000

4,7000

5,5000

6,17000

7,20000

8,5500

9,6500

10,7500

1.3.1 人力资源系统的数据库与表的构建

本案例使用之前的Spark 2.2.1+Hive数据仓库集成环境，已经将Hive的配置

文件hive-site.xml拷贝到 Spark2.2.1的$SPARK_HOME/conf 目录下。

将人力资源系统的数据加载到Hive仓库的HRS（Human Resource System）人力资源系统数据库中，并对人力资源系统的数据分别建表。

1) 启动Spark-Shell。

root@master:~# spark-shell –master spark://192.168.189.1:7077  --driver-class-path

/usr/local/apache-hive-1.2.1/lib/mysql-connector-java-5.1.13-bin.jar  --executor-memory 512m  --total-executor-cores 4

To adjust logginglevel use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).

18/02/21 09:18:33WARN util.NativeCodeLoader: Unable to load native-hadoop library for yourplatform... using builtin-java classes where applicable

Spark context WebUI available at http://master:4040

Spark contextavailable as 'sc' (master = local[*], app id = local-1519175914783).

Spark sessionavailable as 'spark'.

Welcome to

      ____              __

     / __/__ ___ _____/ /__

    _\ \/ _ \/ _ `/ __/  '_/

   /___/ .__/\_,_/_/ /_/\_\   version 2.2.1

      /_/

 

 

查询Hive中的数据库。

scala>spark.sql("show databases").show

+------------+

|databaseName|

+------------+

|     default|

|        hive|

|   hivestudy|

+------------+

2) 人力资源系统（HRS）数据库的构建与使用。在Hive中新建HRS数据库。

scala>spark.sql("CREATE DATABASE HRS")

18/02/21 09:36:09WARN metastore.ObjectStore: Failed to get database hrs, returningNoSuchObjectException

res13:org.apache.spark.sql.DataFrame = []

 

scala>spark.sql("show databases").show

+------------+

|databaseName|

+------------+

|     default|

|        hive|

|   hivestudy|

|         hrs|

+------------+

3) 在Hive中使用人力资源系统 HRS数据库。

scala>spark.sql("USE HRS")

res15:org.apache.spark.sql.DataFrame = []

4) 在人力资源系统HRS数据库中创建四个数据对应的表，仅在表不存在时创建。

l 构建职工基础信息表people。

scala> spark.sql("CREATE TABLE IF NOT EXISTS people(nameSTRING, id INT,gender

STRING, age INT, year INT, position STRING, depID INT) ROW FORMATDELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n'")

18/02/21 09:39:49 WARN metastore.HiveMetaStore: Location:hdfs://master:9000/user/hive/warehouse/hrs.db/people specified for non-externaltable:people

res16: org.apache.spark.sql.DataFrame = []

 

l 构建部门基础信息表department。

scala>spark.sql("CREATE TABLE IF NOT EXISTS department(name STRING, depIDINT) 

ROW FORMATDELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n'")

18/02/21 09:40:59WARN metastore.HiveMetaStore: Location: hdfs://master:9000/user/hive/warehouse/hrs.db/departmentspecified for non-external table:department

res17:org.apache.spark.sql.DataFrame = []

 

l 构建职工考勤信息表attendance。

scala>spark.sql("CREATE TABLE IF NOT EXISTS attendance (id INT, year INT, monthINT,

overtime INT,latetime INT, absenteeism INT, leaveearlytime INT) ROW FORMAT DELIMITED FIELDSTERMINATED BY ',' LINES TERMINATED BY '\n'")

18/02/21 09:42:10WARN metastore.HiveMetaStore: Location:hdfs://master:9000/user/hive/warehouse/hrs.db/attendance specified fornon-external table:attendance

res18:org.apache.spark.sql.DataFrame = []

 

l 构建职工工资清单表salary。

scala>spark.sql("CREATE TABLE IF NOT EXISTS salary (id INT, salary INT) ROWFORMAT

DELIMITED FIELDSTERMINATED BY ',' LINES TERMINATED BY '\n'")

18/02/21 09:43:11WARN metastore.HiveMetaStore: Location: hdfs://master:9000/user/hive/warehouse/hrs.db/salaryspecified for non-external table:salary

res19:org.apache.spark.sql.DataFrame = []

1.3.2 人力资源系统的数据的加载

人力资源系统数据的加载：分别将本地文本文件的数据加载到四个表。

1) 查询本地4个数据源文本文件。

root@master:/usr/local/hrs#ls -ltr

total 16

-rw-r--r-- 1 rootroot 370 Feb 21 09:47 people.txt

-rw-r--r-- 1 rootroot  55 Feb 21 09:49 department.txt

-rw-r--r-- 1 rootroot 390 Feb 21 09:50 attendance.txt

-rw-r--r-- 1 rootroot  74 Feb 21 09:50 salary.txt

2) 在Hive的HRS数据库中加载职工基础信息表，操作如下：

scala>spark.sql("LOAD DATA LOCAL INPATH '/usr/local/hrs/people.txt' OVERWRITEINTO

TABLE people")

res20:org.apache.spark.sql.DataFrame = []

其中OVERWRITE表示覆盖当前表的数据，即先清除表数据，再将数据insert到表中。其他表的加载操作类似。

3)       在Hive的HRS数据库中加载部门基础信息表，操作如下：

scala>spark.sql("LOAD DATA LOCAL INPATH '/usr/local/hrs/department.txt' INTOTABLE

department ")

res22:org.apache.spark.sql.DataFrame = []

 

4)       在Hive的HRS数据库中加载职工考勤信息表，操作如下：

scala>spark.sql("LOAD DATA LOCAL INPATH '/usr/local/hrs/attendance.txt' INTOTABLE

attendance")

res23:org.apache.spark.sql.DataFrame = []

 

5)       在Hive的HRS数据库中加载职工工资清单表，操作如下：

scala>spark.sql("LOAD DATA LOCAL INPATH '/usr/local/hrs/salary.txt' INTO TABLEsalary")

res24:org.apache.spark.sql.DataFrame = []

登陆HADOOP的Web Interface界面（http://192.168.189.1:50070/explorer.html#/user/hive/warehouse/hrs.db），Hdfs系统中查询人力资源系统的数据如图3-11所示。

图 3 - 11 Hdfs系统中查询人力资源系统的数据

scala> spark.sql("select * from people").show
+--------+---+------+---+----+--------------------+-----+
|    name| id|gender|age|year|            position|depID|
+--------+---+------+---+----+--------------------+-----+
| Michael|  1|  male| 37|2014|           developer|    2|
|    Andy|  2|female| 33|2016|             manager|    1|
|  Justin|  3|female| 23|2016|recruitingspecialist|    3|
|    John|  4|  male| 22|2017|           developer|    2|
|   Herry|  5|  male| 27|2017|           developer|    1|
|Brewster|  6|  male| 37|2014|             manager|    2|
|   Brice|  7|female| 30|2016|             manager|    3|
|  Justin|  8|  male| 23|2017|recruitingspecialist|    3|
|    John|  9|  male| 22|2018|           developer|    1|
|   Herry| 10|female| 27|2017|recruitingspecialist|    3|
+--------+---+------+---+----+--------------------+-----+

scala> spark.sql("select * from department").show
+--------------------+-----+
|                name|depID|
+--------------------+-----+
|          management|    1|
|researchanddevelo...|    2|
|      HumanResources|    3|
+--------------------+-----+

scala> spark.sql("select * from attendance").show
18/02/21 12:10:44 WARN lazy.LazyStruct: Extra bytes detected at the end of the row! Ignoring similar problems.
+---+----+-----+--------+--------+-----------+--------------+
| id|year|month|overtime|latetime|absenteeism|leaveearlytime|
+---+----+-----+--------+--------+-----------+--------------+
|  1|2017|   12|       0|       2|          4|             0|
|  2|2017|    8|       5|       0|          5|             3|
|  3|2017|    3|      16|       4|          1|             5|
|  4|2018|    3|       0|       0|          0|             0|
|  5|2018|    3|       0|       3|          0|             0|
|  6|2017|    3|      32|       0|          0|             0|
|  7|2017|    3|       0|      16|          3|            32|
|  8|2015|   19|      36|       0|          0|             0|
|  9|2017|    5|       6|      30|          0|             2|
| 10|2017|   10|       6|      56|         40|             0|
|  1|2016|   12|       0|       2|          4|             0|
|  2|2014|   38|       5|      40|          5|             3|
|  3|2016|   23|      16|      24|          1|             5|
|  4|2016|   23|       0|      20|          0|             0|
|  5|2016|    3|       0|       3|         20|             0|
|  6|2016|   23|      32|       0|          0|             0|
|  7|2014|   43|       0|      16|          3|            32|
|  8|2016|   49|      36|       0|         20|             0|
|  9|2016|   45|       6|      30|          0|            22|
| 10|2014|   40|       6|      56|         40|             0|
+---+----+-----+--------+--------+-----------+--------------+


scala>  spark.sql("select * from salary").show
+---+------+
| id|salary|
+---+------+
|  1|  6000|
|  2| 15000|
|  3|  6000|
|  4|  7000|
|  5|  5000|
|  6| 17000|
|  7| 20000|
|  8|  5500|
|  9|  6500|
| 10|  7500|
+---+------+

3.4.3 人力资源系统的数据的查询

人力资源系统的数据常见的查询操作有部门职工数的查询、部门职工的薪资topN的查询、部门职工平均工资的排名、各部门每年职工薪资的总数查询等，下面给出具体案例。

1) 查看各表的信息，同时查看界面回显中的Schema信息：

scala>  spark.sql("select * from people")

res29:org.apache.spark.sql.DataFrame = [name: string, id: int ... 5 more fields]

 

scala>  spark.sql("select * fromdepartment")

res30:org.apache.spark.sql.DataFrame = [name: string, depID: int]

 

scala>  spark.sql("select * fromattendance")

res31:org.apache.spark.sql.DataFrame = [id: int, year: int ... 5 more fields]

 

scala>  spark.sql("select * from salary")

res32:org.apache.spark.sql.DataFrame = [id: int, salary: int]

2) 部门职工数的查询。首先将people表数据与department表数据进行

join，然后根据department的部门名进行分组，分组后针对people中唯一标识一个职工的id字段进行统计，最后得到各个部门对应的职工总数统计信息。

scala>spark.sql("select b.name, count(a.id) from people a join department b ona.depid=b.depid

group byb.name").show

+--------------------+---------+                                               

|                name|count(id)|

+--------------------+---------+

|          management|        3|

|      HumanResources|        4|

|researchanddevelo...|        3|

+--------------------+---------+

3) 对各个部门职工薪资的总数、平均值的排序。

首先根据部门id将people表数据与department表数据进行join，根据职工id joinsalary表数据，然后根据department的部门名进行分组，分组后针对职工的薪资进行求和或求平均值，并根据该值大小进行排序。

scala>spark.sql("select b.name, sum(c.salary) as s from people a join departmentb on

a.depid=b.depidjoin salary c on a.id=c.id group by b.name order by s").show

+--------------------+-----+                                                   

|                name|    s|

+--------------------+-----+

|          management|26500|

|researchanddevelo...|30000|

|      HumanResources|39000|

+--------------------+-----+

4) 查各个部门职工薪资的平均值的排序如下：

scala>spark.sql("select b.name, avg(c.salary) as s from people a join departmentb on

a.depid=b.depidjoin salary c on a.id=c.id group by b.name order by s").show

+--------------------+-----------------+                                        

|                name|                s|

+--------------------+-----------------+

|          management|8833.333333333334|

|      HumanResources|           9750.0|

|researchanddevelo...|          10000.0|

+--------------------+-----------------+

5) 查询各个部门职工的考勤信息

首先根据职工id将attendance考勤表数据与people职工表数据进行join，并计算职工的考勤信息，然后根据department的部门名、考勤信息的年份进行分组，分组后针对职工的考勤信息进行统计。

具体步骤：

进行子查询，根据职工ID关联考勤表和职工信息表，查询职工ID，部门ID，年份、月份、考勤信息（加班-迟到-旷工-早退）；
然后根据部门ID关联部门信息表，按部门名称、年份进行分组；
分组以后查询部门的名称、考勤时间求和汇总、年份的信息。

scala>spark.sql("select b.name, sum(h.attdinfo), h.year from (select a.id,a.depid, at.year, at.month,

overtime-latetime-absenteeism- leaveearlytime as attdinfo from attendance at join people a onat.id = a.id) h join department b on h.depid = b.depid group by b.name,h.year").show

18/02/21 10:13:37WARN lazy.LazyStruct: Extra bytes detected at the end of the row! Ignoringsimilar problems.

+--------------------+-------------+----+

|                name|sum(attdinfo)|year|

+--------------------+-------------+----+

|          management|          -29|2017|

|researchanddevelo...|           26|2017|

|          management|           -3|2018|

|      HumanResources|         -141|2014|

|researchanddevelo...|            6|2016|

|      HumanResources|           36|2015|

|          management|          -69|2016|

|      HumanResources|         -135|2017|

|researchanddevelo...|            0|2018|

|          management|          -43|2014|

|      HumanResources|            2|2016|

+--------------------+-------------+----+

6) 合并前面的全部查询。

进行子查询（别名设置为e），根据部门ID关联职工信息表和部门表，按部门名称分组，统计部门的人数，并按部门人数排序，查询部门名称、部门人数信息。
进行子查询（别名设置为f），根据部门ID关联职工信息表和部门表，根据职工ID关联职工信息表和职工工资表，按部门名称分组，查询统计部门名称、部门工资总数、部门平均工资信息。
进行子查询（别名设置为h），根据员工ID关联职工信息表和考勤表，查询统计职工ID、职工部门ID、年份、月份、考勤（加班-迟到-旷工-早退）信息。
进行子查询（别名设置为j），根据部门ID关联部门信息表和子查询表h，按部门名称、年份分组，查询统计部门名称、部门每年考勤信息、年份信息。
最终根据部门名称，将4个子查询表进行关联，查询结果为部门名称、部门人数、部门工资总数、部门平均工资、年份信息、部门每年考勤信息。

scala>spark.sql("select e.name, e.pcount, f.sumsalary, f.avgsalary,j.year,j.sumattd from  (select

b.name, count(a.id) as pcount from people a joindepartment b on a.depid=b.depid group by b.name order by pcount) e join (selectb.name, sum(c.salary) as sumsalary, avg(c.salary) as avgsalary from people ajoin department b on a.depid=b.depid join salary c on a.id=c.id group by b.nameorder by sumsalary) f on (e.name = f.name) join (select b.name, sum(h.attdinfo)as sumattd, h.year from (select a.id, a.depid, at.year, at.month,overtime-latetime- absenteeism- leaveearlytime as attdinfo from attendance atjoin people a on at.id = a.id) h join department b on h.depid = b.depid groupby b.name, h.year) j on f.name = j.name order by f.name").show

18/02/21 10:14:42WARN lazy.LazyStruct: Extra bytes detected at the end of the row! Ignoringsimilar problems.

+--------------------+------+---------+-----------------+----+-------+         

|                name|pcount|sumsalary|        avgsalary|year|sumattd|

+--------------------+------+---------+-----------------+----+-------+

|      HumanResources|     4|   39000|           9750.0|2015|     36|

|      HumanResources|     4|   39000|           9750.0|2014|   -141|

|      HumanResources|     4|   39000|           9750.0|2016|      2|

|      HumanResources|     4|   39000|           9750.0|2017|   -135|

|          management|     3|   26500|8833.333333333334|2016|   -69|

|          management|     3|   26500|8833.333333333334|2017|   -29|

|          management|     3|   26500|8833.333333333334|2014|   -43|

|          management|     3|   26500|8833.333333333334|2018|    -3|

|researchanddevelo...|     3|   30000|          10000.0|2018|      0|

|researchanddevelo...|     3|   30000|          10000.0|2017|     26|

|researchanddevelo...|     3|   30000|          10000.0|2016|      6|

+--------------------+------+---------+-----------------+----+-------+

将前面的几个查询合并到一个sql语句中，最后得到部门的各种统计信息，包括部门职工数、部门薪资、部门每年的考勤统计等信息。

2018年新春报喜！热烈祝贺王家林大咖大数据经典传奇著作《SPARK大数据商业实战三部曲》畅销书籍清华大学出版社发行上市!

本书基于Spark 2.2.0最新版本（2017年7月11日发布），以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心，以Spark内核解密为基石，分为上篇、中篇、下篇，对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。上篇基于Spark源码，从一个动手实战案例入手，循序渐进地全面解析了Spark 2.2新特性及Spark内核源码；中篇选取Spark开发中最具有代表的经典学习案例，深入浅出地介绍，在案例中综合应用Spark的大数据技术；下篇性能调优内容基本完全覆盖了Spark在生产环境下的所有调优技术。

本书适合所有Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员，本书也可以作为Spark高手修炼的参考书籍。同时，本书也特别适合作为高等院校的大数据教材使用。

当当网、京东、淘宝、亚马逊等网店已可购买！欢迎大家购买学习！

当当网址： http://product.dangdang.com/25230552.html

类的创建以及类的继承及其应用对象烈焰猩猩 python
类的创建以及类的继承及其应用场景一,类的创建格式:格式1:class类名:pass格式2:class类名():pass格式3:#class类名(父类名):class类名(object):pass案例:案例需求定义老师类.实现思路定义老师类(三种方式).函数内容.创建该类对象.打印该类对象.#1.定义老师类(三种方式).#classTeacher:#classTeacher():classTeach
Python 爬虫实战：如何爬取小红书数据并进行分析 Python爬虫项目 python 爬虫开发语言 selenium 测试工具
一、引言随着社交电商的崛起，小红书（Xiaohongshu）作为一款结合了社交和电商的应用，吸引了大量年轻用户。用户在平台上分享购物心得、生活经验以及个性化的消费推荐内容，形成了庞大的用户数据与内容生态。因此，如何从小红书获取数据进行分析，成为了数据科学、市场营销和社交媒体研究中的一个重要课题。本文将介绍如何使用Python编写爬虫爬取小红书的数据，分析如何通过小红书的开放API获取用户信息、帖子
C语言中，#define和typedef 定义int* 一个容易混淆的点阿龍1787 C++随记 c语言
前言首先来看一个代码：#include#include#defineint_ptrint*intmain(){intc=100;int_ptra,b;//等效于int*a,b;那么b就是int类型，不是int*类型a=&c;b=&c;//报错return0;}原意，我本来想让a和b都是int*类型，但是发现并不是。这段代码的主要问题在于宏定义和指针声明的使用方式上：当使用#defineint_pt
基于 KubeSphere v4 的 Kubernetes 生产环境部署架构设计及成本分析 KubeSphere 云原生 kubernetes 容器云原生
本文作者：运维有术。今天分享的主题是：如何规划设计一个高可用、可扩展的中小规模生产级K8s集群？通过本文的指导，您将掌握以下设计生产级K8s集群的必备技能：集群规划能力合理规划节点规模和资源配置设计高可用的控制平面、计算平面、存储平面架构规划网络拓扑和安全策略制定存储解决方案组件选型能力选择适合的容器运行时(ContainerRuntime)评估和选择网络插件(CNIPlugin)规划监控、日志等
AXI总线之相关应用逾越TAO fpga开发硬件工程笔记
AXI总线作为现代SoC设计的核心互连协议，其应用场景极为广泛，覆盖移动设备、AI加速器、FPGA、存储控制器等多个领域。以下是AXI在不同应用中的关键角色及具体实现案例：一、移动处理器与SoC应用场景：智能手机、平板电脑的SoC（如高通骁龙、苹果A系列、华为麒麟）中，AXI用于连接多核CPU、GPU、ISP（图像信号处理器）、DDR控制器等模块。典型案例：ARMCortex-A系列多核集群：AX
【商城实战(43)】探秘知名商城架构：解锁电商成功密码奔跑吧邓邓子商城实战架构微服务 spring boot 商城实战商城架构
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
Pandas完全指南：数据处理与分析从入门到实战 xiaoyu❅ python python pandas 开发语言
目录引言一、Pandas环境配置与核心概念1.1安装Pandas1.2导入惯例1.3核心数据结构二、数据结构详解2.1Series创建与操作2.2DataFrame创建三、数据查看与基本操作3.1数据预览3.2索引与选择3.3数据排序四、数据清洗实战4.1处理缺失值4.2处理重复值4.3数据类型转换4.4字符串处理五、数据处理进阶5.1数据筛选5.2列操作5.3应用函数六、数据分组与聚合6.1基础
【Leetcode】430. 扁平化多级双向链表海绵波波107 #算法和leetcode leetcode 链表算法
目录一、题目二、思路2.1解题思路2.2代码尝试2.3疑难问题2.4AI复盘三、解法四、收获4.1心得4.2举一反三一、题目二、思路2.1解题思路2.2代码尝试/*//DefinitionforaNode.classNode{public:intval;Node*prev;Node*next;Node*child;};*/classSolution{public:Node*flatten(Node
从关键词到权重：TF-IDF算法解析多巴胺与内啡肽. 机器学习 tf-idf 算法机器学习
文章目录前言一、TF-IDF：关键词的“价值”评估师二、TF-IDF的计算：拆解关键词的“价值”三、TF-IDF的应用：从搜索引擎到文本挖掘四、代码实现：从《红楼梦》中提取核心关键词1、分卷处理1.1代码功能1.2代码实现1.2.1、读取文件1.2.2逐行处理1.2.3.关闭文件2、分词与停用词过滤2.1代码功能2.2代码实现2.2.1读取分卷内容构建DataFrame：2.2.2分词与停用词过滤
weixin049校园外卖平台设计与实现+ssm(文档+源码)_kaic 开心毕设kaic_kaic 模拟退火算法散列表随机森林支持向量机启发式算法逻辑回归
校园外卖平台设计与实现摘要随着信息技术在管理上越来越深入而广泛的应用，管理信息系统的实施在技术上已逐步成熟。本文介绍了校园外卖平台的开发全过程。通过分析校园外卖平台管理的不足，创建了一个计算机管理校园外卖平台的方案。文章介绍了校园外卖平台的系统分析部分，包括可行性分析等，系统设计部分主要介绍了系统功能设计和数据库设计。本校园外卖平台有管理员，用户，商家。管理员功能有个人中心，用户管理，商家管理，菜
【FPGA教程案例31】通信案例1——基于FPGA的ASK调制信号产生 fpga和matlab ★教程2:fpga入门100例 fpga开发 FPGA教程 ASK调制 verilog
FPGA教程目录MATLAB教程目录---------------------------------------------------------------------------------------目录1.软件版本2.ASK调制原理3.ASK调制过程的FPGA实现4.操作步骤与仿真结论5.参考文献1.软件版本vivado2019.22.ASK调制原理幅度键控（Amplitude-Shi
嵌入式C语言学习笔记（2）愿抬头有阳光 c语言学习笔记
1.数组指针数组指针本质上就是一个指针，它里面存放的是数组的首地址。#includevoidshow(int(*p)[4],intn){for(inti=0;i4*4=16;3.命令行传递参数，main函数的标准格式intmain(intargc,constchar*argv[]){return0;}//argc：参数的个数包括./a.out//argv：参数的值列表argv[0]="./a.ou
《解锁元宇宙构建：AI与云原生区块链的协同奥秘》程序猿阿伟人工智能云原生区块链
在科技飞速发展的今天，元宇宙已从最初的概念设想逐渐步入人们的视野，成为全球瞩目的焦点。元宇宙，这个融合了虚拟与现实、跨越时空界限的数字世界，正以其独特的魅力和无限的潜力，引领着新一轮的科技革命和产业变革。而在这场变革的背后，AI与云原生区块链技术宛如两颗璀璨的明星，交相辉映，为元宇宙的构建提供了不可或缺的关键支撑。AI：赋予元宇宙“智慧灵魂”智能内容生成，丰富元宇宙的“物质基础”在元宇宙的广袤世界
安卓无线调试连接不上王的备忘录 A1_android开发基础 android
今天发现的一个问题，如果要连接的是新手机，会无法连接上。提示connectfail。原因是第一次调试，先要在手机上进行授权。解决方法就是要先通过数据线连接手机，在手机端同意连接，之后再运用adb无线调试就可以连接了。
java实现二叉树的深度优先遍历开往1982 深度优先算法 java
深度优先三种遍历方法1.先序遍历2.中序遍历3.后序遍历1.定义树节点（这里我重构了tostring方法）packagecom.data.tree;publicclassNode{intvalue;Nodeleft;Noderight;publicNode(intval){value=val;}@OverridepublicStringtoString(){return"Node[value="+
Tsfresh + TA-Lib + LightGBM ：A 股市场量化投资策略实战入门船长@Quant Python 金融科技 python tsfresh TA-Lib LightGBM 量化技术策略开发
Tsfresh+TA-Lib+LightGBM：A股市场量化投资策略实战入门本项目以A股市场为研究对象，通过量化技术对市场数据进行分析，构建量化投资策略，并利用历史数据回测验证策略的有效性。项目旨在为量化技术初学者提供一个系统的学习框架，帮助读者掌握从数据获取到策略评估的全流程操作。文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。适合量化新手建立系统认
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
焊接性能分析代码（Python）骑蜗牛上月亮 python 开发语言
welding_performance_data.xls数据文件。welding_strengthtoughness5001052012480855015490953013510115401447075601690018600121500139111578115importpandasaspdimportmatplotlib.pyplotaspltimporttkinterastkfrommatp
从零实现B站视频下载器：Python自动化实战教程木觞清 #编程语言自动化运维
一、项目背景与实现原理1.1B站视频分发机制Bilibili的视频采用音视频分离技术，通过以下方式提升用户体验：动态码率适配（1080P/4K/HDR）分段加载技术（基于M4S格式）内容保护机制（防盗链/签名验证）1.2技术实现路线graphTDA[模拟浏览器请求]-->B[获取加密播放信息]B-->C[解析音视频地址]C-->D[多线程下载]D-->E[FFmpeg合并]二、代码逐层解析2.1请
vue3当中使用Pinia的store的组件化开发模式堕落年代 vue vue.js
一、安装与初始化安装Pinianpminstallpinia#或yarnaddpinia目的：引入Pinia核心库，为状态管理提供基础支持。挂载Pinia实例在main.js中初始化并注入Vue应用：import{createApp}from'vue'import{createPinia}from'pinia'importAppfrom'./App.vue'constapp=createApp(A
C语言基础（函数）指尖DE格桑花 c语言开发语言初学者嵌入式
函数的概述函数：实现一定功能的，独立的代码模块。对于函数的使用，一定是先定义，后使用。使用函数的优势：①我们可以通过函数提供功能给别人使用。当然我们也可以使用别人提供的函数，减少代码量。②借助函数可以减少重复性的代码。③实现结构化（模块化）程序设计思想。关于结构化设计思想：将大型的任务功能划分为相互独立的小型的任务模块来设计。函数是C语言程序的基本组成单元：C语言程序是由一个（必然是main函数）
This robot has a joint named “gripper_finger_joint“ which is not in the gazebo model. 无码不欢的我 ROS
在B站上看古月居的课《ROS机械臂开发：从入门到实战》，在运行第9节的代码时，出现如下报错：Thisrobothasajointnamed"gripper_finger_joint"whichisnotinthegazebomodel.本人所运行环境为：ubuntu版本：20.04ROS版本：noetic错误分析：xacro的宏调用格式错误，正确格式为或者为：...修改方法：1.找到probot_
PyCINRAD 安装和配置指南颜欢钰Edith
PyCINRAD安装和配置指南PyCINRADDecodeCINRAD(ChinaNewGenerationWeatherRadar)dataandvisualize.项目地址:https://gitcode.com/gh_mirrors/py/PyCINRAD1.项目基础介绍和主要编程语言项目基础介绍PyCINRAD是一个开源的气象雷达数据处理和可视化库，专门用于解码中国新一代天气雷达（CINR
AIGC时代品牌突围战：10招玩转DeepSeek内容推荐（深度扩展版）白雪讲堂人工智能大数据机器学习
一、认知革命：从SEO到GEO的生死迭代案例对比：传统SEO困境：某家电品牌2023年投入200万SEO优化，关键词排名TOP3但流量下降42%（SEMrush数据）GEO突破案例：某母婴品牌通过结构化数据改造，AI推荐量从日均300次飙升至1.2万次（来源：DeepSeek官方案例库）实战要点：内容形态改造：将产品参数表升级为JSON-LD格式（某手机品牌实现参数类问题100%引用）流量分配逻辑
Java开发者必看！零成本集成DeepSeek-R1打造AI办公神器，源码级实战教程让你效率翻倍！ Leaton Lee java 人工智能开发语言
目录开篇互动一、为什么是DeepSeek-R1？它凭什么碾压传统AI工具？二、手把手部署DeepSeek-R1本地环境（附避坑指南）步骤1：Docker一键部署步骤2：下载模型步骤3：验证部署三、Java整合DeepSeek-R1：从理论到实战1.添加HTTP客户端依赖（以SpringBoot为例）2.封装AI工具类（核心代码解析）3.实战场景1：自动生成周报（附Prompt技巧）四、高阶玩法：A
深度剖析C语言数组和指针的区别（非常详细） xiecoding.cn c语言算法开发语言 c++青少年编程 C语言入门数据结构
对于刚刚接触C语言指针的初学者，很容易认为数组和指针是等价的，数组名表示数组的首地址。不幸的是，这是一种非常危险的想法，并不完全正确。耐心看完本文，我保证会颠覆你的认知。数组和指针绝不等价数组和指针不等价的一个典型案例就是求数组的长度，这个时候只能使用数组名，不能使用数组指针，前面我们已经强调过了，这里不妨再来演示一下：#includeintmain(){inta[6]={0,1,2,3,4,5}
docker 部署 RabbitMQ 嗑瓜子儿溜茶水儿 docker docker rabbitmq 容器
命令dockerrun-d--name=rabbitmq\-p5671:5671-p5672:5672-p4369:4369\-p15671:15671-p15672:15672-p25672:25672\-eRABBITMQ_DEFAULT_USER=username\-eRABBITMQ_DEFAULT_PASS=password\-v/usr/local/rabbitmq/data:/var
Neo4j GDS-02-graph-data-science 简单聊一聊图数据科学插件库后端java
neo4japoc系列Neo4jAPOC-01-图数据库apoc插件介绍Neo4jAPOC-01-图数据库apoc插件安装neo4jonwindows10Neo4jAPOC-03-图数据库apoc实战使用使用Neo4jAPOC-04-图数据库apoc实战使用使用apoc.path.spanningTree最小生成树Neo4jAPOC-05-图数据库apoc实战使用使用labelFilter是什么？
程序员不用写代码？DeepSeek这个隐藏功能让我惊掉下巴后端
凌晨三点半，显示器蓝光映着我的黑眼圈。就在我第18次修改接口文档时，同事老王突然在微信甩来个神秘链接："用这个，今晚能睡个好觉"。我点开那个叫DeepSeek的页面，没想到接下来的三个小时，我经历了职业生涯最魔幻的加班夜。你见过会自己写测试用例的AI吗？那天晚上，我把项目需求文档往DeepSeek的对话框一扔，它竟然像资深架构师似的，先把需求拆解成模块，接着自动生成了带注释的接口文档。最绝的是，在
2025年从DeepSeek到Manus：AI如何重塑企业价值报告600+份汇总解读|附PDF下载
原文链接：https://tecdat.cn/?p=41172当前全球AI技术正从实验室走向产业化深水区，本报告以企业价值重构为核心，通过技术演进路径、行业竞争范式、落地实施策略三大维度，揭示AI如何从成本中心转变为价值引擎。数据显示，2025年生成式AI在中国创造的潜在经济价值达2万亿美元，其中制造业、电子行业生产力增益最为显著。本报告汇总解读基于《发布机构：华中科技大学数智管理与传播研究团队、
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

SPARK 2.2.1 基于HIVEQL的人力资源系统的数据处理的案例与解读

SPARK 2.2.1 HIVEQL的人力资源系统的数据处理的案例与解读

1.3.1 人力资源系统的数据库与表的构建

1.3.2 人力资源系统的数据的加载

3.4.3 人力资源系统的数据的查询

你可能感兴趣的:(AI,&,Big,Data案例实战课程)