CoderLean

Azkaban3.59.x 最新版极简入门

1. Azkaban概述

Azkaban技术产生前景：

在大数据分析场景中，以ETL（ Extract抽取 -Transform交互转换 -Load加载）为例，数据的操作包含了如下流程：RDBMS ==>Sqoop ==>Hadoop ==>Sqoop ==>RDBMS/NoSQL/...,这里涉及了三个流程：数据抽取 ==> 数据清洗 ==> 数据入库。

这三个步骤出现了明显的顺序问题。假设数据抽取需要3h,数据清洗需要2h,数据入库需要1h。我们可以使用linux shell提供的crontab 来实现。他的优点是使用简单，缺点却有很多：

1. 流程不便于跟踪和监控（流程某个环境出错没办法监控）。
	2. 在这个流程中有些模块执行的时间可能出现延迟/提前。比如数据清洗预测需要2h,结果用了3h，此刻数据入库在前一个任务还没执行完就已经开始执行了；比如清洗预测需要2h,结果用了1h，导致后面的流程出现无效等待的状态。

因此，像Azkaban这样的调度框架在我们数据平台中就扮演着很重要的角色。

大数据中常见的调度框架

大数据中常见的调度框架，最常见的就是crontab。除此之外还有很多集成框架：

Quartz：Quartz是OpenSymphony[ˈəʊpən ˈsɪmfəni] 开源组织在Job scheduling领域又一个开源项目，它可以与J2EE与J2SE应用程序相结合也可以单独使用。
Azkaban：Azkaban是由Linkedin公司推出的一个批量工作流任务调度器，其使用job配置文件建立任务之间的依赖关系，并提供一个易于使用的web用户界面维护和跟踪你的工作流。
Oozie：Oozie是一个工作流引擎服务器，用于运行hadoop map/reduce和hive等任务工作流。同时Oozie还是一个java web程序，运行在java servlet容器中，如tomcat中。Oozie以action为基本单位，可以将多个action构成一个DAG图的模式运行。Oozie工作流通过HPDL（一种通过XML自定义处理的语言）来构造Oozie工作流。
Zeus：宙斯是阿里巴巴开源的一款分布式Hadoop作业调度平台，实现任务的分布式调度，支持多机器的水平扩展。

Azkaban概述

Azkaban是一个由LinkedIn 创建的用来跑Hadoop 任务的批量的工作流执行器；其解决了job依赖顺序的问题，并提供了一个简单易用的用户界面检测我们的工作流。

Azkaban特性如下：

兼容所有Hadoop版本
简单易用的web操作界面和web工作流资源提交机制
在Azkaban中每个项目相互独立互不影响。
良好的工作流执行封装（执行任务流无需太复杂的操作一个按钮搞定）。
模块化和插件化：执行的具体任务不会与Azkaban相互耦合，代码侵入性低。
认证与授权：良好的权限管理机制
跟踪用户的行为：方便出现问题后知道是哪个用户的错误导致的。
任务成功/失败后的邮件通知机制
任务错误的重试机制

Azkaban3.x 以后不提供直接的安装包下载，其安装包需通过Gradle脚本来编译，并且要求最低的Java版本是8. 如下是Azkaban的学习网站：

Azkaban的官网：https://azkaban.github.io
Azkaban的框架源码：https://github.com/azkaban/azkaban
Azkaban文档：https://github.com/azkaban/azkaban.github.io

#2. Azkaban架构简析

Azkaban由三个关键组件构成（如下图）：

MySQL关系型数据库：Azkaban使用数据库存储大部分状态，AzkabanWebServer和AzkabanExecutorServer都需要访问数据库。
AzkabanWebServer：AzkabanWebServer是整个Azkaban工作流系统的主要管理者，它负责project管理、用户登录认证、定时执行工作流、跟踪工作流执行进度等一系列任务。
AzkabanExecutorServer：早期版本的Azkaban在单个服务中具有AzkabanWebServer和AzkabanExecutorServer功能，目前Azkaban已将AzkabanExecutorServer分离成独立的服务器。其好处是某个任务流失败后，可以更方便的将其重新执行，便于Azkaban升级。

Azkaban的两种运行模式

在版本3.0中，Azkaban提供了以下两种模式：

solo server mode：最简单的模式，数据库内置的H2数据库，AzkabanWebServer和AzkabanExecutorServer都在一个进程中运行，任务量不大项目可以采用此模式（特别适合初学者学习使用，功能齐全）。
multiple executor mode：适用于更多的生产环境，其使用MySQL 来进行元数据管理并且支持主从结构。在这种模式下web server和executor server 独立运行在不同的主机中。这种模式带来的好处是可以让Azkaban更加健壮和可扩展。

在学习的过程中，我们可以使用来solo server 这种模式来运行Azkaban实例。

3. Azkaban的下载和编译

下载之前请确保本机的 Java 版本为 1.8 。
下载Azkaban源码：
解压azkaban压缩包并进入该目录：

azkaban-common: 基本的依赖包

azkaban-db: 框架核心组件-数据库工具

azkaban-exec-server & azkaban-web-server : 框架核心组件

azkaban-solo-server: 集成运行模式工具包

azkaban-spi : azkaban存储接口以及exception类

azkaban-hadoop-security-plugin: hadoop 有关kerberos插件
在编译源码之前，先要下载gradle的依赖包，至于要什么版本，查看如下：

如下地址是Gradle的官方下载地址：https://services.gradle.org/distributions

下载好对应的版本后，将压缩包存放到如下位置：

修改配置文件：
返回安装包主目录执行编译程序（注意官方给出的编译版本不带测试命令-x test,示例如下）
```
# Build without running tests
>$ ./gradlew build installDist -x test
```
执行上面的命令，出现了git有关的异常，这里主要是系统没有安装git命令，使用yum install -y git,后重新执行步骤4，接下来等待漫长的下载（因为默认使用的是国外的gradle镜像进行资源下载）。

为了减少编译时下载占用时间，一般会为gradle远程资源提供镜像地址方便下载：

#在 ${AZKABAN_HOME}/build.gradle文件中配置,然后重新执行步骤4：
mavenLocal()
maven{ url 'http://maven.aliyun.com/nexus/content/groups/public/'}
maven{ url 'http://maven.oschina.net/content/groups/public/'}

编译成功后，可以找到整个架构的每个部分都会多出一个build文件夹，这才是我们要安装的文件：

[root@azkabanvm azkaban]# ls azkaban-solo-server/build
classes  distributions  install  libs  resources  tmp
[root@azkabanvm azkaban]# ls azkaban-exec-server/build
classes  distributions  install  libs  resources  tmp
[root@azkabanvm azkaban]# ls azkaban-web-server/build
classes  distributions  dust  install  jsToPackage  less  libs  nodejs  resources  tmp
[root@azkabanvm azkaban]# ls azkaban-db/build
classes  distributions  install  libs  sql  tmp

4. Azkaban-solo-server安装

在上一节的讲解中，我们已经完成Azkaban各个模块的编译。如下：

$AZKABAN_SOURCE_HOME/azkaban-solo-server/build/distributions/*.tar.gz(zip)
$AZKABAN_SOURCE_HOME/azkaban-web-server/build/distributions/*.tar.gz(zip)
$AZKABAN_SOURCE_HOME/azkaban-executor-server/build/distributions/*.tar.gz(zip)

将其对应包下的.tar.gz文件拷贝到独立的文件夹下（该文件夹用来安装 Azkaban）并解压，并且不要忘记拷贝azkaban-db/build/distributions/xxx.sql文件（这是一个数据库初始化的脚本文件） :

[root@azkabanvm packages]# ll
total 58276
drwxr-xr-x. 6 root root     4096 Sep 29 01:24 azkaban-exec-server-0.1.0-SNAPSHOT
-rw-r--r--. 1 root root 15767192 Sep 29 01:24 azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz
drwxr-xr-x. 8 root root     4096 Sep 29 01:25 azkaban-solo-server-0.1.0-SNAPSHOT
-rw-r--r--. 1 root root 23876418 Sep 29 01:25 azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz
drwxr-xr-x. 6 root root     4096 Sep 29 01:25 azkaban-web-server-0.1.0-SNAPSHOT
-rw-r--r--. 1 root root 20009922 Sep 29 01:25 azkaban-web-server-0.1.0-SNAPSHOT.tar.gz

初始化MySQL,这里直接贴出最简单的安装方式：

yum install -y mysql-server
yum install -y mysql
service mysqld start

mysql> mysql -u root -p
mysql> ##第一次安装没有密码  直接按Enter键  然后修改当前密码
mysql> set password for 'root'@'localhost' = password('root') ;

mysql> grant all privileges on *.* to [email protected] identified by 'root';
mysql> FLUSH PRIVILEGES;

mysql> create database azkaban;

将sql文件导入到azkaban数据库中：

mysql> use azkaban;
mysql> source /usr/local/azkaban/packages/create-all-sql-0.1.0-SNAPSHOT.sql;

mysql> show tables;

生成秘钥文件：

打开azkaban-solo-server-0.1.0-SNAPSHOT/conf/azkaban.properties文件（这里主要配置的是数据库驱动和证书认证）：

default.timezone.id=Asia/Shanghai

database.type=mysql
mysql.port=3306
## 这里最好配置IP地址
mysql.host=192.168.66.170
mysql.database=azkaban
mysql.user=root
mysql.password=sql_9879
mysql.numconnections=100

jetty.use.ssl=true
jetty.maxThreads=25
jetty.ssl.port=8666
jetty.port=8081
#注意这里要统一配置好keystore文件存储的路径
jetty.keystore=.../keystore
jetty.password=000000
jetty.keypassword=000000
#注意这里要统一配置好keystore文件存储的路径
jetty.truststore=.../keystore
jetty.trustpassword=000000

从azkaban.properties文件内容可以看出还有一个文件是用来管理登录的用户的，那就是azkaban-users.xml，我们可以在这个文件中配置密码：

在本机的 /etc/hosts 文件中添加本机IP地址的映射：

127.0.0.1 azkabanvm

返回azkaban-solo-server-0.1.0-SNAPSHOT目录，在这个目录下启动solo：

[root@azkabanvm azkaban-solo-server-0.1.0-SNAPSHOT]# bin/start-solo.sh

[root@azkabanvm azkaban-solo-server-0.1.0-SNAPSHOT]# jps
3252 Jps
3227 AzkabanSingleServer

#如果进程没有启动 可以在当前目录下会自动创建启动脚本的日志：
[root@azkabanvm azkaban-solo-server-0.1.0-SNAPSHOT]# cat soloServerLog__2018-09-29+18\:30\:29.out

注意：上面的solo-server会创建一个叫AzkabanSingleServer的进程，并在启动一会之后主动退出，这个操作可以用来检查我们的配置文件是否正确。而我们真正要启动的是一个Executor 进程和 Web进程。

5. web/executor-server 安装

将solo-server下的azkaban.properties文件和azkaban-users.xml文件拷贝到web/conf 文件夹下。

启动web服务：

[root@azkabanvm azkaban-web-server-0.1.0-SNAPSHOT]# bin/start-web.sh
[root@azkabanvm azkaban-web-server-0.1.0-SNAPSHOT]# jps
3744 Jps
3336 AzkabanWebServer

从启动的日志文件中我们也可以看到启动的端口，注意这里一定要保证防火墙是关闭的：

[root@azkabanvm azkaban-web-server-0.1.0-SNAPSHOT]# service iptables stop

在网页端访问ssl页面：

将solo-server下的azkaban.properties文件和azkaban-users.xml文件拷贝到executor/conf 文件夹下。

进入executor文件夹，启动executor进程：

[root@azkabanvm azkaban-exec-server-0.1.0-SNAPSHOT]# bin/start-exec.sh 
[root@azkabanvm azkaban-exec-server-0.1.0-SNAPSHOT]# jps
3634 Jps
3607 AzkabanExecutorServer
3336 AzkabanWebServer

6. 普通shell命令Job

登录页面后，创建一个Job项目。

创建command.job文件，内容如下，拷贝完成后将其打包成zip文件上传Job项目中：

#command.job
type=command
command=echo 'hello'

第一次执行项目时出现卡住的现象，主要是azkaban要求执行Job必须运行在最低有3G的内存空间里，如果你不需要这样的限制可以修改executor/plugins/jobtypes/commonprivate.properties文件，将memCheck.enabled=false。然后重启整个服务（包括web和executor）。重新执行任务才会成功。

7. HDFS操作的Job

除了可以在Azkaban上执行普通的shell命令，还可以执行HDFS的命令，接下来用一个小案例来实现：

首先要确保命令没有错，接下来自己写一个job，内容如下：

#hdfs.job
type=command
command=/root/apps/hadoop/bin/hdfs dfs -ls /

在控制台查看结果如下：

8. MapReduce操作的Job

既然可以操作HDFS，那么是否可以执行MapReduce , 为了验证这个结果，首先要有个MapReduce程序，如下：

对于执行MapReduce，操作时候可以将jar包和job文件一起打包，也可以在job内部指定jar包的路径：

#mapreduce.job
type=command
command=/root/apps/hadoop/bin/hadoop jar /root/apps/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar pi 5 5

执行结果如下：

9. Hive操作的Job

首先要保证环境中有hive工具可以使用，并有对应的数据库可以操作，hive.job内容如下：

##hive.job
type=command
command=/root/apps/hive/bin/hive -f curd.sql

curd.sql 内容如下：

describe user_info;

将这两部分内容打包到azkaban平台，执行如下：

10. 任务的依赖关系

在Azkaban中实际生产中，更多使用的是多个不同任务的Job形成新的的Job，其内部的每个job都需要定义好执行的顺序，这里可以使用dependencies属性来配置。

##foo.job
type=command
command=echo "foo"

##bar.job
type=command
dependencies=foo
command=echo "bar"

11. Azkaban知识点补充

Azkaban支持的指令类型有很多种，比如shell指令，hadoop shell指令，Java代码，hadoop java代码，Pig 指令，Hive指令等等，但是最常见的还是shell 的command指令，官方路径是： https://azkaban.readthedocs.io/en/latest/jobTypes.html 。

在一个job中可以一次性执行多个不同的command指令，像 command.1 , command.2 等等…

##multiple commands job
type=command
command.1=ls /root
command.2=mkdir /root/wolfcode
command.3=...

当前我们最常用的是方式是通过Azkaban 提供的网页端来操作任务流，同时Azkaban 也提供了ajax api的方式来操作任务流，详情可以查看官方文档：https://azkaban.readthedocs.io/en/latest/ajaxApi.html?highlight=ajax。

1.执行工作流界面：From the Flow View panel, you can right click on the graph and disable or enable jobs. Disabled jobs will be skipped during execution as if their dependencies have been met. Disabled jobs will appear translucent.

2.在工作流的左边还有一个通知面板，在当执行完成/成功/失败的时候，可以通过配置email来进行相关责任人的通知（这个模块因为及时性比较低一般用不到）

3.在工作流左下角还有一个定时器的按钮，其时间的规范与crontab 的时间规范一致，其用来指定任务做定时执行。

[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
大数据产品化的窗口期可鱼KEYU
已经之身大数据行业三四年，按理说应该可以说点所谓的经验。但是，现在大数据行业似乎有行无市。看起来高大上，但距离日常好像很远。其实，已经不是这个样子，大数据杀熟每天都在发生，看来大数据确实是已经飞入寻常百姓家。实际上，从应用范围看，也确实是这个样子。但是现在所谓的大数据是大数据吗，现在大数据应用是我们应该看到的样子吗现在数据价值已经深入人心，但是现在所谓应用的数据都是宅数据。有百度数据，阿里数据，腾
大数据分析与大数据开发两者的区别是怎样的? 泰迪智能科技01 就业班大数据
大数据主要分为两个就业方向：①大数据开发②大数据分析大数据分析：主要负责现有数据价值提炼与挖掘，包括业务增长点挖掘，产品改进点挖掘，业务分析指标体系构建，业务分析报告出具等大数据开发：主要负责大数据平台与应用开发，包括数据仓库构建，离线计算、实时计算应用开发，大数据应用后端开发，企业数据标准制定等就业岗位薪资（平均月薪如下）大数据的培训目标是什么呢？大数据分析方向：从企业实际数据分析需求出发，满足
Python大数据学习day01——大数据开发概论笨小孩124 python 学习总结大数据学习 python
目录大数据概念大数据特点大数据应用场景大数据分析业务步骤大数据职业规划大数据学习路线1.大数据解决问题海量数据存储——海量数据运算——海量数据迁移2.大数据特点（大、多、值、快、信）数据体量大种类和来源多源化实现低价值密度速度快数据的质量准确可信3.大数据应用4.大数据分析步骤明确分析目的思路——数据收集——数据处理（ETL）——数据分析——数据展现——撰写报告5.大数据职业规划6.大数据学习路线
倒计时8天！松下信息和望繁信科技邀您参加「数智时代下大数据应用的“道”与“术”」闭门会议望繁信科技数字化转型流程挖掘智能化应用大数据流程智能
我们即将迎来松下信息系统（上海）有限公司（简称“松下信息”）与上海望繁信科技有限公司（简称“望繁信科技”）联合举办的“数智时代下大数据应用的‘道’与‘术’”大会。距离8月23日的会议仅剩8天！这将是一次不容错过的盛会，旨在探索数字化转型和智能化应用的深度与广度，为企业赋能，助力未来发展。在这场汇聚了顶尖专家的闭门会议上，松下信息和望繁信科技将联手揭示大数据与智能化结合的核心理念，并深入剖析如何将这
邀请函 I 松下信息和望繁信科技邀您参加「数智时代下大数据应用的“道”与“术”」闭门会议望繁信科技科技大数据流程挖掘人工智能数智时代
在数字化浪潮席卷全球的今天，大数据与智能化的结合成为企业成功的关键。为了深入探讨这一重要议题，松下信息系统（上海）有限公司（简称“松下信息”）与上海望繁信科技有限公司（简称“望繁信科技”）将于8月23日在北京联合举办一场闭门会议。此次会议主题为“数智时代下大数据应用的‘道’与‘术’”，旨在为企业提供前沿的技术视角与实际应用策略。松下信息成立于2004年，是松下集团在中国的外商独资IT公司，专注于数
GEE在灾害预警中的遥感云大数据应用及GPT模型辅助分析 AIzmjl GPT 生态遥感大数据 gpt gee 灾害预警水体湿地遥感
随着遥感技术的快速发展，云大数据在灾害、水体与湿地领域的应用日益广泛。通过遥感云大数据，我们能够实时获取灾害发生地的影像信息，为灾害预警、应急响应提供有力支持。同时，在水体与湿地监测方面，遥感云大数据也发挥着重要作用，帮助我们了解水体的分布、变化以及湿地的生态状况。近年来，GPT模型在自然语言处理领域取得了显著成果，其强大的文本生成和理解能力为遥感云大数据的应用提供了新的可能。通过将GPT模型与遥
开源大数据管理平台选型大数据AI 大数据从入门到精通大数据
随着CDH和HDP的闭源，还有国内信创需求，经过前期调研和后期实践，目前主要有两个产品满足要求：apachebigtop和DataSophon符合要求。因为这两个产品都是完全开源的，自助可控。一apachebigtop项目地址：https://bigtop.apache.orgApacheBigtop是一个开源项目，旨在提供一套完整的开源软件栈，用于构建、测试和部署大数据应用程序。该项目的主要目标
【EI（核心），Scopus检索】第五届计算机信息和大数据应用国际学术会议（CIBDA 2024）艾思科蓝 AiScholar 学术会议大数据人工智能机器学习物联网云计算信息与通信人机交互
第五届计算机信息和大数据应用国际学术会议（CIBDA2024）将于2024年3月22-24日在中国武汉召开，邀请来自国内外高等院校、科学研究所、企事业单位的专家、教授、学者、工程师参与其中，共同围绕“计算机技术”“信息科学”“大数据”主题分享专业经验，扩大专业网络，面对面交流新思想以及展示研究成果，探讨本领域发展所面临的关键性挑战问题和研究方向。会议以期推动理论、技术在高校和企业的发展和应用，更旨
python爬取网页内容大作业_【大数据应用技术】作业八｜爬虫综合大作业（下）... weixin_39720662 python爬取网页内容大作业
前言本次作业是爬取拉勾网python相关岗位的信息，通过爬取岗位id、城市、公司全名、福利待遇、工作地点、学历要求、工作类型、发布时间、职位名称、薪资、工作年限等数据并对其进行数据分析从而得出相应结论。网页爬虫1.代理IP在爬取数据之前我们可以考虑使用代理ip进行爬取，所以这里我写了一段代码检测ip的有效性，这里我使用的是西刺免费代理ip进行测试。不过在测试中我发现可用的免费代理ip少之又少，并且
大健康观察轻气球
随着国家、省市不断深入推进大健康产业发展，在"双创四众"、"一带一路"、"创新引领、开放崛起"等利好政策的支持下，创新创业在各个领域掀起的热潮一浪高过一浪，大健康产业以及大数据应用拥有了广阔的发展和前景。9月份小编拜访了大健康行业以下几种类型的企业家,分别有如下收获,待我一一道来净水器行业:是一款按大健康理念生产出来的水壶,特点是没有滤芯,直接过滤掉,同时还会有氧分子,对人身体是有益的,能促进肠道
用 Python 写了一个电子考勤系统 Python栈_基 python 开发语言
今天给大家分享一个比较有意思的Python应用，用Python写了一个电子考勤系统，源码已在文章全部给出，记得点赞收藏哦～项目简介学校现在需要实现一个电子考勤系统，考虑到你们班已经学过大数据应用开发语言Python，准备让你们实现部分学生端考勤功能。经过和老师的沟通，你了解到：（1）目前该系统已经被学长实现了部分功能，你们只需要完成剩余功能即可，需要你们完成的功能会使用#todo的形式进行标注，t
2023年全国职业院校技能大赛大数据应用开发赛题第01套旺仔Sec 大数据应用开发竞赛试题大数据
2023年全国职业院校技能大赛大数据应用开发赛题第01套PS：需要资源可私信博主！背景描述大数据时代背景下，电商经营模式发生很大改变。在传统运营模式中，缺乏数据积累，人们在做出一些决策行为过程中，更多是凭借个人经验和直觉，发展路径比较自我封闭。而大数据时代，为人们提供一种全新的思路，通过大量的数据分析得出的结果将更加现实和准确。商家可以对客户的消费行为信息数据进行收集和整理，比如消费者购买产品的花
Elasticsearch 别名：灵活索引管理的利器地瓜伯伯 elasticsearch java
在现代的大数据应用中，Elasticsearch以其卓越的全文搜索能力和分布式特性，成为了许多企业和开发者的首选数据存储和查询引擎。在Elasticsearch的众多功能中，别名（Alias）是一个相对简单但非常实用的特性。通过别名，我们可以更加灵活地管理索引，实现无缝的版本控制、索引拆分和滚动更新等应用场景。本文将深入探讨Elasticsearch别名的工作原理和实际应用。一、Elasticse
大数据应用工具有哪些 QFdongdong
互联网的迅速发展推动信息社会进入到大数据时代，大数据催生了人工智能，也加速推动了互联网的演进。再对大数据的应用中，有很多工具大大提高了工作效率，本篇文章将从大数据可视化工具和大数据分析工具分别阐述。大数据分析工具：RapidMiner在世界范围内，RapidMiner是比较领先的一个数据挖掘的解决方案。很大程度上，RapidMiner有比较先进的技术。RapidMiner数据挖掘的任务涉及了很多的
如何基于Java实现一套特色民宿平台系统？ qq_469603589 网站平台类项目 Java项目实战 java 开发语言民宿管理系统 java民宿
作者简介：全栈开发工程，从事Java、Python、前端、小程序方面的开发和研究，对大数据应用与开发比较感兴趣，主要内容：Java项目、前端项目、Python项目、小程序开发、大数据项目、单片机收藏点赞不迷路关注作者有好处文末获取源码感谢您的关注，请收藏以免忘记，点赞以示鼓励，评论给以建议，爱你哟项目编号：BS-PT-095目录一，环境介绍二，项目简介三，系统展示3.1系统前台界面的实现3.1.1
基于JavaWeb实现洋酒销售平台的设计与实现 qq_469603589 商城类项目 Java项目实战洋酒销售系统红酒销售系统酒店销售商城
作者简介：全栈开发工程，从事Java、Python、前端、小程序方面的开发和研究，对大数据应用与开发比较感兴趣，主要内容：Java项目、前端项目、Python项目、小程序开发、大数据项目、单片机收藏点赞不迷路关注作者有好处文末获取源码感谢您的关注，请收藏以免忘记，点赞以示鼓励，评论给以建议，爱你哟项目编号：BS-PT-057前言：随着洋酒与中国市场的相互适应以及电子商务和网上商店的普及，洋酒类商品
基于Springboot+Vue医院挂号及信息化管理系统 qq_469603589 Java项目实战医疗类项目医院挂号系统前后端分离医疗 Vue前端
作者简介：全栈开发工程，从事Java、Python、前端、小程序方面的开发和研究，对大数据应用与开发比较感兴趣，主要内容：Java项目、前端项目、Python项目、小程序开发、大数据项目、单片机收藏点赞不迷路关注作者有好处文末获取源码感谢您的关注，请收藏以免忘记，点赞以示鼓励，评论给以建议，爱你哟项目编号：BS-YL-024一，环境介绍语言环境：Java:jdk1.8数据库：Mysql:mysql
思政教育平台|学院网站|基于JavaWeb的高校思政教育平台的设计与实现 qq_469603589 网站平台类项目 Java项目实战学校网站思政教育平台思想教育平台 JAVA平台网站
作者简介：全栈开发工程，从事Java、Python、前端、小程序方面的开发和研究，对大数据应用与开发比较感兴趣，主要内容：Java项目、前端项目、Python项目、小程序开发、大数据项目、单片机收藏点赞不迷路关注作者有好处文末获取源码感谢您的关注，请收藏以免忘记，点赞以示鼓励，评论给以建议，爱你哟项目编号：BS-PT-096目录一，环境介绍二，项目简介三，系统展示四，核心代码展示五，相关作品展示一
相册管理系统|基于Springboot+Vue实现前后端分离的相册管理系统 qq_469603589 网站平台类项目 Java项目实战 spring boot 后端 java 相册管理个人相册管理
作者简介：全栈开发工程，从事Java、Python、前端、小程序方面的开发和研究，对大数据应用与开发比较感兴趣，主要内容：Java项目、前端项目、Python项目、小程序开发、大数据项目、单片机收藏点赞不迷路关注作者有好处文末获取源码感谢您的关注，请收藏以免忘记，点赞以示鼓励，评论给以建议，爱你哟项目编号：BS-PT-100一，环境介绍语言环境：Java:jdk1.8数据库：Mysql:mysql
人工智能与工业4.0在智能制造的应用 weixin_30649859 大数据人工智能
美国辛辛那提大学特聘讲座教授,美国白宫信息物理系统与美国挑战项目顾问李杰，在2017中国大数据应用大会上，分享了对工业大数据，以及人工智能怎么改进工业大数据分析的见解。至顶网CIO与应用频道07月20日北京消息：在2017中国大数据应用大会上，美国辛辛那提大学特聘讲座教授、美国白宫信息物理系统与美国挑战项目顾问李杰，分享了对工业大数据，以及人工智能怎么改进工业大数据分析的见解。工业大数据我在美国产
区块链和大数据有什么关系？离开的人
区块链和大数据都是热门话题。许多人把它们放在一起讨论，并希望与更多的热点相冲突。大数据早于区块链的发展已经成为一个巨大的行业。尽管区块链处于行业的早期阶段，但许多技术和商业模式仍在探索之中。鉴于大数据行业相对成熟，我们以大数据为起点，研究区块链技术如何与大数据行业的各个方面进行接口。大数据核心产业链大致可以分为以下三部分：产品部分：包括大数据基础软件和大数据应用软件等大数据软件产品相关行业。数据部
航道大数据应用专项研究报告（附下载）智能交通技术大数据
总体目标充分认识航道大数据对行业治理的重要性和必要性，航道大数据的开发和利用是建设智慧航道的基础。基于大数据的航道管理体系，实现了现有数据的梳理和汇聚，跨部门数据的交换和整合，建立了数据关联和深度学习的模型机制，利用人工智能技术对大数据进行智能分析，为智慧航道管理提供科学预警、风险管控的支持。从航道业务治理方面，通过对现有数字航道、航道养护、航道事务管理信息数据的梳理、改造集成，研究大数据对未来智
大数据平台_大数据应用场景有哪些思迈特Smartbi 数据挖掘大数据人工智能数据分析
大数据时代的出现，简单的讲是海量数据同完美计算能力结合的结果，确切的说是移动互联网、物联网产生了海量的数据，大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题。一些公司也成立了大数据部门，大数据得到了企业的高度重视，但是很多企业和厂商主要的困难在于大数据的场景应用，既如何利用数据分析和外部数据来提升业务。其实大数据的场景应用可以从横向和纵向来说，可以从数据源、数据应用、数据分析方法和
大数据企业应用场景分析 i7杨大数据
目录一、企业分析1.1企业领域维度分析1.2技术服务型维度分析1.3细分领域维度分析二、大数据应用场景2.1数据分析2.2智能推荐2.3产品/流程优化2.4异常监测2.5智能管理2.6人工智能和机器学习三、总结前言：想讲清楚大数据应用对企业的价值，需要先分清楚有哪些企业，什么场景下需要用到大数据技术，本文从两个视角分析，一个是大数据企业类型，二是应用场景。给下一篇大数据应用对企业的价值做铺垫。一、
中国大学生计算机设计大赛与大数据应用主题赛泰迪智能科技计算机大赛大数据
中国大学生计算机设计大赛与大数据应用主题赛中国大学生计算机设计大赛（简称“大赛”或4C）始筹于2007年，首届于2008年，已经举办了16届80场赛事。是我国高校面向本科生最早的赛事之一，由教育部计算机类教指委发起举办，该赛事目前是全国普通高校大学生竞赛排行榜榜单内赛事，每年举办一次。继2023年3月，大赛被列入中国高等教育学会高校竞赛评估与管理体系研究专家工作组发布的《2022全国普通高校大学生
大数据应用开发3-Scala笔记1 争渡争渡！大数据 scala 笔记
一、编程框架Scala语言是在JVM上运行的，兼容Java语法区分大小写-Scala是大小写敏感的，这意味着标识Hello和hello在Scala中会有不同的含义。类名-对于所有的类名的第一个字母要大写。如果需要使用几个单词来构成一个类的名称，每个单词的第一个字母要大写。方法名称-所有的方法名称的第一个字母用小写。如果若干单词被用于构成方法的名称，则每个单词的第一个字母应大写。示例：defmyMe
暴雨受邀出席太原市人工智能行业协会年度大会 BAOYUCompany 人工智能
2024年1月26日，太原市人工智能行业协会第二届二次会员大会暨2024年年会成功召开。太原市委、市工商联、市大数据应用中心、市政协经济委员会以及太原市科技局的专家领导，与三百多名来自各行业的人工智能企业家和协会会员一同参加了本次盛会，共同探讨人工智能行业的未来发展。作为国内专业的算力基础设施供应商，暴雨受邀出席大会并发表主题演讲。在本次大会上，暴雨分享了过去一年的发展成果及在AI领域获得的重大突
测试开发：一文教你从0到1搞懂大数据测试！测试开发技术
1.什么是大数据大数据是一个大的数据集合，通过传统的计算技术无法进行处理。这些数据集的测试需要使用各种工具、技术和框架进行处理。大数据涉及数据创建、存储、检索、分析，而且它在数量、多样性、速度方法都很出色，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。image2.大数据测试类型测试大数据应用程序更多的是验证其数据处理，而不是测试软件产品的个别功
大数据时代的数据价值与利用程序o07
大数据时代的数据价值与利用随着信息技术的发展，生活发生了天翻地覆的变化，同时，它也改变着人们的思维模式。现在我们之所以能接触到如此多的信息，是得益于网络技术与数据存储技术的发展。而要管理和利用这些数据，就需要专门的技术与工具，这就是大数据应用技术蓬勃发展的原因。大数据分析工具能将信息收集存储，并且能挖掘、提取其中有价值的数据并加以利用。大数据分析工具并不是一种简单的数据统计软件，它除了要完成数据管
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l