Spark on yarn

剑指数据仓库-项目篇(四) - DWS层&&ADS层指标计算

一、项目回顾

二、首先做的是DWS轻度汇总层

2.1、案例：抽取数据过程中遇到的问题
- 2.1.1、DWS调度
2.2、如何在ADS层做指标计算
2.3、分组求TopN
2.4、Hive的行转列&&Dbeaver数据导出

三、部署Rundeck遇到的问题（Linux的OOM机制）

一、项目回顾

https://blog.csdn.net/SparkOnYarn/article/details/105454067
业务字段上没有updatetime的话需要去补这个字段；物理delete和逻辑delete；数据建模说白了就是根据业务建表结构；生产上经常会把两张表合为一张表，虽然占据空间大，但是性能高；join和group by的性能肯定是低的；无论是变态版星型模型还是雪花模型就是多张主表和明细表join后得到的一张表；无论是对外、对内的指标；我们可以存储这个指标的最小粒度的数据；

指标分析都和时空有关，时空大数据，和地理、时间挂钩；这张标准的4层架构图要印在脑子里，第一次是初始全量表 --> DWD数据表；把DWD的数据和ODS的数据join和union如果之前存在标记为开始时间；事实表和维度表正常做join，DWS叫做轻度汇总表，也叫聚合事实表；

二、首先做的是DWS轻度汇总层

1、事先建立好ODS DWD层所有相关表
2、抽取数据从ODS --> DWD层

抽取数据需要部署Rundeck调度工具，或者Azkaban，不要使用airflow，虽然很炫，但是坑很多；

/opt/shell/offlineDW/ods_init.sh ruozedata_depot
/opt/shell/offlineDW/ods_init.sh ruozedata_depothead
/opt/shell/offlineDW/ods_init.sh ruozedata_depotitem
/opt/shell/offlineDW/ods_init.sh ruozedata_material
/opt/shell/offlineDW/ods_init.sh ruozedata_materialcategory
/opt/shell/offlineDW/ods_init.sh ruozedata_supplier

下一步，进行调度，此处进行的是全量初始化，今天是20号，包含19号的数据做全量；我们站到20号来执行的；把所有相关的表都抽取到ods层；

如下显示正在running
出现问题：检查rundeck下mysql的连接配置（数据库、用户名、密码是否都启动对了），检查hdfs是否启动，Linux上的mysql服务是否已经启动？

点击左侧的ACTIVITY直接查看job任务运行状态？
接下来就是做ods_update.sh脚本内容，千万不要傻乎乎的去做create，直接复制job，然后workflow中修改脚本名字。运行这个job就可以了。

2.1、案例：抽取数据过程中遇到的问题

sqopp脚本在抽取的时候可能没问题，但是数据可能有问题，MySQL和Hive做count数比较，一般出现换行情况的话会形成多行导致数据不一样。

MySQL数据库中ruozedata_materialcategory这个表的数据使用ods_init.sh抽取到数据有一行出现了问题；

碰到数据不对情况下如何操作，把这个表数据干掉，手动直接进行抽取；

生产重要性5颗星：hive的建表字段和MySQL是冲突的怎么办?

先把表中数据删除，再修改ruozedata_materialcategory表的DDL语句，把它的换行符换掉；

第一次尝试：

因为mysql的商品表中有一行中的内容是字段是以换行符区分的；那我们在Hive中把这个数据的换行符换成特殊的值，在Dbeaver中换行符仅支持\n；这种方法pass.

第二次尝试：

那我们如何使用SQL去replace呢？
SQL改了之后，shell脚本也要同步进行更改。

进入到shell的脚本目录中去，专门的拷贝ods_init.sh的这个shell脚本，其实就是改那句select语句；
去到MySQL中的ruozedata_materialcategory这张表中，右键点击这张表，选择生成SQL --> 再选择select；

SELECT `Id`, `Name`, `CategoryLevel`, `ParentId`, sort, status, serial_no, replace(replace(remark,char(10),''),char(13),'') as remark, create_time, creator, update_time, updater, tenant_id, `UpdateTime`
FROM ruozedata_erp.ruozedata_materialcategory;

此时就不存在Hive表了，这种操作不用删除表，数据在运行脚本时会直接进行覆盖；在数据抽取过程中这是一个很正常的过程，千万不要认为shell脚本执行的命令都是okay，其实不然，你的数据是不okay的。

MySQL和Hive做count数比较，可以知道两者的数据是否相同。

SQOOP抽取的时候是okay的，不代表数据是okay的。

ods_init和ods_update的数据已经就是okay的了，此时去做dwd层的数据；

此时去做dwd层的数据：

还是一葫芦画瓢拷贝一个dwd层数据，全是改成dwd，这个数据肯定是串行的，那并行的如何去做呢，做两个shell脚本，并行着同一时间去启动，dwd启动的时候去做一个dwd层的update；

dwd是紧跟着ods的时间的，ods_update比如是晚上1点做，那dwd_update就是今天晚上2点做；从ods层汇总到dwd层。

dws_bill.sh生成的表不是普通表，每一天的数据都是基于来自dwd的事实表和维度表进行覆盖的，大数据不就是处理海量数据存储计算的

2.2、如何在ADS层做指标计算

最近30天的每天每小时的订单量（含退货）、退货订单量？

多维的最小粒度的数据，基于小时

Hive上的维表是怎么做的？
先把ADS的表创建好，

凭借：ERP --> ODS --> DWD层提交给J哥去获取–>DWS --> ADS层的数据；
只要运营人员上班了，一般在上班前数据能够出来就行了；最终所有的结果还需要发一封邮件，所有job的完成度；查看哪些job挂了，重要的job还需要有电话进行提醒。

为什么我们是串行的，因为我们的业务逻辑是串行的；就相当于是公平调度器一样，订单总量和订单退货总量。

要去求订单总量，直接从bill这张表中去重数据：

为什么要distinct dws_ruozedata_bill.number？一个订单中有多条明细 --> 为了去重数据；类型模糊查询"退货"的，

两张表做一个内连接是没有问题的，为什么？
每张表的计算结果只有1行1列

A表数据：28，B表数据：4；–> A B两表做内连接的结果：28、4（1行2列）；

A表：28 29
B表：4 5
产生笛卡尔积，导致数据紊乱。

2.3、分组求TopN

select 
	firstcategory,materialname,
	round(sum(allprice,2)) as sell_sku_allprice
	from ruozedata_erp.dws_ruozedata_bill
	where concat_ws('-',`type`,subtype) in ('出库-销售'，'出库-其它','出库-零售')
	group by firstcategory,materialname;

那修改需求呢，一级类别的前三畅销商品?

2.4、Hive的行转列&&Dbeaver数据导出

需求：每年每个月的各个商品各个仓库的采购，销售的数量是多少？

首先计算采购，都是基于DWS的指标进行计算的，基本没和其它表进行join，顶多就是一个union，自己join自己；

行转列的意思是什么呢？

运营部门的数据导出只需要excel表的话，直接Dbeaver中进行导出，表头的字段需要自己进行修改。

步骤一：
选中所有数据，右键选中导出结果集：

步骤二：
导出选择为csv格式：

步骤三：

步骤四：选择输出目录：

三、运行Rundeck遇到的问题(Linux OOM)

阐述背景：一开始按照J哥的文档进行部署Rundeck，结果发现一直报一个jvm内存不够的错误，当时更换了rundeck的版本发现并没有什么问题，也没太在意，但是启动rundeck后，新建job任务后，会发现这个rundeck进成会莫名其妙的挂掉；因为我买的是2核4g的云主机，内存只有4G，猜测这个进程吃内存触发了Linux的OOM机制。

扩展：Linux的OOM机制（Out Of Memory Killer）简而言之，会在系统内存耗尽的情况下杀掉耗内存最多的进程，具体的日志记录是在/var/log/messages：

1、监听系统日志：
tail -F /var/log/messages
Apr 22 12:19:57 hadoop001 kernel: Out of memory: Kill process 22088 (java) score 201 or sacrifice child
Apr 22 12:19:57 hadoop001 kernel: Killed process 22088, UID 500, (java) total-vm:3656768kB, anon-rss:785776kB, file-rss:868kB

2、查看到22082这个进程Out of memory
[hadoop@hadoop001 ~]$ sudo netstat -nlp|grep 22088
tcp        0      0 ::ffff:172.17.0.5:4440      :::*                        LISTEN      22088/java          

3、此时使用jps查看就说明22082这个进程已经挂了：
[hadoop@hadoop001 ~]$ jps
9393 SecondaryNameNode
9073 NameNode
9554 ResourceManager
22421 Jps
9654 NodeManager
22088 -- process information unavailable
9210 DataNode
17706 RunJar

你可能感兴趣的:(剑指数据仓库-项目篇)

国米夏窗豪赌：奥纳纳回归+锋线强援剑指双线复兴花开半谢笔记
国际米兰在刚刚结束的世俱杯1/8决赛中0-2完败于弗鲁米嫩塞，冲击冠军梦想戛然而止。这场失利不仅暴露了球队的临场状态问题，更揭示了阵容的关键短板。门将位置成为焦点，高龄的索默本场表现挣扎，赛后评分仅5.9分。球迷虽认为失利非他一人之责，但其状态下滑已是不争事实。夏窗换血势在必行。一个令人瞩目的潜在选项浮出水面——回购旧将奥纳纳。媒体消息显示，曼联正积极追求维拉门神大马丁，有意出售奥纳纳腾出薪资空间
剑指offer第二版学习笔记（一）前言虚空来袭剑指offer第二版剑指Offer 第2版
久闻剑指offer大名，如今我也到了要找工作的时候了，趁现在还有时间，多学一点是一点，在此开一个分集记录一下在学习剑指offer过程中的一些经验和想法。注：使用的书籍是剑指offer第二版。本期内容书籍内容书籍内容简介结语本期仅写了书籍内容介绍，作者还总结了书籍特色、对创作过程中家人、朋友等进行了感谢，我略去了这些部分。下期应该是接着看第一部分。
剑指offer 第二版（1——20）学心理学的猫剑指向offer 算法数据结构 c++
剑指OfferII001.整数除法intdivide(inta,intb){boolflag=false;if(b==INT_MAX){if(a==INT_MIN||a==-INT_MAX)return-1;if(a==INT_MAX)return1;elsereturn0;}if(b==INT_MIN){if(a==INT_MIN)return1;elsereturn0;}if(a==INT_M
【力扣—剑指 Offer（第 2 版）简单题目解析汇总】 Wupke 剑指offer 数据结构与算法学习 LeetCode leetcode 剑指offer 数据结构与算法
【力扣—剑指Offer（第2版）简单题目解析汇总】说明1、基本字符串数组数组-排序矩阵/模拟枚举2、算法动态规划深度优先搜索广度优先搜索递归分治记忆化搜索快速选择二分查找3、基础数据结构树（二叉树）二叉搜索树栈队列堆（优先队列）哈希表链表4、技巧性题目双指针位运算计数设计说明简单题目共计38道，按照标签分类为：基本、算法、基础数据结构、技巧等，具体如下。1、基本字符串剑指Offer05.替换空格.
剑指offer-7、斐波那契数列后端java
题⽬描述⼤家都知道斐波那契数列，现在要求输⼊⼀个整数n，请你输出斐波那契数列的第n项（从0开始，第0项为0，第1项是1）。(n<=39)输⼊描述：⼀个正整数n返回值描述：输出⼀个正整数。思路及解答直接暴⼒思路很直接，利⽤函数进⾏递归即可。publicclassSolution{publicintFibonacci(intn){if(n==0){return0;}elseif(n==1){retur
数据同步工具对比：Canal、DataX与Flink CDC 智慧源点大数据 flink 大数据
在现代数据架构中，数据同步是构建数据仓库、实现实时分析、支持业务决策的关键环节。Canal、DataX和FlinkCDC作为三种主流的数据同步工具，各自有着不同的设计理念和适用场景。本文将深入探讨这三者的技术特点、使用场景以及实践中的差异，帮助开发者根据实际需求选择合适的工具。1.工具概述1.1CanalCanal是阿里巴巴开源的一款基于MySQL数据库增量日志(binlog)解析的组件，主要用于
剑指-offer-扑克牌中的顺子判断 hi error.cn 经验分享
剑指Offer扑克牌中的顺子判断问题描述在扑克游戏中，判断一副牌是否构成一个“顺子”是一个经典的问题。顺子指的是连续的五个数字（可以包含大小王），其中大小王可以视作任意数字来填补空缺。具体来说，给定一副牌，判断这副牌能否构成一个有效的顺子。问题分析要解决这个问题，我们首先需要了解如何处理大小王的角色以及如何检测顺子的存在性。一般情况下，顺子的定义是五个连续的数字（不包含重复）。在有大小王的情况下，
SQLite 数据库在大数据分析中的应用潜力数据库管理艺术数据库 sqlite 数据分析 ai
SQLite数据库在大数据分析中的应用潜力关键词：SQLite、大数据分析、轻量级数据库、嵌入式数据库、数据仓库、OLAP、性能优化摘要：本文深入探讨了SQLite这一轻量级嵌入式数据库在大数据分析领域的应用潜力。我们将从SQLite的核心架构出发，分析其在大数据场景下的优势和限制，并通过实际案例展示如何通过优化策略和扩展技术使SQLite能够处理大规模数据集。文章包含性能对比测试、优化技巧和实际
SnowConvert：自动化数据迁移的技术解析与最佳实践 weixin_30777913 迁移学习数据库运维
SnowConvert是Snowflake生态系统的关键迁移工具，专为将传统数据仓库（如Oracle、Teradata、SQLServer等）的代码资产高效、准确地转换为Snowflake原生语法而设计。以下基于官方文档对其技术原理、工作流程及最佳实践进行深入分析：一、SnowConvert核心技术解析精准的语法映射引擎语言支持：深度解析源系统特有语法（OraclePL/SQL,TeradataB
剑指offer46_字符串中第一个只出现一次的字符
字符串中第一个只出现一次的字符字符串中找出第一个只出现一次的字符。如输入"abaccdeff"，则输出b。如果字符串中不存在只出现一次的字符，返回#字符。数据范围输入字符串长度[0,1000][0,1000][0,1000]。样例输入："abaccdeff"输出：'b'算法思路（哈希表计数）核心思想：使用哈希表统计每个字符的出现次数。二次遍历字符串，找到第一个计数为1的字符。关键步骤：第一次遍历：
信创背景下，企业国产化在低代码平台上如何实现？热心市民赵女士数据库 java 开发语言
编者按：在国家政策及战略方向的指导下，信创产业已成为奠定中国未来发展的重要数字基础，而国产化则可以解决核心技术关键被“卡脖子”的问题。另一方面，低代码平台能够为企业加速交付业务应用，降低运营成本，已经成为加速数字化转型、适应未来发展的关键技术。低代码是一场针对软件开发的“效率革命”，而信创是剑指中国IT产业的“安全自主”，两者看似不相关，实则紧密相联。Myapps低代码平台作为有着将近20年开发经
剑指offer-6、旋转数组的最小数字后端java
题⽬描述把⼀个数组最开始的若⼲个元素搬到数组的末尾，我们称之为数组的旋转。输⼊⼀个⾮递减排序的数组的⼀个旋转，输出旋转数组的最⼩元素。例如数组{3,4,5,1,2}为{1,2,3,4,5}的⼀个旋转，该数组的最⼩值为1。NOTE：给出的所有元素都⼤于0，若数组⼤⼩为0，请返回0。思路及解答在这⾥最重要的特征是⾮递减排序，也就是本来是递增的，如果旋转后会出现什么情况呢？肯定会出现先递增，再递减的情况
实时数仓工具-SelectDB 清平乐的技术博客实时数仓数据仓库
一、SelectDB简介官网：https://www.selectdb.com/1、ApacheDorisApacheDoris是一款采用MPP架构的实时分布式OLAP数据仓库，专注于高效的实时数据分析。Doris项目于2013年内部开发，2017年正式开源，目前在GitHub上获得了接近13,000星，全球已有超过5,000家企业采用，社区活跃度极高，累计贡献者超过650人，且曾连续数月在大数据
解锁 AnalyticDB for PostgreSQL 的潜力：从数据仓库到矢量数据库 aehrutktrjk 数据库 postgresql 数据仓库 python
引言在大数据时代，快速分析大量数据已成为企业竞争的关键。AnalyticDBforPostgreSQL是阿里云提供的一个强大的并行处理数据仓库服务，适用于在线分析海量数据。本文将探讨其基本功能及在矢量数据库中的应用，包括如何与Langchain进行集成。主要内容AnalyticDBforPostgreSQL的核心功能大规模并行处理(MPP)：允许高效地处理和分析大量数据。兼容性：支持ANSISQL
针对数据仓库方向的大数据算法工程师面试经验总结巴基海贼王数据仓库大数据算法
⚙️一、技术核心考察点数据建模能力星型vs雪花模型：面试官常要求对比两种模型。星型模型（事实表+冗余维度表）查询性能高但存储冗余；雪花模型（规范化维度表）减少冗余但增加JOIN复杂度。需结合场景选择，如实时分析首选星型。建模实战题：例如设计电商销售数仓，需明确事实表（订单流水）、维度表（商品、用户、时间），并解释粒度选择（如订单级）。ETL流程与优化增量抽取方案：面试高频题。需掌握基于时间戳、CD
解锁阿里云AnalyticDB：数据仓库的革新利器云资源服务商阿里云云计算数据库服务器
AnalyticDB：云数据仓库新势力在数字化浪潮中，数据已成为企业的核心资产，而云数据仓库作为数据管理与分析的关键基础设施，正扮演着愈发重要的角色。阿里云AnalyticDB作为云数据仓库领域的佼佼者，以其卓越的性能、创新的架构和丰富的功能，为企业提供了强大的数据处理与分析能力，助力企业在数据驱动的时代中脱颖而出。AnalyticDB是阿里云自主研发的云原生数据仓库，采用存储计算分离+多副本架构
【面试系列】云计算工程师高频面试题及详细解答野老杂谈全网最全IT公司面试宝典面试云计算职场和发展
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录常见的初级面试题1.什么是云计算？2.
剑指offer-5、两个栈实现⼀个队列后端java
题⽬描述⽤两个栈来实现⼀个队列，完成队列的Push和Pop操作。队列中的元素为int类型。思路及解答栈的特性是先进后出队列的特性是先进先出有两个栈stack1,stack2；如果有新的数据进⼊，那么我们可以直接push到stack1；如果需要取出数据，那么我们优先取出stack2的数据，如果stack2⾥⾯数据是空的，那么我们需要把所有的stack1的数据倒⼊stack2。再从stack2取数据。
使用Airbyte连接Shopify进行数据集成实践 2301_80727036 语言模型 elasticsearch jenkins
在当今的数据驱动时代，数据集成平台如Airbyte变得尤为重要。它不仅可以让从API、数据库和文件到仓库或数据湖的ELT流程变得高效，还提供了丰富的连接器，支持各种数据源的集成。尽管Airbyte的Shopify连接器已经不再推荐使用，但它的使用方法仍然能为我们揭示一些重要的实践技巧。技术背景介绍Airbyte是一个开源的数据集成平台，专注于从各种数据源将数据提取、加载到目标数据仓库或者数据湖中。
Java EDW三剑客：如何让数据从“沼泽”变身“报告神器”？手把手教你玩转企业数据仓库！墨瑾轩 Java乐园 java 数据仓库开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣一、你的EDW在“数据沼泽”里？是时候请个“数据炼金术士”了！“数据散落在10个系统里，生成月报要熬3个通宵？”——别慌！今天我们就用JDBC+ApacheSpark+Thymeleaf三剑客，教你如何让Java在EDW中将“数据沼泽”炼成“报告神器”！从“数
Vue2中Vuex的五种核心状态管理详解：从State到Modules 上单带刀不带妹 Vue 前端 javascript 开发语言 vue vue.js
目录一、为什么需要Vuex？二、Vuex核心概念图解编辑三、五种核心状态详解1.State：数据仓库2.Getters：计算属性3.Mutations：同步修改器4.Actions：异步操作5.Modules：模块化四、各概念关系总结五、最佳实践技巧结语一、为什么需要Vuex？当组件层级变深、兄弟组件需要共享数据时，传统的props/$emit和事件总线会变得难以维护。Vuex通过集中式存储管理应
十、HQL：排序、联合与 CTE 高级查询 IvanCodes Hive教程 hive 大数据
作者：IvanCodes日期：2025年5月15日专栏：Hive教程ApacheHive作为大数据领域主流的数据仓库解决方案，其查询语言HQL(HiveQueryLanguage)是数据分析师和工程师日常工作的核心。除了基础的SELECT-FROM-WHERE，HQL还提供了强大的排序、数据合并以及组织复杂查询的机制。本文将深入探讨HQL中的排序操作(SORTBY,ORDERBY,CLUSTERB
LeetCode剑指offer算法备战春招-合并两个排序的链表 wangshuo（24考研上岸版） leetcode 算法职场和发展
剑指Offer25.合并两个排序的链表输入两个递增排序的链表，合并这两个链表并使新链表中的节点仍然是递增排序的。示例1：输入：1->2->4,1->3->4输出：1->1->2->3->4->4限制：0l2.val){list.next=l2;//l2大先接上l2=l2.next;//l2往后走}else{list.next=l1;l1=l1.next;}list=list.next;//新链表继
数据仓库面试题合集⑥ 晴天彩虹雨数据仓库面试解析集锦数据仓库大数据 clickhouse kafka
实时指标体系设计+Flink优化实战：面试高频问题+项目答题模板面试中不仅会问“你做过实时处理吗？”，更会追问：“实时指标体系是怎么搭建的？”、“你们的Flink稳定性怎么保证？”本篇聚焦实时指标体系设计与Flink优化场景，帮你答出架构设计力，也答出调优实战感。①面试核心问题导读“你们实时指标是怎么设计的？”“怎么处理指标的去重、延迟和聚合问题？”“你们的Flink作业怎么做资源优化？”“有没有
【算法-二分查找-python】搜索插入位置檀越@新空间 s1 Python P1 算法与数据结构算法 python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
【StarRocks系列】StarRocks vs Mysql 漫步者TZ StarRocks mysql 数据库 StarRocks 分布式数据库
目录StarRocks简介核心特性典型应用场景StarRocksvsMySQL：核心区别详解关键差异总结如何选择？StarRocks简介StarRocks是一款高性能、全场景、分布式、实时分析型的数据库（MPP-大规模并行处理）。它诞生于解决现代企业对海量数据进行快速、复杂分析的需求，尤其是在实时数据仓库、用户行为分析、日志分析、统一数仓等场景下表现卓越。核心特性MPP架构：采用无共享架构，计算和
数据切片是什么意思 yijiedsfrt 数据仓库
数据切片是指将一段数据按照特定的规则或条件进行分割，以便更方便地进行处理和分析。通常情况下，数据切片可以根据不同的维度、属性、时间等进行切割，以获取更加细化和精准的数据。数据切片可以在数据仓库、数据分析等领域中广泛应用。
医疗AI大数据处理流程的全面解析：从数据源到应用实践 Allen_Lyb 医疗高效编程研发人工智能机器学习健康医疗架构大数据
医疗AI大数据处理流程是一个复杂而系统的工程，涉及从数据源获取到最终应用的多个关键环节。随着信息技术在医疗行业的深入应用，医疗数据呈现爆发式增长，如何有效处理这些数据并转化为有价值的医疗知识，成为推动医疗AI发展的核心问题。本报告将全面剖析医疗AI大数据处理流程的关键环节，包括数据源、数据授权、数据接入、数据清洗、数据标准化、数据治理、数据应用与AI分析，以及数据流与数据仓库的概念，为医疗AI从业
使用Spring Boot框架来生成HTML页面并返回给客户端 _S_Q 后端服务 Java spring boot html python
文章目录1.创建SpringBoot项目1.1项目结构2.配置`pom.xml`3.编写代码3.1创建主应用程序类3.2创建数据模型3.3创建数据仓库3.4创建控制器3.5创建HTML模板4.运行应用程序总结下面是一个简单的Java实现，使用SpringBoot框架来生成HTML页面并返回给客户端。1.创建SpringBoot项目首先，确保你已经安装了Java和Maven。然后创建一个新的Spri
Doris 数据集成 Apache Paimon 猫猫姐 Doris doris
Doris数据集成ApachePaimon湖仓一体（DataLakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，帮助用户更加便捷地满足各种数据处理分析的需求。在过去多个版本中，ApacheDoris持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。为便于用户快速入门，我们将通过系列文章介绍ApacheDoris与各类主流数据湖格式及存储系统的湖仓一体架构搭
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他