梧桐林.

大数据面试题（校招）

项目

1.介绍电商数仓项目

2.在项目中用的什么数据栈？

3.数据仓库建模几种方式

一般有关系建模和维度建模，关系建模遵循范式，一般有一范式、二范式、三范式、bc范式等。
维度建模一般有星型模型、雪花模型、星座模型。星型模型允许数据冗余但是减少shuffle、雪花模型一般遵循范式，数据冗余少但增多工作量。星座模型与前两种不冲突，由多张事实表汇总。

4.讲一下维度建模，维度表

维度建模有两种表：维度表、事实表。
事实表存储现实发生的操作型事件，每完成一次事件对应增加一次记录。维度表就是一件事件的多个维度。事实表多个外键与维度表关联。
维度建模4个过程：
选择业务过程、声明粒度、确认维度、确认事实。

12.为什么会发生数据倾斜，怎么解决

原因：大量空值、key分布不均。
解决：
1.在map后combine
2.两次mr，第一次map对key加随机前缀，就会平均分配到reducer中，第二次mr去除前缀，性能较低
3.增加reduce个数，提升并行度
4.自定义hash，将key平均分配
5.（hive）groupby代替distinct，distinct只有一个reduce任务
6.（hive）大表join小表：开启map_join，将小表加载到内存，在map端join，否则在reduce端join
7.（hive）大表join大表：a表加随机数，b表扩容，然后ab表聚合

6.提到了map_join代替普通join，面试官问为什么map_join能解决数据倾斜，具体流程怎样

见上

8.数仓分层（各层作用）

ods层：
保持数据不修改、压缩、创建分区表防止全表扫描
dwd层：
去空、过滤无意义数据、将用户行为和业务表一致性处理、脱敏、压缩、列式存储
dws层：
统计各个主题当天行为
dwt层：
以分析的主题对象为建模驱动，基于上层的应用和产品的指标需求，构建主题对象的全量宽表，是累计的度量值
ods层：
对各个指标分析

9.数仓建设的理论（哪两种）为什么用这种？

维度建模：减少关联
关系建模：完整性，准确性，减少冗余，节省存储空间

10.星型模型和雪花模型介绍，各自的适合什么样的数据场景

星型模型：效率高，方便查询
雪花模型：冗余小、规范

13.什么是事务

事务是一组不可再分割的操作集合

hadoop

shuffle，yarn，hdfs读写流程

2.mapreduce从map-shuffle-reduce整个流程

map方法之后，数据首先进入分区方法，标记好分区之后，数据写入环形缓冲区中，环形缓冲区100M，在缓冲区内进行分区和分区内排序，快排，写到80%时，进行反向溢写，溢写会产生大量溢写文件，多个溢写文件采用分区内归并排序，形成大的溢写文件，可自定义combiner方法进行汇总操作，写到磁盘中等待拉取。
reduce task按照自己的分区号拉取各个 MapTask 机器上相应的结果分区数据，数据存到内存中，如果不够就存到硬盘中，然后归并排序， shuffle过程结束，进入reduce方法。

3.HDFS在写入过程中如何保证packet传输的一致性（提了块写完报告NN，数据队列和确认队列，宕机怎么办但都不是面试官要的貌似是每个packet传输完如何确认，跟谁报告，怎么报告要回去翻下权威手册了）

4.基于yarn集群的任务提交过程

5.MapReduce的流程，其中有几次排序

最少：map快排、归并、reduce归并三次

6.介绍下hdfs读写过程（比较关键的能体现出深度的点，写数据时客户端维护发送数据的发送队列、确认队列、容错处理、管道处理，读数据获取分块的地址并按拓扑排序距离返回、读的透明性）

读

客户端向namenode请求下载文件
namenode获取第一块block的locations，同一个block有多个副本，按拓扑排序（远近），离客户端最近的排在前面
客户端会按照locations排序与对应的datanode连接，向datanode请求读数据
datanode向客户端传输数据
读完第一块，关闭datanode连接，重复，直到读完所有block，这些操作对客户端来说是透明的（也就是用户不需要知道下面都做了什么），客户端的角度看来只是读一个持续不断的流。
客户端组装所有block

写

客户端向namenode发送请求
namenode检查文件路径是否存在、是否重名、权限等
namenode向客户端相应可以发送
10.客户端把文件切块，块即packet（64k），写到发送队列data queue中，并询问namenode该写在哪
namenode查询datenode信息，规划block存储位置
namenode返回可以存储的ip列表，即pipeline管道
客户端向管道第一个发送数据，第一个向第二个发送数据，以此类推。
容错机制：还有一个确认队列ack queue，也是由packet构成，等到所有pipeline中所有的datanode都表示已经收到的时候，ack queue才会删除对应的packet。当某个datanode发生错误的时候，采用以下几步：
1. pipeline 被关闭掉；
2. 为了防止丢包 ack queue 里的 packet 会同步到 data queue 里；
3. 把产生错误的 datanode 上当前在写但未完成的 block 删掉；
1. block 剩下的部分被写到剩下的两个正常的 datanode 中；
2. namenode 找到另外的 datanode 去创建这个块的复制（也是三个的）。
  当然，这些操作对客户端来说是无感知的（透明性）。
关闭写入流

7.知道historyserver吗，有什么作用，处了能记录历史记录尼，它对保留的历史数据的清除策略是怎样的

8.mr、sparkshuffle区别（mr默认排序，spark不一定排序具体看编写时的场景，这里问蛮多，可以引导到spark join底层几种方式，也涉及到排序或者hash跟shuffle时的策略有关系）

9.reduce怎么知道去哪里拉去map结果集

map任务结束后通知MapReduceApplicationMaster，reduce定期向MRAM询问map输出与主机的对应关系。直到获得所有输出位置。

10.MapReduce为什么要排序？

shuffle排序，按字典顺序排序的，目的是把相同的的key可以提前一步放到一起。

shuffle就是把key相同的东西放到一起去，其实不用sort(排序)也能shuffle，那为什么要sort排序呢？

sort是为了通过外排(外部排序)降低内存的使用量：因为reduce阶段需要分组，将key相同的放在一起进行规约，使用了两种算法：hashmap和sort，如果在reduce阶段sort排序(内部排序)，太消耗内存，而map阶段的输出是要溢写到磁盘的，在磁盘中外排可以对任意数据量分组(只要磁盘够大)，所以，map端排序(shuffle阶段)，是为了减轻reduce端排序的压力。

hive

数据倾斜，小文件，优化，hql->mr，四个排序

1.order by和sort by的区别

全局排序，分组排序

2.sort by 和 order by分别是在哪个阶段排序

sort by ：reduce前

3.写hive遇到什么问题

4.大表 join 大表数据倾斜怎么办？

a表加随机数，b表扩容，聚合

5.HQL怎样编码成MR（各个流程，详细描述）

sql->AST->query block->operator tree->优化->mr任务树->优化->提交

hiveSQL被parser（解析）成AST（抽象语法树）
AST转化成query block（查询块）
query block被转化成operator tree（操作树）
优化operator tree
operator tree转化成mr任务
优化成最终的mr任务

6.hive调优

mapjoin
行列过滤
列式存储
分区
设置map、reduce个数
小文件：jvm重用、combiner、marge
开启combiner
压缩
换引擎

7.hive使用spark做计算引擎时 sql语句的转换过程和mr做计算引擎的区别（答的很不理想前面说了hivesql转换为mr的过程面试第一次遇到这个问题一下子就蒙了八股文的下场）

8.面对特别大的数据量hive怎么去做优化处理

9.udf是怎么在hvie里执行的（打包成jar上传到集群，注册自定义函数，通过类加载器载入系统，在sql解析的过程中去调用函数）

10.编写特别复杂的sql有没有什么好的解决方法（udf）

11.hive 和 spark sql、spark on hive的区别

12.小文件优化

开启combiner
jvm重用
两个mr（marge）

13.hive数据倾斜

1、数据倾斜的原因：
（1）、key分布不均匀。
（2）、业务数据本身的原因。
（3）、建表考虑不周。
（4）、某些SQL本身就有数据倾斜。

2、如何避免数据的倾斜：

（1）给key一个随机的值，打散key。

（2）Hive中的参数调节：
①hive.map.aggr = true---------------作用Map 端部分聚合，相当于Combiner
②hive.groupby.skewindata=true
有数据倾斜的时候进行负载均衡，当选项设定为 true，生成的查询计划会有两个 MR Job。第一个 MR Job 中，Map 的输出结果集合会随机分布到 Reduce 中，每个 Reduce 做部分聚合操作，并输出结果，这样处理的结果是相同的 Group By Key 有可能被分发到不同的 Reduce 中，从而达到负载均衡的目的；第二个 MR Job 再根据预处理的数据结果按照 Group By Key 分布到 Reduce 中（这个过程可以保证相同的 Group By Key 被分布到同一个 Reduce 中），最后完成最终的聚合操作。

（3）SQL语句的调节：1、选用join key分布最均匀的表作为驱动表。2、大小表join的时候，让维度较小的表先进内存。3、大表join的时候，把空值的key变成一个字符串加上一个随机数，把倾斜的数据分到不同的reduce上。4、count distinct大量相同特殊值。

14.hive 四种文件类型和压缩情况

TEXTFILE,
Hive数据表的默认格式，存储方式：行存储。
可以使用Gzip压缩算法，但压缩后的文件不支持split
在反序列化过程中，必须逐个字符判断是不是分隔符和行结束符，因此反序列化开销会比SequenceFile高几十倍。
SEQUENCEFILE
压缩数据文件可以节省磁盘空间，但Hadoop中有些原生压缩文件的缺点之一就是不支持分割。支持分割的文件可以并行的有多个mapper程序处理大数据文件，大多数文件不支持可分割是因为这些文件只能从头开始读。Sequence File是可分割的文件格式，支持Hadoop的block级压缩。
Hadoop API提供的一种二进制文件，以key-value的形式序列化到文件中。存储方式：行存储。
sequencefile支持三种压缩选择：NONE，RECORD，BLOCK。Record压缩率低，RECORD是默认选项，通常BLOCK会带来较RECORD更好的压缩性能。
优势是文件和hadoop api中的MapFile是相互兼容的
RCFILE
存储方式：数据按行分块，每块按列存储。结合了行存储和列存储的优点：
RCFile 保证同一行的数据位于同一节点，因此元组重构的开销很低
像列存储一样，RCFile 能够利用列维度的数据压缩，并且能跳过不必要的列读取
数据追加：RCFile不支持任意方式的数据写操作，仅提供一种追加接口，这是因为底层的 HDFS当前仅仅支持数据追加写文件尾部。
行组大小：行组变大有助于提高数据压缩的效率，但是可能会损害数据的读取性能，因为这样增加了 Lazy 解压性能的消耗。而且行组变大会占用更多的内存，这会影响并发执行的其他MR作业。考虑到存储空间和查询效率两个方面，Facebook 选择 4MB 作为默认的行组大小，当然也允许用户自行选择参数进行配置。
ORCFILE
存储方式：数据按行分块，每块按照列存储。
压缩快，快速列存取。效率比rcfile高，是rcfile的改良版本。

压缩工具对比

15.hive常用函数

一、常用日期函数

unix_timestamp:返回当前或指定时间的时间戳
select unix_timestamp();
select unix_timestamp(“2020-10-28”,‘yyyy-MM-dd’);
from_unixtime：将时间戳转为日期格式
select from_unixtime(1603843200);
current_date：当前日期
select current_date;
current_timestamp：当前的日期加时间
select current_timestamp;
to_date：抽取日期部分
select to_date(‘2020-10-28 12:12:12’);
year：获取年
select year(‘2020-10-28 12:12:12’);
month：获取月
select month(‘2020-10-28 12:12:12’);
day：获取日
select day(‘2020-10-28 12:12:12’);
hour：获取时
select hour(‘2020-10-28 12:13:14’);
minute：获取分
select minute(‘2020-10-28 12:13:14’);
second：获取秒
select second(‘2020-10-28 12:13:14’);
weekofyear：当前时间是一年中的第几周
select weekofyear(‘2020-10-28 12:12:12’);
dayofmonth：当前时间是一个月中的第几天
select dayofmonth(‘2020-10-28 12:12:12’);
months_between：两个日期间的月份
select months_between(‘2020-04-01’,‘2020-10-28’);
add_months：日期加减月
select add_months(‘2020-10-28’,-3);
datediff：两个日期相差的天数
select datediff(‘2020-11-04’,‘2020-10-28’);
date_add：日期加天数
select date_add(‘2020-10-28’,4);
date_sub：日期减天数
select date_sub(‘2020-10-28’,-4);
last_day：日期的当月的最后一天
select last_day(‘2020-02-30’);
date_format(): 格式化日期
select date_format(‘2020-10-28 12:12:12’,‘yyyy/MM/dd HH:mm:ss’);

二、常用取整函数
21. round：四舍五入
select round(3.14);
select round(3.54);

ceil：向上取整
select ceil(3.14);
select ceil(3.54);

floor：向下取整
23. select floor(3.14);
select floor(3.54);

三、常用字符串操作函数
24. upper：转大写
select upper(‘low’);

lower：转小写
select lower(‘low’);
length：长度
select length(“atguigu”);
trim：前后去空格
select trim(" atguigu ");
lpad：向左补齐，到指定长度
select lpad(‘atguigu’,9,‘g’);
rpad：向右补齐，到指定长度
select rpad(‘atguigu’,9,‘g’);
regexp_replace：使用正则表达式匹配目标字符串，匹配成功后替换！
SELECT regexp_replace(‘2020/10/25’, ‘/’, ‘-’);

四、集合操作
31. size：集合中元素的个数
select size(friends) from test3;

map_keys：返回map中的key
select map_keys(children) from test3;
map_values: 返回map中的value
select map_values(children) from test3;
array_contains: 判断array中是否包含某个元素
select array_contains(friends,‘bingbing’) from test3;
sort_array：将array中的元素排序
select sort_array(friends) from test3;

五、多维分析
36. grouping sets:多维分析

16.hive的复杂数据类型

Array，Map,Struct

spark

0.rdd算子

1.spark运行流程

2.rdd宽窄依赖

3.spark在rdd转换时如何确认数据块的来源（答分RDD由不同分区组成，每个分区对应一4.个数据块，通过分区索引区分数据块。但好像不太满意）

5.Spark的优点是什么

6.spark提交过程

7.spark和hive的联系

8.groupbykey、reducebykey区别（1、groupByKey算子的功能固定，只能输出相同key值的序列，reduceByKey适用于分组排序过程中有数据聚合操作（sum）的情形，在其他场景下可能不适用。

9.reduceByKey算子在分区内会进行数据聚合操作，因此针对有sum的数据聚合操作,效率会更高一些。（groupByKey算子也能实现类似sum的数据聚合操作，相当于进行groupByKey操作后还需进行map类算子的sum操作）

10.spark sql怎么转换成java

11.spark SQL的优化

12.spark资源调度任务调度

13.hive构建数据仓库为什么要使用spark引擎

14.Spark运行架构、优化

15.flink和spark的区别

16.spark广播变量

17.sparkstreaming微批处理会吗

18.提升spark运行效率的方法

19.spark stage划分

20.Flink和Sparkstreanming区别

21.Spark运行过程

22.你们集群多大，spark中怎么给资源的，还有就是你们给资源是根据啥的

23.spark怎么查看数据是倾斜的

24.说说你对spark的理解

25.Hive on spark与SparkSql的区别

26.SparkStreaming和flink有什么区别；

27.Kafka和ZK的关系，Kafka元数据还能存哪

28.spark跑批和hive跑批处理问题的时候有什么不一样吗

29.spark的任务流程调度

30.spark相关的算子

java

1.Java面向对象三大特性

封装：属性方法私有化
继承：相同的属性方法提取出来
多态：同一个对象，在不同时刻表现出来的不同状态。

2.什么时候用多态

多态
(1)同一个对象，在不同时刻表现出来的不同状态。
(2)前提：
A:有继承或者实现关系。
B:有方法的重写。
C:有父类(接口)的引用指向子类对象。
(3)多态中的成员使用特点：
Fu fz = new Zi();
多态时，所有表现形式都是父类的表现形式，
只有调用方法时，运行的是子类重写的方法
A:成员变量
编译看左边，运行看左边。
B:成员方法
编译看左边，运行看右边。
(4)多态中的转型：
A:向上转型
把子类对象赋值给父类(接口)的引用
B:向下转型
把父类(接口)的引用强制转换成子类对象
(5)多态的好处及弊端：
A:好处
提高了程序可维护性和可扩展性。
B:弊端
不能使用子类特有内容。
要想使用，要么向下转型，要么重新创建子类对象。
instanceof 关键字:用于引用数据类型判断
格式：对象名 instanceof 类名
返回值： true, false
作用：判断某个对象是否属于某种数据类型

多态的例子

String.valueOf()可以将对象转化为字符串，它的入参是Object，设想一下，如果没有多态，那么String.valueOf()函数内部就需要判断入参Object对象到底是Integer，还是HashMap，还是Thread，还是用户自定义类等等，然后调用对应类的toString()，这显然十分麻烦，而这个问题用多态就可以解决，因为所有类都默认继承了Object类，所以只需要一句obj.toString()就可以，无需关心入参到底是Object的哪个子类，在运行时用户传入对象后jvm会判断到底该调用哪个类的toString()方法。

3.Java中的反射

4.Java集合的框架体系图

5.Hashmap和Treemap的区别

HashMap的底层结构是Node的数组
TreeMap的底层是一个Entry，他的实现是一个红黑树，方便用来遍历和搜索。

hashmap不排序
treemap排序

HashMap可以允许一个null key和多个null value。
TreeMap不允许null key，但是可以允许多个null value。

HashMap的底层是Array，所以HashMap在添加，查找，删除等方法上面速度会非常快。TreeMap的底层是一个Tree结构，在添加和删除节点的时候会进行重排序，所以速度会比较慢。

HashMap因为要保存一个Array，所以会造成空间的浪费，
TreeMap只保存要保持的节点，所以占用的空间比较小。

HashMap如果出现hash冲突的话，效率会变差，不过在java 8进行TreeNode转换之后，效率有很大的提升。

6.哈希表

7.jvm内存模型

8.如果打破双亲委派机制，加载了不同系统同名的类会出现什么问题

9.双亲委派机制

10.创建类的几种方式，他们的区别

11.java遇到过内存溢出吗，怎么解决的。给他扯到跑spark遇到过，driver、executor、堆内堆外内存调优

12.使用线程池有什么好处

13.有几种创建线程池的方法

14.有两个包名、类名相同的类能不能正确加载会出现哪些问题（编写自定义类加载器来实现）

15.final关键字

16.String能不能被继承

17.Java中抽象类和接口的区别

抽象类（抽象类就是为了被继承）：抽象类中的抽象方法必须定义为protected或者public，因为如果我们将其定义为私有的话，就无法被子类继承（其实也不是不好继承，而是不好调用）；抽象类中的抽象方法如果没有在某一个子类中实现，那这个子类也要声明为抽象类；抽象类是不可以实例化的；一个类只能继承一个抽象类
接口（为了方法而生）：接口中可以有变量和方法，但是接口中的变量是被强制置为public static final 的，并且只能为该类型；接口中的方法，能且只能是public abstract方法，而且对于接口中的方法都不能有具体实现；一个列可以多继承接口

oom

类加载机制

关于java面试题，请看https://www.bilibili.com/video/BV12b4y167Mb

数据结构和算法

1.动态规划原理

2.时间复杂度为nlog(n)的排序方法有哪些

快排、归并、堆

3.快排原理

常见sql题

计算机网络、数据库理论

其他

1.flume和kafka是怎么配置的

2.kafka在什么地方需要用到zookeeper

kafka 使用 zookeeper 管理和协调 kafka 的节点服务器。zookeeper中存储的信息有broker，consumer等重要znode信息；kafka节点broker的选举也是通过zookeeper来实现，主要流程是在zookeeper创建/controller临时节点来实现leader选举，并在该节点中写入当前broker的信息，利用Zookeeper的强一致性特性，一个节点只能被一个客户端创建成功，创建成功的broker即为leader，即先到先得原则，leader也就是集群中的controller，负责集群中所有大小事务

反问

喜提一等奖！白鲸开源在“创业北京”创业创新大赛海淀区选拔赛决赛表现亮眼 DolphinScheduler社区大数据
6月25日，第七届“创业北京”创业创新大赛海淀区选拔赛决赛在中关村东升国际科学园成功举办。本次活动由海淀区人力资源和社会保障局、中关村科学城管委会主办，以“创响新时代共圆中国梦”为主题，活动现场主体赛先进制造赛道和主体赛现代服务赛道共20个晋级决赛的项目进行了现场路演，共同角逐各赛道一、二、三等奖及优秀奖，评审专家、创投机构及创业创新项目等80余人现场参与。本次晋级决赛的项目中有赋能能源行业发展的
2025年渗透测试面试题总结-字某某动-安全研究实习生（二面）（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全网络安全红蓝攻防护网
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录字某某动-安全研究实习生（二面）1.护网行动中的核心工作2.防护层级选择（WAF/IDS）3.误报治理方案4.内网误报分布场景5.MySQL执行PowerShell防护6.资产收集经验7.漏洞攻击案例8.SQL注入攻防详解原理防御方案OrderBy防御特殊字符处理9.
ShardingSphere 和 Spring 的动态数据源切换机制的对比以及原理龙大. 系统设计 Spring Mysql spring java 数据库
ShardingSphere与Spring动态数据源切换机制的对比及原理一、核心定位对比维度ShardingSphereSpring动态数据源（如AbstractRoutingDataSource）定位分布式数据库中间件轻量级多数据源路由工具核心目标分库分表、读写分离、分布式事务多数据源动态切换适用场景大数据量、高并发、复杂分片需求简单多数据源隔离（如多租户、环境隔离）实现层级JDBC驱动层（拦截
C++学习(十三)(构建系统,CMAKE) solomonzw 大数据数据库
构建系统是一组工具和实用程序，用于自动执行项目中的源代码文件的编译、链接和执行过程。构建系统的主要目标是管理编译过程的复杂性，并最终生成构建（可执行文件或二进制文件）。在C++（cpp）中，一些常见的构建系统包括：GNUMake：这是一个流行的构建系统，用于定义构建过程。它检查源文件的依赖关系和时间戳，以确定需要编译和链接哪些文件。Makefile代码示例：#MakefileCXX=g++CPPF
项目--高并发CPP项目，低配版本 Bruce Jue C++项目案例实现 c++
项目亮点利用CAS，实现了对于空闲列表的无锁操作；但是内存分配还是要锁的内存对齐，减少内存读取数据的访问量HashBucket哈希桶MemoryPool是内存池
FFmpeg 4.3 音视频-多路H265监控录放C++开发十三：将AVFrame转换成AVPacket。视频编码原理.编码相关api，H264特殊参数说明 hunandede FFmpeg4.3 ffmpeg 音视频 c++
前提：从前面的学习我们知道AVFrame中是最原始的视频数据，这一节开始我们需要将这个最原始的视频数据压缩成AVPacket数据，我们前面，将YUV数据或者RGBA数据装进入了AVFrame里面，并且在SDL中显示。也就是说：对于安防项目来说，我们将原始从摄像头数据(YUV,RGB)转换成AVFrame后，可以直接显示出来。但是如果我们将要数据存储，则要将AVFrame转成AVPacket.视频编
Go语言学习路线沉默的八哥运维 golang 学习 java
以下是一个较为系统的Go语言学习路线：一、基础阶段环境搭建与工具链熟悉安装Go语言开发环境。在Go官方网站（https://golang.org/dl/）下载适合您操作系统的安装包并完成安装。配置Go环境变量，如GOPATH和GOROOT。GOROOT是Go语言的安装目录，GOPATH是工作空间目录，用于存放Go项目的源代码、编译后的二进制文件和依赖包等。学习使用Go命令行工具，如gobuild（
C++ 学生成绩管理系统非德77 c++算法开发语言
一、项目背景与核心需求成绩管理系统是高校教学管理的重要工具，本系统采用C++面向对象编程实现，主要功能模块包括：学生信息管理（学号/姓名/3门课程成绩）成绩增删改查(CRUD)操作数据持久化存储统计分析与报表生成用户友好交互界面二、系统架构设计1.类结构设计采用经典的MVC分层思想：示意图如下：┌──────────────┐┌──────────────┐│Student││ScoreSyste
解决方案｜回归医院运营管理本质，从建立指标体系出发机器学习人工智能
医疗行业一直是一个备受关注的领域，尤其在当前全球卫生挑战背景下更是备受瞩目。随着数字化技术和大数据应用的不断深入，医疗行业正在经历一次前所未有的变革和转型。在2023年的两会上，大数据和数字化技术将再次成为热点议题，这意味着政府将会更加关注并支持医疗行业数据转型。在这个背景下，我们需要思考如何充分利用数字化技术和大数据，为医疗行业的发展注入新的活力，并为人类的健康保障提供更好的保障。最近几年，随着
selenium用例执行过程采集操作形成测试报告上的回复进阶的DW selenium 测试工具
在代码执行的过程中不断的进行截图，把截图拼接成gif动态图，放在测试报告上1、每条用例执行启动一个线程，这个线程会每隔0.3秒进行截图项目下创建一个临时目录video用来存储所有截图以及gif动态图封装不断截图的方法，每隔0.3秒进行截图#封装一个普通函数，实现每隔0.3秒截图#dr代表核心操作对象#worker_id代表当前进程id，主要是用来在多进程并发时区分不同进程下的截图defshot(d
基于微信/抖音的小程序源码打包下载（技术开发说明文档+代码编译架构）小程序微信小程序
随着移动互联网的蓬勃发展，小程序作为一种轻量级的应用形式，凭借其无需安装、即用即走的特点，迅速占领了市场的一席之地。对于开发者而言，掌握小程序的开发与搭建技能已成为必备技能之一。本文将深入探讨小程序源码开发搭建的全过程，从环境准备、项目初始化、代码编写、功能实现到调试发布，并辅以实际代码示例，帮助读者从零开始构建自己的小程序。源码：y.wxlbyx.icu一、开发环境准备1.1注册小程序账号在开始
Pytest自动化框架搭建柯有Q pytest 自动化 python 运维
背景入职了一家小公司，需要从0开始搭建一个自动化测试环境，因为是测试板卡项目，所以需要使用串口连接工具pyserial，测试用例批量化执行工具pytest，测试报告自动生成工具allure，大家根据这三个关键词选择是否需要继续阅读1.技术实现1.1技术说明使用pyserial作为串口连接工具，发送读写命令；使用pytest作为用例批量管理工具；使用allure对测试结果进行可视化处理，自动生成测试
深入C++编程：从基础到实践水坑儿
本文还有配套的精品资源，点击获取简介：C++是一种多范式编程语言，具有高效性、灵活性和广泛的应用范围，适用于系统软件、游戏开发等多个领域。本教程涵盖C++的核心概念，包括基础语法、面向对象编程、封装、继承、多态性、模板、异常处理、STL以及C++11和后续版本的新特性。通过从基础语法到内存管理的详细介绍，引导读者掌握C++编程技能，并通过实践项目和学习最新标准来提升编程水平。1.C++语言概述与历
老榕树的Java专题：如何连接达梦数据库到idea 程序员_老榕树树哥java专题：从0到1 java 数据库 intellij-idea
安装达梦数据库JDBC驱动下载驱动：首先需要从达梦官方网站下载适用于Java的JDBC驱动程序（一般是一个JAR文件，文件名类似dm-jdbc-driver.jar），确保下载的版本与你要连接的DM数据库版本相匹配。添加驱动到项目：在IDEA中，可以通过以下几种方式添加驱动到项目依赖中：项目结构配置：点击“File”->“ProjectStructure”->“Libraries”，在“Libra
RV1126采集VI视频数据流学习嵌入式的小羊~ 音视频 linux 运维
这节分享一下通过rkmedia的api获取RV1126的VI视频流，但是具体的已经在第一个推流项目已经说了。这里更多是回顾一下这部分的api。采集vi数据实现VI_CHN_ATTR_S，视频采集的VI模块。intmain(){intret;VI_CHN_ATTR_Svi;vi.pcVideoNode=CAMERA_PAHT;//videonodevi.u32Width=1920;//宽度vi.u3
如何将本地项目提交到 GitHub Ann_R github
目录1、首先在GitHub上创建一个新的仓库：2、在本地项目中初始化Git：3、添加远程仓库并推送：4、如果你想忽略某些文件不提交，创建.gitignore文件：5、如果遇到推送失败，可能需要：6、常用的Git命令：7、如果想将现有的远程仓库克隆到本地：1、首先在GitHub上创建一个新的仓库：1.登录GitHub2.点击右上角"+"号3.选择"Newrepository"4.填写仓库名称5.不要
基于 skynet 的 MMO 服务器设计嘎嘎嘎498451 服务器
最近，我们的合作方陌陌带了他们的一个CP到我们公司咨询一下skynet做mmo游戏项目中遇到的一些问题。因为他们即将上线一款MMO，在压力测试环节暴露了许多问题。虽然经过我们的分析，有很多问题出在他们的压力测试程序本身编写的bug，但同时也暴露出服务器的设计问题。核心问题是，他们在实现mmo服务器时，虽然使用了skynet框架，但却把所有的业务逻辑都放在了同一个lua服务中，也就是一切都运行在一个
实际springboot项目中如何注意jvm调优种豆走天下 spring boot jvm 后端
在SpringBoot项目中进行JVM调优是一个重要的任务，可以帮助提高应用程序的性能和稳定性。JVM调优可以涵盖内存管理、垃圾回收、线程管理以及其他JVM配置等多个方面。以下是一些常见的JVM调优策略，适用于SpringBoot应用：1.内存配置JVM的内存管理是影响SpringBoot应用性能的关键因素之一。你可以通过调整堆内存和非堆内存的大小来优化应用的性能。a.堆内存大小(-Xms和-Xm
完整的Devops流程河越柯衍 devops
完整的Devops流程Tips：Jenkins是开源的CI&CD工具，提供超过1000个插件来支持构建、部署、自动化，满足任何项目的需要。完整的Devops流程：开发提交代码到代码仓库gitlab>>Jenkins检测到代码更新>>调用k8sapi在k8s中创建Jenkinsslavepod>>Jenkinsslavepod拉取代码>>通过maven把拉取的代码进行构建成war包或者jar包>>上
蓝牙协议栈BlueZ：Linux下的无线通信利器 /Linux 谢璋声Shirley
蓝牙协议栈BlueZ：Linux下的无线通信利器/LinuxbluezMyblueztree.项目地址:https://gitcode.com/gh_mirrors/bl/bluez项目基础介绍与编程语言BlueZ是一个专为Linux系统设计的蓝牙协议栈，自2000年起，由Qualcomm、MarcelHoltmann等贡献者持续维护与发展。此项目采用C作为主要编程语言，并辅以少量的Python代
BlueZ - Linux平台上的蓝牙协议栈邓越浪Henry
BlueZ-Linux平台上的蓝牙协议栈bluezMainBlueZtree项目地址:https://gitcode.com/gh_mirrors/blu/bluezBlueZ是一个开源项目，旨在为Linux平台提供蓝牙协议栈。该项目主要由C语言编写，是Linux系统中实现蓝牙功能的基石。1.项目基础介绍及主要编程语言BlueZ项目托管于GitHub上，源代码仓库地址为：https://githu
探秘BlueZ：Linux平台的蓝牙协议栈司莹嫣Maude
探秘BlueZ：Linux平台的蓝牙协议栈bluezMainBlueZtree项目地址:https://gitcode.com/gh_mirrors/blu/bluezBlueZ是一个强大的开源项目，为Linux提供了全面的蓝牙协议栈支持，由QualcommIncorporated和MarcelHoltmann等开发人员精心打造。它不仅提供了基础的蓝牙功能，还包括了对嵌入式系统和最新蓝牙Mesh的
java中存储金额字段 fengdongnan java 金融精度运算 BigDemical
java中存储金额字段商场或者电商项目中会涉及到金额字段的存储,本文来讨论下选择最多的BigDecimal保证精度的原理以及其他字段类型替换方案BigDemicalBigDecimal是处理高精度数值计算的核心类，底层实现通过整数未缩放值和标度的组合来保证精确的十进制数值表示。底层数据结构BigDecimal的数值由两个关键部分组成：未缩放值（unscaledValue）类型为BigInteger
大白话聊聊：DevOps 程序员-洋哥 devops 运维
有小伙伴后台私信我聊下DevOps，网上文章很多，今天我结合软件开发周期聊一下DevOps的流程。DevOps并不是什么神秘的黑科技，而是一种理念和方法论，通过优化流程、提升自动化水平，让开发和运维团队能够更紧密地合作，共同推动项目的成功。首先，我们要明确DevOps的核心目标：快速、可靠地交付高质量的软件。为了实现这个目标，我们需要关注整个软件开发生命周期中的各个环节，并对其进行优化和整合。一、
【Python】【Conda 】Conda 与 venv 虚拟环境优缺点全解：如何做出明智选择丶2136 python #conda python conda 虚拟环境
目录引言一、基本概念1.1Conda虚拟环境1.2Pythonvenv虚拟环境二、主要区别对比三、优缺点分析3.1Conda虚拟环境的优缺点3.2Pythonvenv虚拟环境的优缺点四、使用场景推荐4.1使用Conda虚拟环境的场景4.2使用Pythonvenv虚拟环境的场景五、虚拟环境管理工具对比图总结引言在开发Python项目时，使用虚拟环境可以隔离不同项目之间的依赖，避免包版本冲突。Pyth
帆软认证BI工程师（FCBA）部分考试题目及答案隼丶帆软 FineBi
判断题1.安装32位系统的FineBI，最多只能支持2G内存。正确2.FineBI产品目前不支持vertical大数据平台。错误3.FineBI可以和FineReport两款产品进行整合使用。正确4.同一个仪表板中，可以同时使用实时和抽取数据进行分析。正确5.血缘分析可以让用户查看该表的来源表和子孙表/模板，当前用户创建的子孙表或模板不会灰化，但是非当前用户创建的子孙表或模板会灰化显示。正确6.F
【LVGL】windows模拟环境lvgl8.2本地图片读取配置张芬奇 windows
windows模拟环境lvgl8.2本地图片读取配置在win开发环境开发调试lv_conf.h相关配置项目中代码调用在win开发环境开发调试lv_conf.h相关配置/*APIforCreateFile,ReadFile,etc*/#defineLV_USE_FS_WIN321#ifLV_USE_FS_WIN32#defineLV_FS_WIN32_LETTER'D'/*Setanuppercas
详细解析Vue在history路由模式部署后刷新404问题 mr_cmx vue vue3 vue.js 前端 javascript
场景vue项目使用了history路由模式，且在本地时运行正常，但打包通过nginx部署后，刷新页面，出现了404错误先定位一下，HTTP404错误意味着链接指向的资源不存在问题在于为什么不存在？且为什么只有history模式下会出现这个问题？解析Vue是属于单页应用（single-pageapplication）而SPA是一种网络应用程序或网站的模型，所有用户交互是通过动态重写当前页面，前面我们
windows 10 python哪个版本的好-windows支持哪个版本的python weixin_37988176
Windows操作系统支持Python的Python2版本和Python3版本，下载安装时要根据windows的操作系统来选择对应的Python安装包，否则将不能安装成功。Python是跨平台的，免费开源的一门计算机编程语言。是一种面向对象的动态类型语言，最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。支持常见的主流平台，如A
NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道汀、人工智能 LLM工业级落地实践 prompt 人工智能大语言模型 NL2SQL Text2SQL AI大模型自然语言处理
NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理NL2SQL进阶
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$