hbxflihua

性能优化实战-1

系统优化大致可以分为：业务优化、设计和程序优化、DB和SYSTEM优化、SQL优化四个方面，这四个方面按优先级进行排列，并且越往后越不容易优化，他们之间又相辅相成、互相关联，我们优化的时候可以交替着去实施。下面着重分享一下我们在SQL优化和程序优化等方面的一些经验。

一、SQL优化

慢查询是大多数数据库问题的罪魁祸首，我们可以通过改善表结构设计、优化SQL语句、合理的使用索引等方面来最大限度的解决这个问题，下面我们一一进行讲解。

1、改善表结构设计

我们可以使用 PROCEDURE ANALYSE()对当前已有应用的表类型的判断，该函数可以对数据表中的列的数据类型提出优化建议，可以根据应用的实际情况酌情考虑是否实施优化。

SELECT * FROM tbl_name PROCEDURE ANALYSE();

PROCEDURE ANALYSE()是动态分析表数据得出的结果，分析需要一定的时间。分析结果展示了列名称、列的最小值、列的最大值、列最小值的长度、列最大值的长度、列中empty或0的行数，列中null的行数，平均值或者平均长度，给出的列的类型优化建议，从中我们可以看出哪些列适合哪种类型，以减少存储空间、提高查询效率。

2、 explain查询语句

(product)ifaes_test@localhost [ifaes_test]> explain select * from project where uuid='000002a1155c48f389ce85a64f0e2754';

+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------+

+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------+

+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------+

1 row in set (0.00 sec)

在日常工作中，我们会有时会开慢查询去记录一些执行时间比较久的SQL语句，找出这些SQL语句并不意味着完事了，这时我们常常用到explain这个命令来查看一个这些SQL语句的执行计划，查看该SQL语句有没有使用上了索引，有没有做全表扫描，这都可以通过explain命令来查看。

id SQL执行顺序的标识，相同的id表示为同一组。SQL执行顺序和ID有关，id值越大越先执行，相同的id按照从上往下的顺序执行。

select_type select子句的类型,用于标识和其他子句的关联关系，常见的如SIMPLE/PRIMARY/UNION等类型。

(1) SIMPLE(简单SELECT,不使用UNION或子查询等)

(2) PRIMARY(查询中若包含任何复杂的子部分,最外层的select被标记为PRIMARY)

(3) UNION(UNION中的第二个或后面的SELECT语句)

(4) DEPENDENT UNION(UNION中的第二个或后面的SELECT语句，取决于外面的查询)

(5) UNION RESULT(UNION的结果)

(6) SUBQUERY(子查询中的第一个SELECT)

(7) DEPENDENT SUBQUERY(子查询中的第一个SELECT，取决于外面的查询)

(8) DERIVED(派生表的SELECT, FROM子句的子查询)

table select子句是关于哪张表的，有时会有临时表出现。

type表示MySQL在表中找到所需行的方式，又称为“访问类型”。常用的类型有：const/eq_reg/ref/ range/ index / all。

const表示该表中最多有一条匹配的记录，出现在主键、唯一索引等查询语句中。

eq_reg对于每个来自前面的表的行组合，从该表中读取一行。即前表的行组合和当前SQL是一一对应的关系。

ref 前表的行组合和当前SQL是一对多的关系。

range使用索引来检索给定范围的行，key表示使用的索引名称。（<>、>、>=、<、<、<=、IS NULL、between、in等等）。

index 使用索引进行检索。

ALL 进行完整的表扫描，即全表扫描。

possible_keys 列指出MySQL能使用哪个索引在该表中找到行，方便我们合理利用索引来优化SQL语句。

key 列显示MySQL实际决定使用的键（索引）。如果没有选择索引，键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引，在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。

key_len 列显示MySQL决定使用的键长度。如果键是NULL，则长度为NULL。使用的索引的长度。在不损失精确性的情况下，长度越短越好。

ref 表示上述表的连接匹配条件，即哪些列或常量被用于查找索引列上的值

rows 列显示MySQL认为它执行查询时必须检查的行数。

3、合理的使用索引

首先要说明一点，合理的使用索引可以提高检索（查询）的效率，但是插入/更新/删除等操作时都需要对索引进行维护，所以索引并不是越多越好。

在用户红包表、用户加息券表中

user_redenvelope表有主键索引，tender_id的单列普通索引，user_id和status的联合索引，use_expire_time_status和status的联合索引。下面分别说说各索引的用处，主键索引这里就不详述了。

idx_user_redenvelope_tender_id 查询投资记录所使用的红包时使用;

idx_user_redenvelope_user_id_status 查询指定用户可用红包/不可用红包时使用

idx_user_redenvelope_use_expire_time_status 处理过期红包时使用，后面会讲到如何使用索引。

用户加息券表的索引和和用户红包表的索引差不多，这里就不赘述。

和用户一一对应的记录表：user_base_info、user_cache、user_identify、user_company_info、user_score、user_vip等添加user_id唯一索引；

投资记录表project_invest、待收记录表project_collection、待还记录表project_repayment对project_id列建立普通索引，产品表product、借贷表borrow对project_id列建立唯一索引。债权相关的表和投资相关表类似。

下面举一个索引使用不当的例子：

在user_cache表总创建了两个索引：uq_user_cache_user_id针对用户id的唯一索引和idx_user_cache_user_id_user_nature是将user_id和user_nature组合在一起的联合索引。上面的查询语句中，两个索引一个也没用到。

我们来考虑一下索引的有效性，uq_user_cache_user_id索引可以用来防重并且在多数查询时可以通过user_cache.user_id=xxx来使用唯一索引，提高查询效率。另一个就是idx_user_cache_user_id_user_nature，我们的期望是想通过和user的关联来查询某一类型的用户，但是事与愿违，所以该索引是无效的。那么我们怎么做？

1、删除idx_user_cache_user_id_user_nature索引；

2、在user表添加冗余字段user_nature，或者将user_nature列直接移至user表；

4、其他优化建议

a) 表关联查询时，能使用内连接（逗号分隔或者inner join）的尽量不使用外连接（left join or right join），能使用join的尽量不使用子查询；

查询投资记录，关联项目记录时使用内联

select * from project_invest i inner join project p on i.project_id= p.uuid ;

select * from project_invest i left join project p on i.project_id= p.uuid ;

查询没有进行过投资的注册用户，使用外联代替子查询：

select * from user where uuid not in (select user_id from project_invest );

select u.* from user u left join project_invest i on i.user_id = u.uuid and i.user_id is null;

b) 对于排重（或分组）的SQL，可以使用下面两种，推荐使用方案1

方案1：select distinct min,max from tbl;

方案2：select min, max from tbl group by min,max;

c) 索引使用最左匹配原则，在条件查询时，如果组合索引中的首列没有出现，mysql优化器将放弃使用索引。

如下的第三条语句MySQL优化器将放弃使用索引

select * from user_redenvelope where use_expire_time>='2017-01-04 23:59:59' and use_expire_time<='2017-01-13 00:00:00' and status='0';

select * from user_redenvelope where use_expire_time>='2017-01-04 23:59:59' and use_expire_time<='2017-01-13 00:00:00';

select * from user_redenvelope where status='0';

d) 散列分布不均的列不推荐使用索引，比如状态列、枚举类型的列等等；

e) 尽量避免select * 操作，从库里读取的数据越多查询越慢。

f) 固定长度的效率更高，尽可能的使用非空约束（通过表结构优化来进行处理）。

二、代码优化

1、缓存服务

对于访问频率比较高的或者不常更新的数据，我们可以考虑使用缓存服务，来提高系统的响应效率，减小数据库服务器的压力。比如前台首页、理财频道、投资详情页等页面。

首页的新手专享和精选投资列表缓存2s

/**

* 首页--新手专享投资列表

* @return

* @throws Exception

@RequestMapping(value="/index/getNoviceProject")

@ResponseBody

@Cacheable(expire=ExpireTime.TWO_SEC)

public Object getNoviceProject() throws Exception {

…

}

/**

* 首页--精选投资列表

* @return

* @throws Exception

@RequestMapping(value="/index/getChoiceProject")

@ResponseBody

@Cacheable(expire=ExpireTime.TWO_SEC)

public Object getChoiceProject() throws Exception {

….

}

理财频道缓存5s

/**

* 产品列表查询

* @author FangJun

@Cacheable(key = CacheConstant.KEY_PROJECT_LIST, expire = ExpireTime.FIVE_SEC)

public Page findProjectPage(ProjectRecord model) {

…

}

2、队列服务

对于优先级不是特别高的操作，可以考虑将其加入队列的方式进行处理。比如前台用户注册，注册成功以后不仅需要向user、user_cache、user_company_info(user_base_info)、user_identity、user_vip、user_score、user_invite等用户相关的表中添加记录，还需要在账户中心进行注册，根据活动方案的规则发放相应的红包、加息券等操作。活动方案相对用户信息和账户信息来说显得不是那么迫切，不需要即时入库，可以考虑将活动方案加入队列服务。活动方案加入队列服务之前，用户注册的并发量一直上不去。活动方案加入队列之后，用户注册的并发可以达到30TPS，用户注册的并发量有了显著的提升。

活动方案加入队列后带来了一个新的问题，就是假如后台配置的活动方案太多，队列服务又需要一个一个的进行处理，在高并发的情况下会出现大量的消息堆积。有时甚至两个小时的用户并发注册，队列服务跑一天都处理不完。

接着怎么办？拆服务

梳理活动方案的类别，将活动方案拆分成：注册送好礼--送红包、注册送好礼--送加息券、注册好友送好礼--送红包、注册好友送好礼--送加息券、注册 --送积分五个小类。然后分别如队列进行处理。

类似的，我们对调度任务的队列服务按放款、还款、项目撤销的类别进行了服务拆分。

private User addUserForRegister(final UserModel model){

//用户相关表持久化操作…

//活动方案入队列注册的时候拆分队列

MqActPlanModel redActModel = new MqActPlanModel(MqConstant.OPERATE_ACTPLAN_REGISTER_GIFT_REDPACKET, user,null,null);

RabbitUtils.actPlan(redActModel);

MqActPlanModel rateActModel = new MqActPlanModel(MqConstant.OPERATE_ACTPLAN_REGISTER_GIFT_RATECOUPON, user,null,null);

RabbitUtils.actPlan(rateActModel);

MqActPlanModel friendRedActModel = new MqActPlanModel(MqConstant.OPERATE_ACTPLAN_REGISTER_FRIEND_GIFT_REDPACKET, user,null,null);

RabbitUtils.actPlan(friendRedActModel);

MqActPlanModel friendRateActModel = new MqActPlanModel(MqConstant.OPERATE_ACTPLAN_REGISTER_FRIEND_GIFT_RATECOUPON, user,null,null);

RabbitUtils.actPlan(friendRateActModel);

MqActPlanModel scoreActModel = new MqActPlanModel(MqConstant.OPERATE_ACTPLAN_REGISTER_SCORE, user,null,null);

RabbitUtils.actPlan(scoreActModel);

returnuser;

}

3、单项持久化改为批量持久化

在前期的活动方案中，红包、加息券的发放是按用户和活动规则是一条条进行的，活动方案匹配成功后将红包（加息券）发放给用户，生成一条用户红包（加息券）记录和发放日志记录。跟踪队列服务发现在活动规则较多、用户注册并发量大的时候，队列的处理效率低的吓人。根据业务场景，我们将同一个用户的多个活动合并，批量持久化到数据库。在经过将队列服务拆分和单项操作改为批量操作后，活动方案的处理能力从0.2TPS提升到10-30TPS。

类似的，调度任务、账户中心等地也从原来的单条持久化改为批量持久化。

4、定时任务

程序员在处理定时任务的时候喜欢简单粗暴的方式，就像这样的：

#将红包标记为已过期

update user_redenvelope set status=#{status} where use_expire_time < now() and status=#{preStatus}

这个SQL语句在数据量不大的时候执行没有什么问题，一旦数据量上去之后就会卡死，甚至产生死锁。

那么怎么优化？我们先看看定时器里的方法

@Scheduled(cron = "0 */5 * * * ?")

publicvoid doCouponExpiredHandle() {

userRedenvelopeService.expiredHandle();// 红包过期处理

userRateCouponService.expiredHandle();// 加息券过期处理

}

上面的@Scheduled注解表示这是一个定时操作，cron表达式表明每五分钟执行一次。也就是说该方法会每五分钟执行一次，发现有过期的红包或者加息券就标记为已过期。

既然是每五分钟执行一次，那么我们查询的时间范围应该是可以继续缩小的，比如查询10分钟以内已经过了有效期但状态为未过期的记录。然后将状态标记为已过期并将结果分批次批量入库。

/**

* 红包过期处理

@Override

publicint expiredHandle() {

Date now = DateUtils.getNow();

List ids = dao.findExpireList(DateUtils.rollMinute(now, -10), now, OperateEnum.STATUS_NO_USE.getValue());

List list = new ArrayList<>(ids.size());

if(CollectionUtils.isNotEmpty(ids)){

for(String id:ids){

UserRedenvelope url = new UserRedenvelope();

url.setUuid(id);

url.setStatus(OperateEnum.STATUS_EXPIRED.getValue());

list.add(url);

}

//批量更新

List> splitList = ObjectUtils.splitList(list, 200);

for (List ls : splitList) {

dao.updateBatchStatus(ls);

}

return Constant.INT_ONE;

}

Mapper对应的SQL如下：

select uuid

from user_redenvelope

where use_expire_time between #{startTime} and #{endTime} and status=#{preStatus}

select>

update user_redenvelope set STATUS = #{item.status} where uuid = #{item.uuid}

foreach>

update>

我们总结一下：

查询一定时间范围内状态为未过期的红包记录；

将记录标记为已过期；

将红包记录分批次批量入库；

这里为了提高查询的效率，我们对use_expire_time和status创建了联合索引并且将范围查询由>=、<=调整为between and。

那么我们能不能直接将上面的查询语句调整为update语句呢？答案是：不推荐。对于数据量较大的平台，不建议直接批量更新，因为没办法确定更新记录的数量。数据量太大依然会卡死，甚至产生死锁。其他的定时操作也可以按照这样的步骤来进行优化。

另外一个优化点就是缩小事务的范围，定时任务多是批量操作。简单的定时操作通过一个update语句就能搞定，还有一些定时操作相对就复杂的多，涉及很多的业务处理，逻辑判断，而这些批量操作的数据之间又是相互隔离，互不影响的，比如订单超时处理、自动审核、自动下架等等。我们没有必要在这些定时任务的入口加上事务，只需要在处理单笔交易时加上事务支持即可。

//@Transactional(readOnly = false)//订单超时处理入口取消事务支持

publicvoid investTimeoutHandle() {

…

}

/**

* 投资超时处理，在单笔交易中添加事务支持

* @param invest

privatevoid itemInvestTimeoutHandle(OutTimeProjectInvest invest){

TransactionDefinition definition = new DefaultTransactionDefinition();

TransactionStatus ts = transactionManager.getTransaction(definition);

try {

//处理超时相关业务…

transactionManager.commit(ts);

} catch (Exception e) {

transactionManager.rollback(ts);

LOGGER.error(e.getMessage(),e);

throwe;

}

5、后台查询

根据多年的从业经验在关联查询这方面定了一个规则：后台的关联查询不得超过3张表。起初大家都不是很理解，总觉得规定这么死很难去实现产品经理或者客户的需求。众所周知，后台查询通常都会进行一些跨表的关联查询，有的时候为了满足业务需要甚至需要关联5、6张表进行查询，SQL语句写的那叫一个漂亮，能整几十甚至上百行。但是数据量一旦上去，就卡的不行不行的。那么我们怎么去做既能保证SQL高效，还能保证能够实现产品经理或者客户的需求呢？

经验一：尽量将多表改为单表查询；

拿菜单【用户积分】举例，以下为【用户积分】列表页面的截图：

我们可以看到用户积分列表页展示了用户名、总积分、有效积分、冻结积分和消费积分等信息。列表中除了用户名是user表的属性外，其他列的信息都来自user_vip表。假设我们通过将user和user_vip的关联调整为单表查询，我们该以哪张表为主进行查询呢？

方案一：分页查询以user_vip为主表，在service层通过user_vip的user_id查询出user表的用户名；

方案二：分页查询以user为主表，在service层通过user的uuid查询user_vip的相关信息；

貌似这两种方案都行的通，但是细看页面我们发现搜索框是支持根据用户名进行模糊查询的，所以方案一被否决，方案二胜出。

这个问题貌似难度不够高，假设用户提出要求，我们需要按照用户名、总积分、有效积分、冻结积分和消费积分等信息进行检索或者排序，那方案二显然不能满足需求，怎么办？

经验二：适当的时候可以考虑添加冗余字段；

接着上面的问题，测试环境的用户量已经超过一百万，关联查询显然已经不合适，那么我们就可以考虑在user_vip表中将user表的用户名列冗余添加到user_vip表中。这个例子可能不够好，我们举个相对比较恰当的例子吧。

对project（产品+借贷）做了分类，我们在前台的理财频道中需要用到项目的类别名称，通过关联查询project_type表确实是一个方案，但是不够好。我们可以考虑在project表中添加类别名称列的冗余来取消对project_type表的关联查询。

经验三：通过添加索引提高查询效率；

表的数据量过大时，我们还可以采取通过添加索引的方式来提高查询效率，这里我就不展开讲解了。当然其他的优化方案在这里也可以派上用场。

6、 Excel导出

Excel大批量数据导出一直是我们系统的弱项，2.0里导出操作的数据量超过一万就会卡死。我们先看看excel导出经过了哪几个步骤：

1) 从数据库中查询出符合条件的记录；

2) 对记录中的数据进行加工处理，如将状态、枚举等类型转为可描述的信息等；

3) 将记录写入到文件或输出流中；

我们看到纵向操作很难去优化，那么我们分析一下数据量超过一万条就卡死的原因是什么，是在那一步产生的？

通过跟踪服务器的相关指标（线程、CPU、内存、相关服务），我们发现在做导出操作的时候，服务器的CPU和内存都飙升的很高。那么我们能不能通过调节JVM的相关参数来避免导出的时候出现卡死的现象呢？答案是：不推荐。

我们通过excel导出的步骤可以推测：导出卡死主要是因为数据量太大，导致jvm的内存爆表。那么如何优化呢？

我们在查询的时候模仿后台列表页面的分页操作，在导出的第一步将一次查询改为分页查询，每次最多读取5000条记录（每页导出的记录数根据实际情况来定）。目前我们已经做到可以支持百万级的数据导出，而不会出现卡死的现象。

除此之外，我们还做了什么？

我们发现，一般而言，导出的列都是和页面展示的列对应的，在后台通过硬编码来决定导出的列确实是一件吃力不讨好的事情，我们对需要导出的列做了封装，页面展示哪些列，导出就是哪些列，不需要在后台进行硬编码。

另外一个问题是让人头疼的状态、枚举等列在导出时的转换问题，我们定义了@DictType的注解，在代码里将繁琐的状态、枚举等类型的信息转换全部去除。

查看图片附件

你可能感兴趣的:(java,性能优化)

java中校验手机号码的正则表达式尼采呀 java 正则表达式开发语言
一.匹配说明：正则表达式是描述字符串内容格式，使用它来匹配一个字符串的内容是否符合要求1.[]:表示一个字符,该字符可以是[]中指定的内容例如:[abc]:这个字符可以是a或b或c[a-z]:表示任意一个小写字母[a-zA-Z]:表示任意一个字母[a-zA-Z0-9_]:表示任意一个数字字母下划线[^abc]:该字符只要不是a或b或c预定义字符:.:表示任意一个字符,没有范围限制\d:表示任意一个
回溯法--力扣第17题“电话号码的字母组合”(java) 27xixi 数据结构与算法 leetcode java 算法
力扣第17题“电话号码的字母组合”回溯法（DFS）回溯法通过递归遍历每个数字对应的字母，生成所有可能的组合。核心思想是构建搜索树，每次选择一个字母后进入下一层递归，回溯时撤销选择以尝试其他分支。实现步骤：构建数字到字母的映射表：使用数组或哈希表存储每个数字对应的字母。递归回溯：终止条件：当前路径长度等于输入数字字符串长度时，将结果加入列表。遍历当前数字对应的所有字母，依次选择、递归、撤销选择。Ja
Java突击小练习--利用正则表达式来简易的校验邮箱与手机号格式 CJH~ java 正则表达式 mysql
//校验邮箱publicclassTestEmail{publicstaticvoidmain(String[]args){Scannerinput=newScanner(System.in);//*号代表任意数量，放在0-9a-zA-Z后面，代表可以写任意数量的字母和数字//@是邮箱的符号，接在刚刚那串的后面//|代表或，也就是说@后可以跟着qq或163或sina中的任意字符串，代表哪家邮箱//
【Quarkus】通过Quarkus集成后端服务示例 Vesper63 Quarkus java 开发语言
说明：REST资源接口（AuthResource）。REST资源实现类（AuthResourceImpl）。服务接口（AuthService）。服务实现类（AuthServiceImpl）。配置文件（application.properties）。测试类（AuthResourceTest）。1.项目结构my-quarkus-app/├──src/│├──main/││├──java/│││└──c
Groovy语言的漏洞扫描花韵婷包罗万象 golang 开发语言后端
Groovy语言漏洞扫描：深入分析与实践引言Groovy是一种基于Java虚拟机（JVM）的动态编程语言，它结合了Python、Ruby和Smalltalk等语言的特性，提供了简洁的语法和强大的功能。Groovy广泛应用于脚本编写、自动化测试、构建工具（如Gradle）以及Web开发等领域。然而，随着Groovy的广泛应用，其安全性问题也逐渐显现出来。本文将深入探讨Groovy语言中的常见漏洞类型
详解PriorityQueue 27xixi 算法数据结构 java
PriorityQueue是Java集合框架中的一个类，它实现了优先级队列的数据结构。优先级队列是一种特殊的队列，其中的元素按照优先级顺序出队，而不是按照插入顺序（FIFO）。默认情况下，PriorityQueue是一个最小堆，即优先级最小的元素最先出队。1.PriorityQueue的特点基于堆实现:PriorityQueue通常基于二叉堆（最小堆或最大堆）实现。无界队列:PriorityQue
Java集合进阶 27xixi java 开发语言
在Java中，集合框架（CollectionsFramework）是用于存储和操作一组对象的强大工具。它提供了多种接口和类，用于处理不同类型的集合（如列表、集合、队列、映射等）。1.Java集合框架概述Java集合框架主要包括以下接口和类：核心接口Collection:所有集合类的根接口。List:有序集合，允许重复元素（如ArrayList,LinkedList）。Set:无序集合，不允许重复元
java Stream API中的聚合操作 27xixi java java18
聚合操作是指对一组数据进行处理，最终生成一个单一的结果。在编程中，聚合操作通常用于对集合（如列表、数组等）中的元素进行统计、计算或汇总。常见的聚合操作包括求和、求平均值、查找最大值/最小值、计数等。在Java的StreamAPI中，聚合操作是通过终端操作（TerminalOperations）来实现的。以下是一些常见的聚合操作及其用法：1.求和（Sum）对集合中的元素进行求和。示例：求整数列表的和
N个utils(处理日期) 庖丁解java java
解释一下为什么会在java学习教程中放js的代码.1,最直接的肯定是我有时候会写js,而一些经典的逻辑,又不想新开前端文章,索性就放一起.2,java的面向对象太完善了,这也是我写文章的原因,导致写java代码很难学习到面向过程的编程思想,正好,原生js的代码,很大程度上写起来用的思维方式,很雷同面向过程的思考方式.算个补全,对写java代码,理解java代码,大有裨益.(这不是作者胡乱找补,写j
庖丁解java(一篇文章学java) 庖丁解java java 开发语言
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
Exception in thread “main“ java.lang.NoSuchMethodError: Awesome Baron java java vscode
在VScode中运行代码调试力扣程序报错：Exceptioninthread“main”java.lang.NoSuchMethodError:‘intSolution.subarraySum(int[],int)’attest_560.main(test_560.java:9)原因是因为在不同的.java程序中使用了同名的Solution类，导致编译器和运行时选择的类不一致。解决方案：只保留一个
Python 爬取大量数据如何并发抓取与性能优化 chusheng1840 Python 教程 python 性能优化开发语言
Python并发抓取与性能优化在进行网络爬虫开发时，爬取大量数据可能非常耗时。尤其是在处理许多网页或API请求时，逐个请求速度会非常慢。为了解决这个问题，我们可以通过并发抓取提高爬取效率。同时，通过性能优化来进一步减少耗时和资源占用，使爬虫更高效。本篇文章将带大家了解Python中常用的并发抓取方法，并介绍如何进行性能优化。1.并发抓取的基本概念并发抓取指的是同时发出多个请求的技术，而不是顺序地等
这些 JavaScript 编码习惯，让你最大程度提高你的项目可维护性！快乐非自愿 javascript 开发语言 ecmascript
前言：因为JavaScript语言是一门极其松散、极其自由的语言，这意味着我们可以随心所欲的操作它，这是他的优点，但同时也是它的缺点。在编码过程中，我们需要一种良好的规范或者习惯来保持应用程序的一致性和可维护性。而今天我们要说的就是，怎么在日常编码中通过一些的良好的编码习惯，从你编码的基础层面就能使得你的JavaScript代码可以更好维护。什么是可维护性？很多人学习前端，可能是从各种不同的渠道获
什么是mybatis？十二.413 mybatis java 数据库
目录一、mybatis框架介绍二、mybatis配置三、mybatis逆向工程三、userMapper.xml配置一、mybatis框架介绍1.1mybatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwareoundation迁移到了googlecode，并且改名为MyBatis。2013年11月迁移到Github。mybatis是一个基于Java的持久
基于asp.NET的病历管理系统 (源码+net+vue+部署文档+讲解等) qq_1406299528 计算机毕业设计 asp asp.net vue.js 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言程序资料获取一、项目技术二、项目内容和功能介绍三、核心代码数据库参考四、效果图五、资料获取前言博主介绍：✨全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师，专注于Java/Python/小程序app/深度学
什么是 MyBatis？有哪些优点和缺点？码农落落 java基础 mybatis java 数据库
什么是MyBatis？有哪些优点和缺点？MyBatis是一款基于Java的开源持久化框架，可以帮助开发者轻松地将SQL语句与Java对象映射起来，使业务逻辑与数据持久化分离，提高开发效率。MyBatis的主要优点和缺点如下：优点：1.简单易用：MyBatis对开发者提供了简单易用的API，无需编写繁琐的JDBC代码，降低了学习和使用成本。2.灵活性强：MyBatis比较灵活，支持多种配置方式，可以
MyBatis高级查询：一对多查询详解蓝天资源分享 mybatis tomcat java
MyBatis高级查询：一对多查询详解MyBatis是一个优秀的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码和手动设置参数以及获取结果集的工作。MyBatis可以使用简单的XML或注解用于配置和原始映射，将接口和Java的POJOs（PlainOldJavaObjects，普通的Java对象）映射成数据库中的记录。本文将深入探讨MyBatis中的
基于Asp.net的汽车租赁管理系统计算机学姐 Asp精选实战项目源码 asp.net 汽车后端 mysql sqlserver vue.js c#
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Asp.net的汽车租赁管理系统开发
提速 Java性能优化实战：6大技巧解锁丝滑体验墨瑾轩一起学学Java【一】java 性能优化开发语言
在Java应用程序性能优化的领域，有多种策略可以帮助提升程序运行效率和响应速度。以下是一些实用的技巧，涵盖代码层面、JVM调优、以及设计模式等方面，旨在全面优化应用性能。1.代码层面优化避免不必要的对象创建频繁的对象创建和销毁会占用大量的CPU时间和内存资源。尽量重用对象，特别是在循环中。Java//优化前for(inti=0;i
web开发技术栈个人总结蓝砖科技HR_金庆硕前端
编程：Spring是一个非常强大的Java框架，被设计为帮助开发者更快速、容易地创建复杂的应用程序。Spring框架的核心是控制反转（IoC）和依赖注入（DI），它们提供了一种方法，允许开发者定义对象的依赖关系，而不是硬编码这些关系。这增加了可维护性和可测试性Spring框架有很多模块和子项目，这些可以根据应用程序的需求进行选择。下面是一些主要的Spring项目及其用途：SpringFramewo
Java 将 byte[] 转换为 File 对象我真的不想做程序员 java java 开发语言后端数据结构算法
目录一、将byte[]转换为File对象二、完整示例三、总结在Java开发中，将字节数组（byte[]）转换为文件对象（File）是一个常见的需求。这种需求常见于处理文件上传、下载以及与其他系统集成的场景。本文将详细介绍如何实现这一功能，并提供具体代码示例。一、将byte[]转换为File对象在Java中，可以使用java.io包中的File类和FileOutputStream类来将字节数组转换为
正则表达式全解析 + Java常用示例我真的不想做程序员算法 java java 后端开发语言算法正则表达式
目录一、正则表达式基础（一）元字符（二）字符集（三）量词二、正则表达式常用示例（一）验证邮箱格式（二）验证电话号码格式（三）提取网页中的链接（四）验证日期格式（五）验证URL格式三、正则表达式在Java中的应用（一）匹配操作（二）替换操作（三）分割操作四、总结一、正则表达式基础正则表达式是一种用于匹配字符串的强大工具。它使用特定的语法来定义匹配模式，可以在文本处理、表单验证、数据提取等场景中发挥重
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
JavaScript 内置对象-Math对象咖啡の猫 javascript 开发语言
在JavaScript编程中，处理各种数学运算和数值操作是不可避免的任务。幸运的是，JavaScript提供了一个非常有用的内置对象——Math对象，它包含了大量用于执行常见数学任务的方法和属性。本文将详细介绍Math对象的主要特性和使用方法，帮助你更高效地进行数学相关的编程工作。一、什么是Math对象？Math是一个内置的对象，提供了对数学常量和函数的访问。与其它全局对象不同，Math不是一个构
JavaScript基础-变量的作用域難釋懷 javascript 开发语言
在学习JavaScript的过程中，理解变量的作用域是至关重要的。作用域决定了变量的可见性和生命周期，即在程序的哪些部分可以访问这些变量。正确理解和应用变量作用域不仅能帮助编写更清晰、更高效的代码，还能避免一些常见的编程错误。本文将详细介绍JavaScript中的变量作用域概念、类型及其应用场景。一、什么是作用域？作用域（Scope）是指变量的有效范围，在这个范围内，变量是可以被访问和使用的。Ja
rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用原野AI 大模型部署 pdf ocr 深度学习 open-webui
背景rapidocr-onnxruntime是一个跨平台的OCR库，基于ONNXRuntime推理框架。目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。缘起：百度paddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C#将它移植到各个平台。名称来源：轻快好省并智能。基于深度学
Java多线程与高并发专题——原子类和 volatile、synchronized 有什么异同？黄雪超技术基础 java 开发语言并发编程
原子类和volatile异同首先，通过我们对原子类和的了解，原子类和volatile都能保证多线程环境下的数据可见性。在多线程程序中，每个线程都有自己的工作内存，当多个线程访问共享变量时，可能会出现一个线程修改了共享变量的值，而其他线程不能及时看到最新值的情况。原子类和volatile关键字都能在一定程度上解决这个问题。例如，当一个变量被volatile修饰后，对该变量的写操作会立即刷新到主内存，
hive 中优化性能的一些方法闯闯桑 hive hadoop 数据仓库
在ApacheHive中，性能优化是一个重要的课题，尤其是在处理大规模数据时。通过合理的优化方法，可以显著提升查询速度和资源利用率。以下是一些常见的Hive性能优化方法：1.数据存储优化1.1使用列式存储格式推荐格式:ORC和Parquet。优点:列式存储格式具有更高的压缩率和查询性能。支持谓词下推（PredicatePushdown）和列裁剪（ColumnPruning）。示例:CREATETA
Vue3使用ECharts入门示例牧小七 Vue echarts 前端 javascript
ApacheECharts介绍一个基于JavaScript的开源可视化图表库。官方网址使用示例第一步：NPM安装EChartsnpminstallecharts--save第二步：使用EChartsimport*asechartsfrom'echarts';constmain=ref()consttu=()=>{//基于准备好的dom，初始化echarts实例varmyChart=echarts.
以下列举了一些典型的JavaScript网页设计实例，它们展示了多样化的功能和交互体验，非常适合初学者及中级开发者学习借鉴如下: 一一代码 javascript
1.动态导航栏-功能描述：创建响应导航栏，当用户滚动页面时，导航栏固定在页面顶部，并显示当前页面部分。-技术点：-`window.scroll`事件监控页面滚动。-`classList`动态添加/移除CSS类。-`IntersectionObserver`检测元素是否进入视口。-示例代码：```javascriptwindow.addEventListener('scroll',()=>{cons
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR