xiao xi yuan

分布式任务调度

文章内容输出来源：拉勾教育Java高薪训练营

1.分布式任务调度介绍

分布式任务调度有两层含义：
（1）运行在分布式集群环境下的调度任务，即同一定时任务程序部署多份，只应该有一个定时任务执行；
（2）在分布式调度中，对比较大的定时任务进行分布式处理时，即把一个大的作业任务拆分为多个小的作业任务，同时执行，最终完成这个大的任务。

2.分布式任务调度解决方案

（1）基于Quartz开发任务管理平台
（2）分布式调度框架Elastic-Job
（3）分布式调度框架 XXL-JOB

（1）基于Quartz开发任务管理平台

Quartz是一个任务调度框架，使用时间表达式（包括：秒、分、时、日、周、年）来配置某一个任务什么时间去执行。Quartz的使用过程如下：
首先引入jar

<!--任务调度框架quartz-->
<!-- https://mvnrepository.com/artifact/org.quartz-scheduler/quartz -->
<dependency>
	<groupId>org.quartz-scheduler</groupId>
	<artifactId>quartz</artifactId>
	<version>2.3.2</version>
</dependency>

然后定义定时任务作业主调度程序

package quartz;
import org.quartz.*;
import org.quartz.impl.StdSchedulerFactory;
public class QuartzMain {
     
// 创建作业任务调度器
public static Scheduler createScheduler() throws SchedulerException {
     
	SchedulerFactory schedulerFactory = new StdSchedulerFactory();
	Scheduler scheduler = schedulerFactory.getScheduler();
	return scheduler;
}
// 创建一个作业任务
public static JobDetail createJob() {
     
	JobBuilder jobBuilder = JobBuilder.newJob(DemoJob.class);
	jobBuilder.withIdentity("jobName","myJob");
	JobDetail jobDetail = jobBuilder.build();
	return jobDetail;
}
/**
* 创建作业任务时间触发器
* cron表达式由七个位置组成，空格分隔
* 1、Seconds（秒） 0~59
* 2、Minutes（分） 0~59
* 3、Hours（小时） 0~23
* 4、Day of Month（天）1~31,注意有的月份不足31天
* 5、Month（月） 0~11,或者 JAN,FEB,MAR,APR,MAY,JUN,JUL,AUG,SEP,OCT,NOV,DEC
* 6、Day of Week(周) 1~7,1=SUN或者 SUN,MON,TUE,WEB,THU,FRI,SAT
* 7、Year（年）1970~2099 可选项
* 示例：
* 0 0 11 * * ? 每天的11点触发执行一次
* 0 30 10 1 * ? 每月1号上午10点半触发执行一次
*/
public static Trigger createTrigger() {
     
	// 创建时间触发器，按日历调度
	CronTrigger trigger = TriggerBuilder.newTrigger()
		.withIdentity("triggerName","myTrigger")
		.startNow()
		.withSchedule(CronScheduleBuilder.cronSchedule("0/2 * * * * ?"))
		.build();
	// 创建触发器，按简单隔离调度
	SimpleTrigger trigger1 = TriggerBuilder.newTrigger()
		.withIdentity("triggerName","myTrigger")
		.startNow()
		.withSchedule(SimpleScheduleBuilder
		.simpleSchedule()
		.withIntervalInSeconds(3)
		.repeatForever())
		.build();
	return trigger;
}
	// 定时任务作业主调度程序
	public static void main(String[] args) throws SchedulerException {
     
		// 创建一个作业任务调度器
		Scheduler scheduler = QuartzMain.createScheduler();
		// 创建一个作业任务
		JobDetail job = QuartzMain.createJob();
		// 创建一个作业任务时间触发器
		Trigger trigger = QuartzMain.createTrigger();
		// 使用调度器按照时间触发器执行这个作业任务
		scheduler.scheduleJob(job,trigger);
		scheduler.start();
	}
}

最后定义一个job，需实现Job接口

package quartz;
import org.quartz.Job;
import org.quartz.JobExecutionContext;
import org.quartz.JobExecutionException;
public class DemoJob implements Job {
     
	public void execute(JobExecutionContext jobExecutionContext)
throws JobExecutionException {
     
		System.out.println("我是一个定时任务逻辑");
	}
}

（2）分布式调度框架Elastic-Job

Elastic-Job是当当网开源的一个分布式调度解决方案，基于Quartz二次开发的，由两个相互独立的子项目Elastic-Job-Lite和Elastic-Job-Cloud组成。在一般的项目中使用Elastic-Job-Lite就可以，它是一个轻量级无中心化解决方案，使用jar包的形式提供分布式任务的协调服务，而Elastic-Job-Cloud子项目需要结合Mesos以及Docker在云环境下使用。
Elastic-Job的github地址：https://github.com/elasticjob
Elastic-Job-Lite原理：

说明：
由于Elastic-Job框架在分布式集群环境下使用，所以引入了Zookeeper；如上图，我们将同一个定时任务程序部署在多个实例（服务器）中，这里分别部署在APP1和APP2中，Elastic-Job-Lite框架通过监听器感知zookeeper节点数据的变化，并做相应的处理，这里主要就是进行leader选举。当两个实例都工作时，会进行leader选举，只执行其中的一个实例的定时任务；当我们停止其中正在执行定时任务的实例时（相当于挂掉），这个定时任务会转移到可以执行定时任务的另一个实例；即Elastic-Job-Lite框架实行对zookeeper节点的监听并进行leader选举从而保证了同一个定时任务程序部署多份时只有一个定时任务在执行。

说明：
如上图，有一个JOB任务，被分成Task0、1、2、3四个任务，相当于这个定时任务被分成了4片，即任务分片为4，Strategy表示分片策略，Zookeeper是注册中心；当只启动一个APP实例时，这个实例会执行Task0、Task1、Task2、Task3,共4片任务，即独立完成这个JOB任务；当启动两个APP实例时，会根据分片策略将Task0和Task1分配给APP1实例执行，Task2和Task3分配给APP2实例执行，即两个实例同时来完成这个JOB任务，也即分担原来APP实例的任务执行；当多个APP实例执行任务时，停止其中一个APP实例，这是每个分片任务又会被重新分配到其他APP实例上进行执行。
Elastic-Job-Lite的使用过程如下：
首先引入依赖jar

<!-- https://mvnrepository.com/artifact/com.dangdang/elastic-job-lite-core -->
<dependency>
	<groupId>com.dangdang</groupId>
	<artifactId>elastic-job-lite-core</artifactId>
	<version>2.1.5</version>
</dependency>

然后书写定时任务类：

package elasticjob;
import com.dangdang.ddframe.job.api.ShardingContext;
import com.dangdang.ddframe.job.api.simple.SimpleJob;
import util.JdbcUtil;
import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.util.List;
import java.util.Map;

public class BackupJob implements SimpleJob {
     
	// 定时任务每执行一次都会执行下面逻辑
	@Override
	public void execute(ShardingContext shardingContext) {
     
		/*
		从resume数据表查找1条未归档的数据，将其归档到resume_bak表，并更新状态为已归档（不删除			原数据）
		*/
		// 查询出一条数据
		String selectSql = "select * from resume where state='未归档' limit 1";
		List<Map<String, Object>> list =JdbcUtil.executeQuery(selectSql);
		if(list == null || list.size() == 0) {
     
			return;
		}
		Map<String, Object> stringObjectMap = list.get(0);
		long id = (long) stringObjectMap.get("id");
		String name = (String) stringObjectMap.get("name");
		String education = (String)stringObjectMap.get("education");
		// 打印出这条记录
		System.out.println("======>>>id：" + id + " name：" +
		name + " education:" + education);
		// 更新状态
		String updateSql = "update resume set state='已归档' where id=?";
		JdbcUtil.executeUpdate(updateSql,id);
		// 归档这条记录
		String insertSql = "insert into resume_bak select * from resume where 			id=?";
		JdbcUtil.executeUpdate(insertSql,id);
	}
}

接着书写任务调用主类：

package elasticjob;
import com.dangdang.ddframe.job.config.JobCoreConfiguration;
import com.dangdang.ddframe.job.config.simple.SimpleJobConfiguration;
import com.dangdang.ddframe.job.lite.api.JobScheduler;
import com.dangdang.ddframe.job.lite.config.LiteJobConfiguration;
import com.dangdang.ddframe.job.reg.base.CoordinatorRegistryCenter;
import com.dangdang.ddframe.job.reg.zookeeper.ZookeeperConfiguration;
import com.dangdang.ddframe.job.reg.zookeeper.ZookeeperRegistryCenter;

public class ElasticJobMain {
     
	public static void main(String[] args) {
     
		// 配置注册中心zookeeper，zookeeper协调调度，不能让任务重复执行，通过命名空间分类管
		//理任务，对应到zookeeper的目录
		ZookeeperConfiguration zookeeperConfiguration = new
			ZookeeperConfiguration("localhost:2181","data-archive-job");
		CoordinatorRegistryCenter coordinatorRegistryCenter = new
			ZookeeperRegistryCenter(zookeeperConfiguration);
			coordinatorRegistryCenter.init();
    	// 配置任务
		JobCoreConfiguration jobCoreConfiguration =
		JobCoreConfiguration.newBuilder("archive-job","*/2 * * * * ?",1).build();
		SimpleJobConfiguration simpleJobConfiguration = new
		SimpleJobConfiguration(jobCoreConfiguration,BackupJob.class.getName());
		// 启动任务
		new JobScheduler(coordinatorRegistryCenter,
		LiteJobConfiguration.newBuilder(simpleJobConfiguration).build()).init();
	}
}

JdbcUtil工具类：

package util;
import java.sql.*;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class JdbcUtil {
     
	//url
	private static String url = "jdbc:mysql://localhost:3306/job?characterEncoding=utf8&useSSL=false";
	//user
	private static String user = "root";
	//password
	private static String password = "123456";
	//驱动程序类
	private static String driver = "com.mysql.jdbc.Driver";
	static {
     
		try {
     
			Class.forName(driver);
		} catch (ClassNotFoundException e) {
     
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
    
	public static Connection getConnection() {
     
		try {
     
			return DriverManager.getConnection(url, user,password);
		} catch (SQLException e) {
     
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		return null;
	}
    
	public static void close(ResultSet rs, PreparedStatement ps,Connection con) {
     
		if (rs != null) {
     
			try {
     
				rs.close();
			} catch (SQLException e) {
     
				// TODO Auto-generated catch block
				e.printStackTrace();
			} finally {
     
				if (ps != null) {
     
					try {
     
						ps.close();
					} catch (SQLException e) {
     
						// TODO Auto-generated catch block
						e.printStackTrace();
					} finally {
     
						if (con != null) {
     
							try {
     
								con.close();
							} catch (SQLException e) {
     
								// TODO Auto-generated catch block
								e.printStackTrace();
							}
						}
					}
				}
			}
		}
	}
    
	public static void executeUpdate(String sql,Object...obj) {
     
		Connection con = getConnection();
		PreparedStatement ps = null;
		try {
     
			ps = con.prepareStatement(sql);
			for (int i = 0; i < obj.length; i++) {
     
				ps.setObject(i + 1, obj[i]);
			}
			ps.executeUpdate();
		} catch (SQLException e) {
     
			// TODO Auto-generated catch block
			e.printStackTrace();
		} finally {
     
			close(null, ps, con);
		}
	}
    
	public static List<Map<String,Object>> executeQuery(String sql, Object...obj) {
     
		Connection con = getConnection();
		ResultSet rs = null;
		PreparedStatement ps = null;
		try {
     
			ps = con.prepareStatement(sql);
			for (int i = 0; i < obj.length; i++) {
     
				ps.setObject(i + 1, obj[i]);
			}
			rs = ps.executeQuery();
			List<Map<String, Object>> list = new ArrayList<>();
			int count = rs.getMetaData().getColumnCount();
			while (rs.next()) {
     
				Map<String, Object> map = new HashMap<String,Object>();
				for (int i = 0; i < count; i++) {
     
					Object ob = rs.getObject(i + 1);
					String key = rs.getMetaData().getColumnName(i + 1);
					map.put(key, ob);
				}
				list.add(map);
			}
			return list;
		} catch (SQLException e) {
     
			// TODO Auto-generated catch block
			e.printStackTrace();
		} finally {
     
			close(rs, ps, con);
		}
	return null;
	}
}

最后进行测试：
首先可先启动一个进程，然后再启动一个进程，即两个进程模拟分布式环境下，通过一个定时任务部署在两个实例中工作；
然后两个进程逐个启动，观察现象；
最后关闭其中执行的进程，观察现象；

（3）分布式调度框架 XXL-JOB

XXL-JOB是大众点评员工徐雪里于2015年发布的分布式任务调度平台，是一个轻量级分布式任务调度框架，其核心设计目标是开发迅速、学习简单、轻量级、易扩展。
官方地址：https://www.xuxueli.com/xxl-job/
XXL-JOB将定时任务分为两个部分：调度中心和执行器。
XXL-JOB的使用过程如下：
首先部署调度中心：
部署步骤如下：
a. 下载xxl-job源码：http://gitee.com/xuxueli0323/xxl-job/，使用maven编译打包，生成部署的xxl-job-admin.jar；
b. 创建数据库，并初始化相关的表，脚本参考源码目录doc/db/tables_xxl_job.sql;
c. 创建部署目录，并配置数据库等配置，可在打包之前，在源码里面application.properties进行配置，也可以在部署目录里面单独创建application.properties文件里面进行配置（推荐，spring boot优先加载启动目录下的配置，可以避免以后更改数据库等配置时还需要重新打包源码）
d.运行管理平台（请先确保已经配置好Java执行环境，Jdk1.8或者以上）。
然后开发业务系统对接（执行器）：
基于spring boot配置执行器

@Configuration
public class XxlJobConfig {
     
    //spring boot应用基本都有appname，这里默认使用spring app name配置
    @Value("${spring.application.name:}")
    private String springAppName;
    @Value("${xxl.job.admin.addresses}")
    private String adminAddresses;
    @Value("${xxl.job.executor.appname:}")
    private String appName;
    //ip地址在多网卡、容器的时候需要指定，否则的话，使用默认就可以，
    //spring-cloud-commons中提供了InetUtils工具类，可以帮助获取IP
    @Value("${xxl.job.executor.ip:}")
    private String ip;
    //port可以默认指定一个，如果多个服务部署在同一台服务器上，可以通过检测获取或者规划分配
    @Value("${xxl.job.executor.port:9999}")
    private int port;
    @Value("${xxl.job.accessToken:}")
    private String accessToken;
    //logpath最好指定在应用目录下，最好不要使用绝对路径，避免和其应用冲突
    @Value("${xxl.job.executor.logpath:job-logs}")
    private String logPath;
    //logretentiondays日志保留天数不用太大，根据需要设置，默认给一个较短的时间即可
    @Value("${xxl.job.executor.logretentiondays:7}")
    private int logRetentionDays;
    @Bean
    public XxlJobSpringExecutor xxlJobExecutor() {
     
        XxlJobSpringExecutor xxlJobSpringExecutor = new XxlJobSpringExecutor();
        xxlJobSpringExecutor.setAdminAddresses(adminAddresses);
        if (StringUtils.isEmpty(appName)) {
     
            if (StringUtils.isEmpty(springAppName)) {
     
                throw new IllegalStateException("missing xxl-job appname config");
            }
            appName = springAppName;
        }
        xxlJobSpringExecutor.setAppName(appName);
        xxlJobSpringExecutor.setIp(ip);
        xxlJobSpringExecutor.setPort(port);
        xxlJobSpringExecutor.setAccessToken(accessToken);
        xxlJobSpringExecutor.setLogPath(logPath);
        xxlJobSpringExecutor.setLogRetentionDays(logRetentionDays);
        return xxlJobSpringExecutor;
    }
}

基于@XxlJob注解代码方式开发定时任务（建议制定名称，和调度中心配置保持一致）

@Component
public class SampleXxlJob {
     
    private static Logger logger = LoggerFactory.getLogger(SampleXxlJob.class);
    /**
     * 简单任务示例（Bean模式）
     */
    @XxlJob("demoJobHandler")
    public ReturnT<String> demoJobHandler(String param) throws Exception {
     
        XxlJobLogger.log("XXL-JOB, Hello World.");
        for (int i = 0; i < 5; i++) {
     
            XxlJobLogger.log("beat at:" + i);
            TimeUnit.SECONDS.sleep(2);
        }
        return ReturnT.SUCCESS;
    }
    /**
     * 分片广播任务
     */
    @XxlJob("shardingJobHandler")
    public ReturnT<String> shardingJobHandler(String param) throws Exception {
     
        // 分片参数
        ShardingUtil.ShardingVO shardingVO = ShardingUtil.getShardingVo();
        XxlJobLogger.log("分片参数：当前分片序号 = {}, 总分片数 = {}", shardingVO.getIndex(), shardingVO.getTotal());
        // 业务逻辑
        for (int i = 0; i < shardingVO.getTotal(); i++) {
     
            if (i == shardingVO.getIndex()) {
     
                XxlJobLogger.log("第 {} 片, 命中分片开始处理", i);
            } else {
     
                XxlJobLogger.log("第 {} 片, 忽略", i);
            }
        }
        return ReturnT.SUCCESS;
    }
}

配置定时任务
a.先配置执行器，推荐使用自动注册方式，避免集群部署时还需要调整机器地址（注意appname要和业务系统中配置一致）;
b.添加完执行器后，添加任务，JobHandler要和代码中配置的名称一致，执行器集群部署可以通过配置路由方式来控制执行，xxl-job调度只支持cron表达式;
c.启动或者执行任务，查询执行日志、注册节点等进行观察。

3.分布式任务调度方案的选择

根据需求，公司可以基于Quartz开发属于自己的任务管理平台，也推荐使用第三方开源的分布式调度框架Elastic-Job和XXL-JOB。

文章内容输出来源：拉勾教育Java高薪训练营
若有错误之处，欢迎留言指正~~~

分库分表之实战-sharding-JDBC绑定表配置实战
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC水平分库+水平分表配置实战
《破局节点失效：Erlang分布式容错系统的自愈机制与恢复逻辑》后端
节点故障是无法根除的常态——硬件老化、网络波动、资源耗尽等因素，随时可能让某个节点从集群中“消失”。Erlang语言凭借其面向并发的设计哲学与原生分布式支持，成为构建容错系统的优选工具。但真正的挑战不在于避免故障，而在于当节点失效时，系统能否像有机体自愈般自动恢复，这需要对Erlang的进程模型、分布式通信与状态管理进行深度挖掘，构建一套从故障感知到服务续接的完整逻辑闭环。Erlang节点间的默认
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
oracle pg 文件级迁移,从Oracle迁移到AntDB(二)-- ora2pg-对象和数据的导出导入
使用Ora2pg和psqlcopy方式进行数据迁移author:yafeishitags:AntDB,ora2pg,oracleAntDB:github_url,基于postgresql的高性能分布式数据库使用Ora2pg和psqlcopy方式进行数据迁移准备工作使用本文档的前提本文档指导如何使用ora2pg进行oracle到ADB的数据迁移，但是在参照本文档操作之前，有以下条件必须满足：-ADB
Spring 生态创新应用：微服务架构设计与前沿技术融合实践七夜zippoe #Java spring 微服务 java
在数字化转型的深水区，企业级应用正面临从“单体架构”向“分布式智能架构”的根本性跃迁。Spring生态以其二十年技术沉淀形成的生态壁垒，已成为支撑这场变革的核心基础设施。从2002年RodJohnson发布《ExpertOne-on-OneJ2EEDesignandDevelopment》奠定的理论基础，到如今覆盖从开发到运维全链路的技术矩阵，Spring始终以“简化开发”为初心，构建出适配不同业
HarmonyOS 入门到精通：为什么状态管理是鸿蒙开发的核心？逻极 harmonyos 鸿蒙笔记 harmonyos 华为鸿蒙入门到精通状态管理状态模式 arkts
在现代应用开发中，状态管理是构建响应式应用的基石。对于鸿蒙这种面向全场景的分布式操作系统，状态管理机制显得尤为重要。它不仅是实现复杂交互逻辑的关键，还直接关系到应用的性能、可维护性和用户体验。什么是状态管理？状态是指UI组件所依赖的、会随时间变化的数据。状态管理则是对这些变化数据的有效组织和控制，包括：状态的创建与初始化：在应用启动或组件加载时，为状态变量分配初始值，确保组件能够正确渲染初始界面。
4.服务注册发现：微服务的神经系统
在微服务架构中，服务之间不再是固定连接，而是高度动态、短暂存在的。如何让每个服务准确找到彼此，是分布式系统治理的核心问题之一。服务注册发现机制，正如神经系统之于人体，承担着连接、协调、感知变化的关键角色。本文将围绕Netflix开源的服务注册发现组件Eureka展开，深入剖析其原理，并以SpringCloud实战为导向，帮助你掌握服务治理的第一步。一、为什么需要服务注册发现？在单体架构中，服务调用
2.Spring Cloud生态全景解析：核心组件、能力边界与定位碎风影 SpringCloud深度解析 spring cloud spring 后端
导语：SpringCloud并非单一框架，而是基于SpringBoot构建的分布式系统工具集。它通过标准化封装，将服务发现、配置管理、熔断限流等复杂基础设施转化为开箱即用的组件，让开发者聚焦业务逻辑。本文将系统解析其核心组成、与SpringBoot的共生关系，并客观审视其能力边界，助您构建清晰的微服务技术选型地图。一、核心基石：SpringBoot与SpringCloud的共生关系关键结论：Spr
clickhouse分布式表插入数据不用带ON CLUSTER 时时刻刻看着自己的心 clickhouse 分布式
向分布式表插入数据时，通常不需要使用ONCLUSTER，因为分布式表的写入操作会自动将数据分发到底层表（bm_online_user_count_part）的对应节点。但对于DDL（数据定义语句，例如ALTERTABLE）操作，在分布式环境中修改底层表时，建议使用ONCLUSTER，以确保所有相关节点上的表结构和数据同步。区分DDL和DMLDML（数据操作语句，例如INSERT）向分布式表插入数据
k8s深度讲解----宏观架构与集群之脑 - API Server 和 etcd weixin_42587823 云原生 kubernetes 架构 etcd
宏观架构与集群之脑-APIServer和etcd宏观架构：数据中心的操作系统在开始之前，让我们先建立一个高层视角。你可以将Kubernetes想象成一个管理整个数据中心的分布式操作系统。在这个操作系统中：控制平面(ControlPlane)就是它的“内核”，负责管理和决策。工作节点(WorkerNodes)就是它的“CPU和内存”，是真正运行应用程序的地方。我们常用的kubectl就是与这个“内核
Kafka浅学文文Tao kafka java 分布式
Kafka应用场景？异步解耦流量消锋Kafka消息队列特点？Kafka吞吐量高：因为他存储数据时，磁盘顺序存储，磁盘的顺序存储速度很快。Kafka持久化消息：这些消息日志可以被重复读取和永久保留可以运行时动态扩展伸缩：Kafka是分布式系统：它以集群的方式运行，早期依赖Zookeeper对于Kafka的作用是什么？Zookeeper是分布式协调服务。Zookeeper作用：用于在Kafka集群中不
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
探秘阿里云消息队列：解锁分布式系统的异步通信奥秘云资源服务商阿里云云计算中间件
阿里云消息队列：分布式架构的基石在当今数字化快速发展的时代，分布式系统已成为企业构建高可用、高性能应用的关键架构。而消息队列，作为分布式系统中的重要组件，犹如基石一般，支撑着整个架构的稳定运行。它能够有效地解决分布式系统中的异步通信、解耦、削峰填谷等问题，为系统的可靠性和扩展性提供了强大的保障。阿里云作为云计算领域的领军者，其推出的阿里云消息队列凭借着卓越的性能、高可靠性以及丰富的功能，成为了众多
Python 爬虫实战：如何搭建高效的分布式爬虫架构，突破数据抓取极限程序员威哥 python 爬虫分布式
随着互联网数据量的飞速增长，单一爬虫在抓取大量数据时的效率和稳定性往往无法满足需求。在这种情况下，分布式爬虫架构应运而生。分布式爬虫通过多节点并行工作，可以大大提高数据抓取的速度，同时减少单点故障的风险。本文将深入探讨如何使用Python构建一个高效的分布式爬虫架构，从架构设计到技术实现，帮助你突破数据抓取的极限。一、什么是分布式爬虫？分布式爬虫系统将爬虫任务拆分为多个子任务，分布到不同的服务器或
1-Kafka介绍及常见应用场景 sql2008help kafka 分布式
Kafka介绍ApacheKafka是一个开源的分布式流处理平台，最初由LinkedIn开发，后捐赠给Apache软件基金会。它被设计用于高吞吐量、低延迟、可水平扩展地处理实时数据流。官网地址是：https://kafka.apache.org/以下是Kafka的核心介绍：核心概念消息系统(MessagingSystem)Kafka充当生产者和消费者之间的消息中间件，解耦系统，确保可靠的数据传递。
基于 Java 的电商业务秒杀商品高并发、数据一致性、系统性能等多个方面设计方案一杯冰美式_丶 java 开发语言
1.需求分析高并发：大量用户同时抢购，系统需要支持高并发请求。库存一致性：避免超卖（库存减为负数）或数据不一致。高性能：响应时间要短，用户体验要好。公平性：先到先得，避免作弊。2.技术选型缓存：使用Redis缓存商品库存和秒杀结果，减少数据库压力。消息队列：使用RabbitMQ或Kafka异步处理订单，削峰填谷。数据库：MySQL存储订单和商品信息，使用事务保证数据一致性。分布式锁：使用Redis
告别重复订单！分布式ID生成核心方案全揭秘山海上的风分布式 java
《告别重复订单！分布式ID生成核心方案全揭秘》你可能用过UUID，却饱受索引性能折磨；你尝试过数据库自增ID，却在分库分表时束手无策；你研究过雪花算法，却被时钟回拨问题困扰……分布式订单ID生成究竟有没有完美方案？本文将为你一一拆解，并给出企业级最优解！一、为什么订单ID如此关键？（示意图：分布式订单系统）需求维度技术指标灾难案例全局唯一零冲突概率重复订单导致财务对账崩溃高性能10万+TPS秒杀活
Java微服务框架技术选型全景报告 chanalbert 技术选型 java java 微服务框架技术选型
一、核心框架深度解析1.1Spring生态体系组件关键特性适用场景SpringBoot-约定优于配置+自动装配（Starter）-内嵌Tomcat/Jetty容器-Actuator监控端点企业级单体应用/传统系统迁移SpringCloud-微服务全家桶（Eureka/Zuul/Config）-强事务管理（SpringTX）-生态兼容性最佳复杂分布式系统WebFlux-响应式编程模型（Reactor
Zookeeper的典型应用场景?
大家好，我是锋哥。今天分享关于【Zookeeper的典型应用场景?】面试题。希望对大家有帮助；Zookeeper的典型应用场景?超硬核AI学习资料，现在永久免费了！Zookeeper是一个开源的分布式协调服务，它被广泛应用于需要分布式系统协调的场景。以下是Zookeeper的一些典型应用场景：1.分布式锁在分布式系统中，多个节点可能需要对共享资源进行访问，这时就需要确保访问的排他性。Zookeep
NCCL 核心集体通信操作深度解析：从原理到优化实践清风 001 AI大模型底层建设 gpu算力 ai
目录引言：NCCL——分布式训练的通信引擎一、NCCL基础：GPU通信的“加速器”1.1NCCL与MPI的协同1.2集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1定义与目标2.1.2算法原理2.1.3性能影响因素2.1.4测试方法（nccl-tests）2.2AllReduce：梯度聚合的核心2.2.1定义与目标2.2.2算法原理2.2.3性能影响因素2
Scrapy与分布式开发(2.3)：lxml+xpath基本指令和提取方法详解九月镇灵将打造高效爬虫系统 scrapy 分布式 xpath lxml
lxml+xpath基本指令和提取方法详解一、XPath简介XPath，全称为XMLPathLanguage，是一种在XML文档中查找信息的语言。它允许用户通过简单的路径表达式在XML文档中进行导航。XPath不仅适用于XML，还常用于处理HTML文档。二、基本指令和提取方法选择节点使用XPath，你可以轻松地选择XML文档中的节点。*选择根节点：/*选择子节点：/parent/child*选择所
Docker安装部署MySQL+Canal+Kafka+Camus+HIVE数据实时同步是小南啊_- Java java centos docker kafka hadoop
因为公司业务需求要将mysql的数据实时同步到hive中，在网上找到一套可用的方案，即MySQL+Canal+Kafka+Camus+HIVE的数据流通方式，因为是首次搭建，所以暂时使用伪分布式的搭建方案。一、安装docker安装docker的教程网上一搜一大把,请参考：centos下docker安装教程二、docker安装MySQL安装教程网上也有很多，请参考:docker安装MySQL1.开启
HBase总结
HBase1.HBase核心概念HBase的作用HBase主要用于存储和管理超大规模的结构化或半结构化数据（如PB级），特点包括：高扩展性：通过分布式架构横向扩展，支持数千台服务器高吞吐量：适合实时随机读写（如用户行为日志、实时分析）强一致性：保证同一行数据的原子性操作灵活的数据模型：支持动态列和稀疏存储典型应用场景：互联网公司的用户行为日志存储（如点击流数据）社交媒体的实时消息存储物联网设备时序
GlusterFS 分布式文件系统详解 Sally璐璐运维运维
一、核心特性高扩展性GlusterFS采用无共享架构，支持横向扩展，只需添加服务器节点即可提升存储容量和性能，理论上可达PB甚至EB级规模，且扩展过程对上层应用完全透明。例如，一个初始4节点、20TB的集群可无缝扩展至100节点、500TB规模，仅需执行简单扩容命令，无需中断服务或数据迁移。详细扩容步骤：准备新服务器并安装GlusterFS软件确保操作系统版本兼容安装glusterfs-serve
什么是 Web3？
Web3是用来描述互联网下一代迭代的术语，它建立在区块链技术之上，由用户共同控制。第三次会成功吗？互联网一直在发展和变化。但不仅仅是网站和平台会时好时坏；构建互联网的代码本身也在不断变化。在过去的几年中，一些技术未来学家开始将计算机科学家GavinWood创造的术语Web3视为未来事物的标志。Web3是一种建立在区块链上的新型去中心化互联网，区块链是由参与者共同控制的分布式账本。由于区块链的集体性
区块链技术如何促进算力生态的发展？ VV- Wxiaoxwen 软件工程开源软件软件构建
区块链技术可通过优化共识机制、推动分布式算力发展、促进算力资源共享等方式，从提升效率、拓展应用场景、优化资源配置等方面促进算力生态的发展，具体如下：-优化共识机制提升算力效率：传统的工作量证明（PoW）共识机制依赖大量计算资源，能耗高且效率低。而权益证明（PoS）、委任权益证明（DPoS）等新型共识机制的出现，减少了对挖矿算力的依赖，能在保证安全性的前提下，大幅降低算力需求，提高能源利用效率，使区
分布式系统与RPC框架介绍 jjkkzzzz 分布式系统 rpc
分布式系统是什么？分布式系统是由多台独立的计算节点通过网络协同组成的系统，多个节点对外表现为一个整体，共同完成一个业务目标。这些节点可以是不同物理机、虚拟机、容器，也可以位于不同地理位置。分布式系统特点：多节点协作：系统中的多个服务进程分布在不同机器上。网络通信：节点间通过网络（通常通过RPC）通信。透明性：用户感知不到后端有多少节点。容错能力：节点故障不会影响整体系统的可用性。为什么需要分布式系
Rust之从零开始构建分布式事务数据库莲华君 rust 分布式数据库
目录第一部分：Rust基础与数据库基础Rust语言基础Rust的特点与优势Rust的内存安全与并发模型Rust工具链与开发环境搭建数据库基本原理关系型数据库与非关系型数据库数据库的事务管理原理ACID与BASE理论分布式系统与数据库的挑战第二部分：分布式数据库核心架构分布式数据库的设计原则CAP理论与BASE理论数据分片与复制数据一致性与可用性的权衡数据持久化与恢复策略分布式事务的基础事务的ACI
OpenHarmony vs Linux：分布式操作系统的终极对决 109702008 编程操作系统 #linux系统 linux 分布式人工智能
副标题：从架构基因到场景适配，解析两大系统的分布式能力差异与未来演进引言：分布式操作系统的时代命题在万物互联时代，设备协同与算力融合成为刚需。OpenHarmony和Linux作为两大开源操作系统，代表了不同的技术路线：前者是原生分布式设计，后者是生态驱动演进。本文从分布式视角深度对比二者，为开发者提供选型参考。一、架构设计：原生支持vs生态补足能力维度OpenHarmonyLinux内核模型微内
【经验分享】分布式爬虫的优势与劣势分析电商数据girl 跨境电商API接口电商项目API接口测试电商ERP项目接口经验分享分布式爬虫 java 数据库大数据 python
分布式爬虫通过多节点协同工作实现数据采集，其设计初衷是解决单节点爬虫在大规模数据抓取场景中的性能瓶颈，但同时也因架构复杂度带来了新的挑战。以下从技术特性、应用场景适配性两个维度，系统分析其优势与劣势：一、分布式爬虫的核心优势高效突破大规模数据采集瓶颈并行处理能力：通过将任务拆分到多个节点并行执行，大幅提升数据抓取效率。例如，采集100万条电商商品数据时，单节点爬虫可能需要数天，而由10个节点组成的
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul