涛濤

Canal增量同步MySQL数到Elasticsearch

调研背景

由于业务发展迅速,店铺商品分库越来越多(目前已有8个MySQL分库)且分库中表数据行数越来越大,大的表已经达到了5KW+,业务需要对商品模糊查询或根据其他字段查询,这些查询的字段很多在数据库中都没有索引,查询命中数据很慢(有些数据根本就查询不出来)且会给数据库库带来很大的压力.所以目前希望将MySQL中的商品数据实时同步到Elasticsearch,利用ES的强大搜索性能来满足我们当前的业务需求.

功能需求

首先需要一个稳定的能存储数据达到TB级别的ES集群;
其次需要将所有店铺商品分库中已有的所有数据初始化到ES集群;
最后后需要实时同步所有店铺商品分库中发生变更的记录到ES集群保证后续数据一致性;

技术需求

需要一个能迁移大数据量的方案用于第一次初始化;(后续调研)
需要一个能实时同步变更数据的方案保证数据一致性;(即本次调研的中间件Canal)

Canal简介

Canal是阿里巴巴开源的基于数据库增量日志解析，提供增量数据订阅&消费的数据同步中间件,在阿里内部也有长时间的使用.

GitHub地址: https://github.com/alibaba/canal

Canal简介地址: https://github.com/alibaba/canal/wiki/Introduction

工作原理

mysql主备复制实现

1.master将改变记录到二进制日志(binary log)中（这些记录叫做二进制日志事件，binary log events，可以通过show binlog events进行查看）；从上层来看，复制分成三步：

2.slave将master的binary log events拷贝到它的中继日志(relay log)；

3.slave重做中继日志中的事件，将改变反映它自己的数据。

canal的工作原理

canal模拟mysql slave的交互协议，伪装自己为mysql slave，向mysql master发送dump协议原理相对比较简单：

mysql master收到dump请求，开始推送binary log给slave(也就是canal)
canal解析binary log对象(原始为byte流)

架构

server代表一个canal运行实例，对应于一个jvm;说明：

instance对应于一个数据队列（1个server对应1..n个instance)

instance模块：

eventParser (数据源接入，模拟slave协议和master进行交互，协议解析)
eventSink (Parser和Store链接器，进行数据过滤，加工，分发的工作)
eventStore (数据存储)
metaManager (增量订阅&消费信息管理器)

MySQL Binlog

mysql的binlog是多文件存储，定位一个LogEvent需要通过binlog filename + binlog position，进行定位;
mysql的binlog数据格式，按照生成的方式，主要分为：statement-based、row-based、mixed。
目前canal支持所有模式的增量订阅(但配合同步时，因为statement只有sql，没有数据，无法获取原始的变更日志，所以一般建议为ROW模式)

EventParser设计

整个parser过程大致可分为几步：

Connection获取上一次解析成功的位置 (如果第一次启动，则获取初始指定的位置或者是当前数据库的binlog位点)

Connection建立链接，发送BINLOG_DUMP指令

// 0. write command number

// 1. write 4 bytes bin-log position to start at

// 2. write 2 bytes bin-log flags

// 3. write 4 bytes server id of the slave

// 4. write bin-log file name

Mysql开始推送Binaly Log

// 补充字段名字，字段类型，主键信息，unsigned类型处理接收到的Binaly Log的通过Binlog parser进行协议解析，补充一些特定信息

传递给EventSink模块进行数据存储，是一个阻塞操作，直到存储成功

存储成功后，定时记录Binaly Log位置.

EventSink设计

说明：

1.数据过滤：支持通配符的过滤模式，表名，字段内容等

2.数据路由/分发：解决1:n (1个parser对应多个store的模式)

3.数据归并：解决n:1 (多个parser对应1个store)

4.数据加工：在进入store之前进行额外的处理，比如join

数据1:n业务:

为了合理的利用数据库资源，一般常见的业务都是按照schema进行隔离，然后在mysql上层或者dao这一层面上，进行一个数据源路由，屏蔽数据库物理位置对开发的影响，阿里系主要是通过cobar/tddl来解决数据源路由问题。

所以，一般一个数据库实例上，会部署多个schema，每个schema会有由1个或者多个业务方关注

数据n:1业务:

同样，当一个业务的数据规模达到一定的量级后，必然会涉及到水平拆分和垂直拆分的问题，针对这些拆分的数据需要处理时，就需要链接多个store进行处理，消费的位点就会变成多份，而且数据消费的进度无法得到尽可能有序的保证。

所以，在一定业务场景下，需要将拆分后的增量数据进行归并处理，比如按照时间戳/全局id进行排序归并.

EventStore设计

1. 目前实现了Memory内存模式，本地file存储，mixed混合模式;

2. 借鉴了Disruptor的RingBuffer的实现思路;

RingBuffer设计:

Put : Sink模块进行数据存储的最后一次写入位置定义了3个cursor

Get : 数据订阅获取的最后一次提取位置

Ack : 数据消费成功的最后一次消费位置

借鉴Disruptor的RingBuffer的实现，将RingBuffer拉直来看：

Put/Get/Ack cursor用于递增，采用long型存储实现说明：

buffer的get操作，通过取余或者与操作。(与操作：cusor & (size - 1) , size需要为2的指数，效率比较高)

Instance设计

抽象了CanalInstanceGenerator，主要是考虑配置的管理方式：instance代表了一个实际运行的数据队列，包括了EventPaser,EventSink,EventStore等组件。

manager方式：和你自己的内部web console/manager系统进行对接。(目前主要是公司内部使用)

spring方式：基于spring xml + properties进行定义，构建spring配置.

Server设计

Embeded : 对latency和可用性都有比较高的要求，自己又能hold住分布式的相关技术(比如failover)server代表了一个canal的运行实例，为了方便组件化使用，特意抽象了Embeded(嵌入式) / Netty(网络访问)的两种实现

Netty : 基于netty封装了一层网络协议，由canal server保证其可用性，采用的pull模型，当然latency会稍微打点折扣，不过这个也视情况而定。(阿里系的notify和metaq，典型的push/pull模型，目前也逐步的在向pull模型靠拢，push在数据量大的时候会有一些问题)

增量订阅/消费设计

get/ack/rollback协议介绍：

Message getWithoutAck(int batchSize)，允许指定batchSize，一次可以获取多条，每次返回的对象为Message，包含的内容为：

a. batch id 唯一标识

b. entries 具体的数据对象，对应的数据对象格式：EntryProtocol.proto

void rollback(long batchId)，顾命思议，回滚上次的get请求，重新获取数据。基于get获取的batchId进行提交，避免误操作

void ack(long batchId)，顾命思议，确认已经消费成功，通知server删除数据。基于get获取的batchId进行提交，避免误操作

canal的get/ack/rollback协议和常规的jms协议有所不同，允许get/ack异步处理，比如可以连续调用get多次，后续异步按顺序提交ack/rollback，项目中称之为流式api.

流式api设计的好处：

get/ack异步化，减少因ack带来的网络延迟和操作成本 (99%的状态都是处于正常状态，异常的rollback属于个别情况，没必要为个别的case牺牲整个性能)

get获取数据后，业务消费存在瓶颈或者需要多进程/多线程消费时，可以不停的轮询get数据，不停的往后发送任务，提高并行化. (作者在实际业务中的一个case：业务数据消费需要跨中美网络，所以一次操作基本在200ms以上，为了减少延迟，所以需要实施并行化)

2.每次的get操作，都会在上一次的mark操作记录的cursor继续往后取，如果mark不存在，则在last ack cursor继续往后取1.每次get操作都会在meta中产生一个mark，mark标记会递增，保证运行过程中mark的唯一性

3.进行ack时，需要按照mark的顺序进行数序ack，不能跳跃ack. ack会删除当前的mark标记，并将对应的mark位置更新为last ack cusor

4.一旦出现异常情况，客户端可发起rollback情况，重新置位：删除所有的mark, 清理get请求位置，下次请求会从last ack cursor继续往后取

HA机制设计

canal的ha分为两部分，canal server和canal client分别有对应的ha实现:

1.canal server: 为了减少对mysql dump的请求，不同server上的instance要求同一时间只能有一个处于running，其他的处于standby状态.

2.canal client: 为了保证有序性，一份instance同一时间只能由一个canal client进行get/ack/rollback操作，否则客户端接收无法保证有序。

Canal Server:整个HA机制的控制主要是依赖了zookeeper的几个特性，watcher和EPHEMERAL节点(和session生命周期绑定)，可以看下我之前zookeeper的相关文章

大致步骤：

1.canal server要启动某个canal instance时都先向zookeeper进行一次尝试启动判断 (实现：创建EPHEMERAL节点，谁创建成功就允许谁启动)

2.创建zookeeper节点成功后，对应的canal server就启动对应的canal instance，没有创建成功的canal instance就会处于standby状态

3.一旦zookeeper发现canal server A创建的节点消失后，立即通知其他的canal server再次进行步骤1的操作，重新选出一个canal server启动instance.

4.canal client每次进行connect时，会首先向zookeeper询问当前是谁启动了canal instance，然后和其建立链接，一旦链接不可用，会重新尝试connect.

Canal Client的方式和canal server方式类似，也是利用zookeeper的抢占EPHEMERAL节点的方式进行控制.

调研实验

环境:

本地安装了3个MySQL5.7服务;

本地起两个canal server 注册到开发环境zk;

本地起两个canal client 注册到开发环境zk;

开发环境ES.

配置&开发:

MySQL开启binlog(ROW);

canal server 创建3个instance 伪装成一个destination,且将读取binlog文件的位置信息保存到zk中;

canal client监听destination,client是在canal提供的client的基础上扩展开发的,将从server接收到的message解析出字段名称和对应的值存入ES;(此处使用自定义开发而不是使用官方的canal-adapter.elasticsearch是因为我们需要自己解压二进制数据然后在存入ES)

验证:

在三个MySQL服务中分别创建表shop_item_text(与网店中表结构一致),切随机添加几条数据,在ES中都能查询到,且与在MySQL中添加的数据一致;
随机在三个MySQL中修改数据,然后观察ES中的数据也是一致的;
删除MySQL中的数据,ES中的数据也被删除;
人为结束当前在线的canal server,再随机修改数据,几秒会后ES中也可以看到被修改的结果;
随后又把杀掉了的那个canal server再启起来,然后再杀掉当前在线的server,再随机修改数据,几秒会后ES中也会看到被修改的结果;
人为杀掉其中当前在线client,再随机修改数据,几秒会后ES中也可以看到被修改的结果;
随后又把杀掉了的那个client再启起来,然后再杀掉当前在线的client,再随机修改数据,几秒会后ES中也会看到被修改的结果;

此处没有性能上的测试,canal性能可以参考官方测试结果https://github.com/alibaba/canal/wiki/Performance

调研结论

Canal server/client支持HA,可以用于增量同步MySQL binlog到ES;
由于我们商品描述/基本信息是压缩之后存的BLOB类型,需要在client接收到时解压, 所以我们需要在官方提供的client基础上自行开发.
店铺商品同步方式:MySQL一个表在ES中建一个索引,所有分库中相同表名的数据存在同一个索引上,

MySQL数据库中一条记录在ES中创建一个文档;

因我们所有表的主键ID是采用雪花算法生成,故在全局所有分库所有表都是唯一的,所以采用主键ID作为ES中文档的_id用于ES做删除(即当在MySQL中执行delete语句时).

雪花算法参考: https://tech.meituan.com/2017/04/21/mt-leaf.html

当前只调研了canal 可以用于增量同步MySQL数据到ES,但是ES存储架构设计还需要调研,怎样的前期架构设计可以满足现在以及以后数据量剧增的需求.

关于数据全量同步到ES可以参考此博客:

https://blog.csdn.net/admin1973/article/details/96100877

自己扩展的canal-client(仅供参考):

https://github.com/canglang1973/canal_elasticsearch_client

Spring Boot + 本地部署大模型实现：安全性与可靠性保障代码老y spring boot bootstrap 后端
在将大语言模型集成到SpringBoot应用中时，安全性和可靠性是两个关键因素。本地部署的大模型虽然提供了强大的功能，但也可能带来一些安全风险，如数据泄露、模型被恶意利用等。本文将介绍如何在SpringBoot应用中保障本地部署大模型的安全性和可靠性，确保应用的稳定运行。一、安全性保障（一）数据加密传输加密：确保模型生成的结果在传输过程中被加密，防止数据在传输过程中被窃取。可以使用HTTPS协议来
存储延时数据，帮你选数据库和缓存架构呢喃coding 系统架构设计架构
1.理解存储媒介量化延时类别描述延时缓存/内存L1cachereference1ns缓存/内存L2cachereference4ns缓存/内存Mainmemoryreference（DDR4，5-10ns为补充说明）100ns网络传输SendpacketCA->Netherlands->CA150,000,000ns（150ms）磁盘存储HDD(HardDiskDrive)读写1-10ms磁盘存储
网络与磁盘：Java架构师必知的系统“血管”和“仓库”
网络与磁盘：Java架构师必知的系统“血管”和“仓库”作为Java架构师，网络和磁盘是系统数据流动的“血管”与“仓库”。网络决定数据传输的快慢，磁盘影响数据存储的效率，直接关系系统性能和用户体验。一、网络：数据传输的“高速公路”以下是网络相关关键指标的整理表格：网络指标详细说明对Java架构的影响与实践建议万兆带宽实际速度万兆带宽（单位为bit），实际下载/上传速度为1250MB/s（因1字节=8
C#配置全面详解：从传统方式到现代配置系统阿蒙Armon C#工作中的应用 c#网络数据库
C#配置全面详解：从传统方式到现代配置系统在软件开发中，配置是指应用程序运行时可调整的参数集合，如数据库连接字符串、API地址、日志级别等。将这些参数从代码中分离出来，便于在不修改代码的情况下调整应用行为。C#提供了多种配置管理方式，从传统的XML配置文件到现代的多源配置系统，每种方式都有其适用场景。本文将全面介绍C#中的配置技术，帮助开发者根据项目需求选择合适的配置方案。一、配置基础与核心概念1
C#中Struct与IntPtr转换：实用扩展方法阿蒙Armon C#工作中的应用 c#
C#中Struct与IntPtr转换：实用扩展方法在C#编程的世界里，我们常常会遇到需要与非托管代码交互，或者进行一些底层内存操作的场景。这时，IntPtr类型就显得尤为重要，它可以表示一个指针或句柄，用来指向非托管内存中的数据。而结构体作为一种常用的数据结构，在与IntPtr进行数据传递和转换时，往往需要一些繁琐的操作。为了简化这些操作，提高开发效率，我们可以通过扩展方法来封装相关的功能。接下来
C#指针：解锁内存操作的底层密码
C#指针：解锁内存操作的底层密码在C#的世界里，我们习惯了托管代码带来的安全与便捷——垃圾回收器自动管理内存，类型系统严格检查数据操作，就像在精心维护的花园中漫步，无需担心杂草与荆棘。但当性能成为关键瓶颈，或是需要与非托管代码交互时，我们就需要一把能劈开藩篱的利刃——C#指针。它允许开发者直接操作内存地址，如同在荒野中开辟道路，充满挑战却也暗藏高效的可能。一、什么是C#指针？指针是一个变量，其值为
内网穿透和路由器端口映射什么区别？呆萌很计算机网络原理网络
内网穿透：俗称打洞，需要一个中间商来帮你。首先你主动去中间商那里注册（当然都是你在你的局域网内装的内网穿透软件自动完成的）你要提供的服务，比如web默认是80号端口。当你去注册时，你发送的数据会一层一层的穿透路由器（你的路由器，宽带商的路由器）,发送时必须有一个发送端口。每经过一层路由器路由器都会变换一个IP变换一个端口（就是NAt）。这个数据最后到达中间服务商。端口映射/端口转发：是指路由获得公
c语言的数组注意事项小徐敲java c语言 java 开发语言
在C语言中，int()[5]和int是两种完全不同的指针类型，理解它们的区别对于正确处理数组和多维数组至关重要。下面详细解释：1：int*（指向整型的指针）含义：指向单个int类型数据的指针典型用法：inta=10;int*p=&a;//p指向一个int变量与一维数组的关系：intarr[5]={1,2,3,4,5};int*p=arr;//arr自动转换为&arr[0]，类型是int*2：int
Charles抓包 nee~ okhttp
charles抓包Charles是一个HTTP代理服务器,HTTP监视器,反转代理服务器，当浏览器连接Charles的代理访问互联网时，Charles可以监控浏览器发送和接收的所有数据。它允许一个开发者查看所有连接互联网的HTTP通信，这些包括request,response和HTTPheaders（包含cookies与caching信息）。Charles主要功能：支持SSL代理。可以截取分析SS
stack_queue扩展学习 --- 反向迭代器茉莉玫瑰花茶 C++反向迭代器 C/C++
反向迭代器的实现思路源码及框架分析迭代器是用来遍历容器的，是一种封装，它不需要去关注容器的底层实现（底层是数组，链表，还是树等等这些结构），我们都是用统一的方式去对容器进行访问，访问行为是类似指针的。我们之前学习了普通迭代器和const迭代器：普通迭代器：能读能写；const迭代器：只能读，只能遍历数据，得到数据，不能修改数据，是不能写的。我们之前学的普通迭代器是正向迭代器，如果我想逆方向遍历呢？
云存储的应用场景都包含哪些？
云存储是一种网上在线存储的模式，可以将重要的数据信息存放在由第三方托管的虚拟服务器当中，云存储是在云计算概念上所延伸和衍生出的一个新的概念，保证企业中数据的安全性，同时还帮助企业节省了一定的存储空间，让用户可以更加便捷的存取所需的数据资源，实现文件共享和协作功能。本文将来具有了解一下云存储的应用场景都有哪些吧！云存储所应用的场景也较为广泛，其高度的灵活性和可扩展性成为了各个企业的首要选择，尤其是对
云存储中包含哪些存储种类？ wanhengidc 服务器运维
云存储属于是一种计算机数据存储模式，能够将数据数据信息存储在异地服务器中，这种存储方式通常是由第三方提供商进行维护和管理的，用户可以通过公共或私有互联网连接来访问相关数据信息，同时，在云存储当中还有着三种常见的存储类型，为对象存储、文件存储和块存储，下面我们就来具体了解一下这三种存储类型吧！对象存储是一种将数据信息存储为对象的方式，对象存储主要是用于存储非结构化的数据信息，比如视频、图片和音频等内
全球86%企业已启程：SNP零中断迁移方案护航S/4HANA转型 snpgroupcn 云计算数据仓库运维
目录如何在RISE项目中取得成功全程赋能：SNP为RISE项目打造的六大核心优势1、更快实现价值2、更高的灵活性3、降低成本4、风险可控5、更高的用户接受度3、近乎零中断客户评价实践见证：全球领先企业的成功典范1、IBM2、Pfizer辉瑞3、Coop超越迁移：构建数据驱动型业务的未来在SNP，我们已成功指导数百家企业完成复杂的SAP系统迁移项目。这些经验已融入我们的软件和转型方法论，使您的迁移之
技术支持工程师
OS与云桌面一、核心概念解析操作系统（OS）定义：管理硬件资源（CPU、内存、存储等）并为应用程序提供运行环境的系统软件，如Windows、Linux、UOS、银河麒麟等。作用：承担进程调度、文件管理、设备驱动等基础功能，是任何计算设备的“大脑”。云桌面定义：基于云计算技术的虚拟桌面服务，将传统PC的桌面环境（操作系统、应用、数据）集中部署在远端服务器，用户通过终端设备（如瘦客户机、PC、手机）远
手机NFC 读护照芯片数据电子护照杨健辉护照阅读器人工智能 ocr
随着全球交流的日益频繁，高效、准确的护照识别技术成为了迫切的需求。国产化厂家推出了具有开创性的移动端护照识别技术，其中最为引人瞩目的便是NFC秒读芯片数据功能。手机NFC读取护照芯片信息传统的护照识别方式往往存在着速度慢、准确率不高、操作繁琐等问题。而中安未来的这项新技术，通过NFC技术实现了对护照芯片数据的秒读。这一突破带来了诸多显著优势。首先，速度上的巨大提升极大地提高了工作效率。无论是在机场
什么是DO、DTO、VO、BO、AO，还在傻傻分不清？今天一文带你了解这些概率 Gq.xxu java 系统架构
在分层架构的Java应用中，DO、DTO、VO、BO、AO等概念用于解耦不同层级的数据传递和业务逻辑。它们分别承担不同职责，以下是对这些概念的详细解释：1.DO（DataObject/DomainObject）定义：与数据库表结构直接映射的对象，通常由DAO层操作。用途：在数据访问层（DAO）中承载数据库查询结果，如UserDO对应user表字段。特点：属性与数据库字段一一对应。仅包含数据，不包含
无人机遥控器数据分享模块解析
一、运行方式1.单向遥控模式指令下发：遥控器操纵信号通过ADC/IO接口输入至处理器，经编码后由无线模块发送至无人机。数据传输：采用DBUS等协议，以串行通信传输18字节帧数据，需反相器处理电平反转问题。2.双向遥测模式状态回传：无人机传感器数据经图数传模块压缩后，通过1.4GHz无线链路发回遥控器，由应用处理器解压并显示。协议支持：采用MAVLink协议实现飞控与安卓地面站深度交互，结合蓝牙传输
护照阅读器在医疗行业的应用 2401_83623586 科技
随着医疗全球化程度加深和患者流动性增加，护照阅读器在医疗行业的应用价值将愈发凸显。这项技术不仅解决了医疗机构的效率和安全问题，也为患者提供了更加顺畅、安全的就医体验，成为现代医疗信息化基础设施中不可或缺的一环。护照阅读器在医疗旅游中的革新应用跨境医疗旅游作为全球增长最快的健康产业分支之一，正经历着前所未有的扩张。据市场研究数据显示，全球医疗旅游产业规模预计在2025年达到惊人的1,250亿美元，年
llamaindex SimpleDirectoryReader的使用需要重新演唱 Loading llamaindex RAG llamaindex
SimpleDirectoryReader概念解释SimpleDirectoryReader是LlamaIndex中加载本地文件数据的最简单方式。对于生产用例，你可能更倾向于使用LlamaHub上提供的众多读取器之一，但SimpleDirectoryReader是开始使用的好方法。支持的文件类型默认情况下，SimpleDirectoryReader会尝试读取它找到的任何文件，并将它们都视为文本文件
clickhouse数据库表和doris数据库表迁移starrocks数据库时建表注意事项总结积跬步，慕至千里软件安装及程序错误解决方案集数据库 clickhouse
目录零、前言一、clickhouse数据库表在starrocks数据库建表时问题总结1.1数据类型类问题：1.2数据导出阶段：二、doris数据库表在starrocks数据库建表时问题总结2.1properties不支持的属性（直接删除）：2.2properties需修改属性2.3properties：doris建表语句分区明细，starrocks数据不需要明确设定，会自动更新2.4分桶设置问题2
r读取文件夹下的所有csv文件_R语言读取文件夹下多个文件并进行合并数据生成总数据文件... seiji morisako r读取文件夹下的所有csv文件
在流水化办公中，通常有格式统一的表格文件产生，但是到最后要将这一堆表格文件整合为大表却很揪心，累断手，如何用R语言进行一次性导入整合呢？假设我们将D:/input文件夹作为需要导入的表格的存放点，文件夹内所有文件均为此次需要导入数据，那么可以用以下程序进行操作setwd("D:/")#设定工作目录为D盘a=list.files("input")#list.files命令将input文件夹下所有文件
R 语言操作csv文件详解
在R中，我们可以从R环境外部存储的文件中读取数据。我们还可以将数据写入将由操作系统存储和访问的文件中。R可以读取和写入各种文件格式，如csv、excel、xml等。在本章中，我们将学习从csv文件读取数据，然后将数据写入csv文件。该文件应存在于当前工作目录中，以便R可以读取它。当然我们也可以设置自己的目录并从那里读取文件。获取和设置工作目录您可以使用**getwd()函数检查R工作区指向哪个目录
自组装mid360便捷化bag包采集设备 hero_heart 命令模式
一、问题一：电脑太重，换nuc采集mid360数据的过程中，发现了头疼的问题，得一手拿着电脑，一手拿着mid360来采集，实在是累胳膊。因此，网购了一个intelnuc,具体型号是12wshi5000华尔街峡谷nuc12i5厚版，买来之后，发现有点坑爹，windows系统下驱动啥都都挺全的，但是ubuntu下驱动貌似不全，1）有线网识别不了（也就是直接把mid360的网口数据线插到nuc上，识别不
【LLM】Llama-Index 架构 FOUR_A LLM llama 架构
数据源（DataSources）PDF/文档数据库API网页音频/视频知识库自定义源数据连接器（DataConnectors）用于从各种数据源提取和加载数据，以便进行索引和查询。1.SimpleDirectoryReader含义：简单目录读取器。功能：主要用于读取本地文件系统中的目录内容。它可以列出目录中的文件和子目录，通常用于文件管理或数据预处理阶段。例如，在一个数据处理项目中，你可能需要列出某
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
技术解析｜可灵AI全球首部AI单元剧《新世界加载中》工作流揭秘：提示词工程如何解决口型同步/复杂动作生成？
昨天，在北京首映礼的暗场中，一段黏土风格的荒诞喜剧画面投映在银幕上：一根「宇宙肥肠」在太空中漂浮，讽刺着人类对虚假进步的盲目崇拜。这便是快手可灵AI与异类Outliers团队共同推出的《新世界加载中》，全球首部AI单元剧集。这部与传统短剧不同的全新作品，用全新的呈现方式为观众带来了更具视觉冲击力的视觉效果和观影体验，成为AIGC领域的创新之作。然而，涵盖7个不同题材的单元剧集，必定涉及复杂的人物表
软考（软件设计师）数据库原理-数据库规范化理论，四大范式，完整性约束
关系数据库规范化理论，四大范式，完整性约束关系数据库规范化是一种组织数据库表结构和字段的技术，目的是减少数据冗余、消除更新异常，并确保数据依赖的合理性。一、范式基本概念范式（NormalForm）是符合某一种级别的关系模式的集合，分为1NF、2NF、3NF、BCNF、4NF、5NF等，级别越高约束越严格。二、各范式详细说明1.第一范式（1NF）要求：表中每个字段都是原子性的，不可再分每个字段具有相
从0开始学习R语言--Day41--Moran‘s I Chef_Chen 学习
在处理带有空间特征的数据，我们往往都直接一股脑地处理数据点，但很多时候，空间上的信息对于处理后续衍生出来的问题会有很大帮助，例如对于城市里大小县城的发展情况，只知道单一县城的经济发展曲线，很难解释一些拐点和突然的攀升，而如果知道相邻县城存在经济发展飞快的例子，可能就是被带动了经济水平；亦或者是在处理社交网络的好有问题时，只知道谁和谁是朋友（类似于空间矩阵），是无法推断出经济收入相似的推论的，所以说
【PTA数据结构 | C语言版】输出 1 ~ n 秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目给定正整数n，输出1~n，每个数字占一行。本题旨在测试不同的算法在各种数据情况下的表现。各组测试数据特点如下：数据0：测试基本正确性；数据1：n=1；数据2：n=1000；数据3：n=10000；数据4：n=100000；数据5：n=1000000。输入格式:输入在一行中给出正整数n(≤10^6)。输出格式:输出1~n，每个数字占一行。输
UniApp的学习 xuzhihuan焕 uni-app 学习
一.Vue.js基础基本概念：总之，Vue.js是一个简洁、灵活、高效的前端JavaScript框架，具有响应式数据绑定、组件化开发、虚拟DOM等特点，适用于构建各种类型的Web应用。Vue.js介绍：了解Vue.js的起源、特点以及基本概念。特点：简洁易用：Vue.js的API简洁明了，学习曲线较为平缓，使得开发者能够快速上手。响应式数据绑定：Vue.js提供了响应式的数据绑定机制，当数据发生变
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>