qianshanding0708

从 0 到 1 搭建技术中台之 ID 生成服务实践

前言

ID 生成器在前后端系统内都比较常见，应用场景广泛，如：订单 ID、账户 ID 、流水号、消息 ID 等等。常见的 ID 类型如下：

UUID 和 GUID：GUID 和 UUID 本质类似，GUID 来源于微软。一个 UUID 是一个 16 字节 (128 bit) 的数字。UUID 由网卡 MAC 地址、时间戳、名字空间 ( Namespace )、随机或伪随机数、时序等元素进行生成。优点：在特定范围内可以保证全局唯一；生成方便，单机管理即可。缺点：所占空间比较大；无序，在插入数据库时可能会引起大规模数据位置变动，性能不友好。
数据库自增 ID：主要基于关系数据库如 MySQL 的 auto_increment 自增键，在业务量不是很大时使用比较方便。基于数据库自增字段也有一些变种，如下面会介绍到的号段模式。优点：实现成本低，直接基于 DB 实现，不需要引入额外组件；能够实现单调自增，递增场景友好。缺点：需要考虑高可用、横向扩展问题。
snowflake ：雪花算法由毫秒时间戳 ( 41 位) + 机器 ID( workerId 10 位) + 自增序列 ( 12 位)，理论上最多支持 1024 台机器每秒生产 400w 个 ID。雪花算法综合考虑了性能、全局唯一、趋势自增、可用性等，是一种非常理想的 ID 生成算法，也是伴鱼内部使用最为广泛的 ID 生成算法。

伴鱼内部也有很多 ID 生成的需求，像是我们的订单、支付单、一对一课程、绘本、 IM 聊天消息、账号等等。ID 类型上也基本脱离不了上面几种，但是使用质量上参差不齐。

背景

第一阶段：各自封装

伴鱼早期业务量比较少，各系统基本都是有自己的 ID 生成模块，有基于 TiDB 自增 ID 的，有基于 UUID 的，也有基于雪花算法的，其中雪花算法也被称为 snowflake ，使用最为广泛。各自封装模块比较简单，但是实现分散、各系统模块的质量也很难统一保证。

第二阶段：集成框架

为了解决上述分散实现的问题，我们统一实现了一个综合各类 ID 生成功能的基础库，供业务方统一调用。统一基础库解决了分散调用问题，但是对于 snowflake 这种带有 workerId 的算法，需要业务系统关注 workerId 分配的逻辑。于是，我们把 snowflake 的逻辑封装到了服务治理框架内，服务启动时，由框架来负责 workerId 的分配和服务内的唯一性。

第三阶段：idgen 服务

封装到框架后，同一服务的不同实例之间可以很好的处理 workerId 的分配问题。但是， workerId 的逻辑也使得服务内多个实例成为了有状态实例， K8s 部署也只能使用 StatefulSet 。最近两年，伴鱼业务量突飞猛进，系统数量暴增，业务对系统的稳定性、弹性提出了更高的要求，我们需要 ID 生成逻辑非常稳定、高效，我们需要服务实例都是无状态实例 Deployment ，使服务具备快速滚动升级、弹性伸缩的能力。基于这样的背景，我们决定提供一个单独的 ID 生成服务，需求如下：

支持 DB 号段和 snowflake 两种模式
ID 生成器自身的可用性、稳定性非常高，具备时钟校准能力
TP99 必须非常低
兼容现有逻辑，业务迁移要非常方便
服务使用 Deployment 部署

伴鱼的 ID 生成器能基本经历了以上三个阶段，可能有人会有疑问: 开源 ID 生成服务也不少，为什么不直接使用开源项目呢？这里有三点考虑：

开源 ID 生成服务基本以 Java 实现为主，比如 Leaf、tinyid ，我司的技术栈以 Go 为主。
历史原因，我司之前都是使用 slowId （后面有介绍，防止 js 中精度丢失的简单处理）的方式，即使直接使用开源项目也一定要进行二次开发。
ID 生成本身并不复杂，以上开源项目也缺少必要的时钟回退、多节点时钟校验等优化。综合考虑下来，我们还是决定自己开发，后续也有开源的计划，期望能为 Go 社区做些贡献。

基于以上背景和需求，我们打造了伴鱼第一代 ID 生成服务: idgen 。

系统设计

DB 号段模式

号段模式可以理解为对 DB 自增 ID 方案的优化，本质是利用批量获取的方式，定期获取一个号段，缓存在本地供外部使用，减轻 DB 的压力，提升对外服务性能。交互形式如下:

snowflake 模式

snowflake 是 Twitter 于 2010 年首次对外公开，其值为 64 位整数，可以做到全局唯一。构造如下:

系统优化

号段模式优化

双 buffer 提升性能、减少毛刺

DB 号段模式的原理比较简单，但是上面的实现方案也有一定的潜在风险。首先，任一节点的号段耗尽时都需要从 DB 中取出下一个号段再返回 ID ，这个延迟会造成一定的请求毛刺。其次，如果请求 DB 的时候出现网络错误、慢查询，对于可用性方面也带来了一定的挑战。

针对毛刺问题，我们可以同时分配两个 buffer ，当其中一个 buffer 消耗到一定阈值时，异步更新下一个 buffer，这个阈值是可调整的。双 buffer 交互方式如下:

动态步长

一个号段的使用时间是由消费速度和 buffer 长度决定的。为了尽最大可能提升可用性， buffer 自然是越长越好，这样在 DB 出问题时，我们还能抗一段时间。但是， buffer 太长有坏处，如果程序异常退出、正常重启，buffer 太长很容易造成巨大的 ID 空洞。所以我们根据 ID 消耗速度和规划时间，动态调整 buffer 的长度，尽量在提升可用性的同时避免 ID 空洞。

snowflake 优化

snowflake workerId 分配机制

workerId 在 snowflake 内必须保证全局不重复，范围在 0-1023 之间 (如果调整各个段落的位数，会发生变化)。可以通过对实例打标记的方式，分配 workerId ，但是打标记会给实例带来一定的状态，我们还是期望实例是无状态的 ( idgen 服务通过 K8s Deployment 模式部署)。etcd 可以充当全局 coordinator 的角色，通过 etcd 原子分配的方式，我们可以比较容易获取到全局唯一的 workerId 。

snowflake 容错机制

snowflake 本身的容错有两点，一是防止自身节点时钟回拨，另一点是防止节点自身时钟不正确。

时钟回拨

对于时钟回拨，我们会在 etcd 内记录节点上次的时间，节点启动时，根据节点 ID 从 etcd 取回之前的时间。如果判定回拨非常少，我们可以等待回拨时间过后，正常启动。如果回拨过大，节点直接启动失败并报错，报错后人为介入处理。这里还有一个细节，节点是定时上报的，假设每 interval 秒上报一次当前时间，如果节点失败后被快速拉起，新节点和旧节点之间可能存在时间冲突的风险。对于这种情况，我们采取上报时间为 now + interval 秒的方式，这样新节点需要超过这个时间戳，问题自然解决 (或者新节点启动时等待 timestamp + interval 秒以上，启动不是太顺滑，不推荐)。

多节点时钟校验

对于时钟错误，机房都会有 NTP 调整时钟，一般机器都不会有问题。为了进一步降低时钟错误风险，每个节点会定期上报自己的节点信息 ( IP / Port) 到 etcd ，同时每个节点都有一个 rpc 方法，可供外界获取本节点的时间戳。一个新节点启动时，会通过 etcd 注册的其他节点信息，并发调用 rpc 方法获取其他节点的时间戳，然后一一对比，如果差异过大，则代表本节点时间戳可能有问题，直接报错，人为介入处理。

这里大家可能会有两个个疑问：

一是为什么不采用把各个节点上报时间戳到 etcd ，新启动节点直接取 etcd 内的时间戳进行逐个判断呢？

这里主要考虑时间校准的准确性，如果各节点定期上报时间戳，各节点时间戳差异会比较大，这会导致我们判断时间偏差的幅度比较大，准确性会下降。

二是如果第一个节点时间戳是错误的，后续正常节点启动怎么办？

首先，这种情况发生的几率非常低并且此时我们启动正常节点时肯定会报错，人为介入。报错时，直接停掉异常节点，然后逐个启动正常的新节点，第一个新节点启动时， etcd 内也没有其他节点信息，无需校验。

接口优化

批量获取

有一些业务会有这样的顾虑，虽然 idgen 服务进一步提升了服务稳定性和可用性，但是多了一次 rpc 调用，貌似也不是很划算。首先，这种 rpc 调用其实在整个业务逻辑里耗时占比微乎及微，所以一般都不会成为问题。但是，有的服务就是特别在意，比如它内部可能是个循环调用，每次 rpc 请求，循环 100 次调用 idgen 服务，针对这种情况，我们提供了一个批量获取 ID 的 rpc 方法。批量的个数和上限都是按照接口超时时间和每秒生产数做一个折中。这里其实还有其他方法可以进一步降低整体耗时，比如我们提供具备 pipeline 功能的 sdk ，业务系统看起来还是一个一个获取，其实 sdk 层面都是缓存 + 批量获取的方式，这样获取 ID 的性能也会比较好。

伴鱼特色

slowId

由于历史原因 (和前端 js 交互，使用 float 类型，js 没有 int64 类型，如果直接使用原生 snowflake 会出现精度损失)，我司不少服务使用了 snowflake 的变种: 由 41 bit 毫秒级时间戳，10 bit 的 workId ，以及 1 位的自增序列组成的 ID 返回给前端，虽然没有精度损失，但是这种 ID 获取方式性能比较差 (每毫秒最多两个 ID )。所以，如果大家有跟前端 ID 交互，优先选择字符串类型，目前我司不少服务也已经逐渐迁移为标准 snowflake 。

业务迁移

idgen 服务上线后，开始推动业务系统进行接入。

迁移准备

我们首先通过代码扫描的方式，整理出一份当前使用到 id 生成库的服务列表。然后，逐个业务负责人沟通迁移，同时，我们也提供了 rpc 服务的简单封装函数，业务改动非常小，对接成本非常低。

切换时冲突

在对接的过程中我们发现，由于以前的服务使用了 0-X (实例部署个数) 这段 workerId ，如果 idgen 也使用这段 workerId ，在切换的过程中，有一定的概率造成 ID 重复。所以，我们在 idgen 服务增加了手工指定 workerId offset 的功能，优先将 idgen 的 workerId 调到一个比较大的起始区间，迁移冲突的问题就解决了（后续迁移完成之后，我们可以在调回到 0-X 区间）。

总结

目前 idgen 服务已经对接了大几十个服务，高峰期 TP99 在 3ms 左右，一直稳定运行。下一步，除了对接更多的服务，我们会进一步提升 idgen 的稳定性和性能，包括提供定制化的客户端、一定的 ID 缓存机制等等。另外，目前内部正在进行框架剥离，剥离后我们会把 idgen 开源出去，希望能为 Go 社区也提供一个企业级的 ID 生成项目。

代理 IP 行业现状与未来趋势分析跨境Kevin tcp/ip 网络 web安全
随着互联网的飞速发展，代理IP行业在近年来逐渐兴起并成为网络技术领域中一个备受关注的细分行业。它在数据采集、网络营销、隐私保护等多个方面发挥着重要作用，其行业现状与未来发展趋势值得深入探讨。目前，代理IP行业呈现出以下几个显著特点。一是市场需求持续增长。在大数据时代，企业对于数据的渴望日益强烈，数据采集工作需要大量的代理IP来突破网站限制，获取全面准确的信息。同时，网络营销从业者为了精准投放广告、
python爬虫系列课程4：一个例子学会使用xpath语法 wp_tao Python副业接单实战项目 python 爬虫开发语言
python爬虫系列课程4：一个例子学会使用xpath语法本文通过一个例子，学会xpath的各种语法，可以作为xpath的查询手册使用，代码如下：fromlxmlimportetreetext='''firstitemseconditemthirditemfourthitem<liclass="item-0
【Java学习】内部类 Brookty java 学习
面向对象系列六一、类级别1.静态成员2.非静态成员与方法二、类的创建与成员管理1.类的创建2.类的成员管理三、常见的内部类1.非静态内部类2.静态内部类3.匿名内部类4.局部内部类一、类级别1.1静态成员静态成员是类级别的是能一路直属都是在类层面的，所在的区域一定是在最外层类变量空间中一层一层往里的，且它们的生命周期与最外层类共存，最外层类一加载它们也一层层往里加载好的，一路与类共存与最外层类共存
使用Selenium和bs4进行Web数据爬取和自动化(爬取掘金首页文章列表) 程序员霄霄软件测试 selenium 前端自动化软件测试功能测试自动化测试程序人生
前言：Web数据爬取和自动化已成为许多互联网应用程序的重要组成部分。本文将介绍如何使用Python中的两个强大库，即Selenium和BeautifulSoup，来实现自动化操作、网页数据提取以及网页内容分析。并以爬取掘金首页文章列表标题和url为例子进行讲解.安装和使用Selenium本文是在python环境下使用selenium，使用浏览器是火狐，系统是win10系统。python环境的配置这
强化学习——基本概念 AI大模型探索者人工智能 ai 深度学习机器学习语言模型
何为强化学习机器学习的一大分支强化学习（ReinforcementLearning）是机器学习的一种，它通过与环境不断地交互，借助环境的反馈来调整自己的行为，使得累计回报最大。强化学习要解决的是决策问题——求取当前状态下最优行为或行为概率。强化学习包括智能体和环境两大对象，智能体是算法本身，环境是与智能体交互的外部。智能体（IntelligentAgent），在人工智能领域，智能体指一个可以观察周
Kubernetes容器平台架构之道巨子嘉云原生 kubernetes 容器云原生
1.Kubernetes容器平台架构之道Kubernetes是一个开源容器编排平台，管理大规模分布式容器化软件应用，是云计算发展演进的一次彻底革命性的突破。Kubernetes是谷歌的第三代容器管理系统，是Borg独特的控制器和Omega灵活的调度器的组合。Kubernetes中的应用被打包成与环境完全分离的容器镜像，并且自动配置应用并维护跟踪资源分配。Kubernetes是以应用为中心的技术架构
python爬虫之自动化爬取网页陌小 python selenium python chrome
以下为公开源码fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionsimporttimefrombs4importBeautifulSoupurl='https://movie.douban.com/'chrome_optins=Options()chrome_optins.add_argument
Java练习 7-4 是不是太胖了 syh132167 java 算法开发语言
据说一个人的标准体重应该是其身高（单位：厘米）减去100、再乘以0.9所得到的公斤数。已知市斤的数值是公斤数值的两倍。现给定某人身高，请你计算其标准体重应该是多少？（顺便也悄悄给自己算一下吧……）输入格式：输入第一行给出一个正整数H（100
数学建模（6）——预测类模型目录 Ice-cream-AI 数学建模
预测模型是一类通过分析和建模历史数据来预测未来结果的算法或模型。这些模型广泛应用于各种领域，包括金融、医疗、市场营销、气象、制造业等。以下是一些常见的预测模型：1.回归模型线性回归（LinearRegression）：用于预测连续变量，通过拟合一个线性方程来最小化预测值和实际值之间的误差。多元线性回归（MultipleLinearRegression）：扩展线性回归模型，使用多个特征进行预测。岭回
RxJava使用和原理(一) linwq8 rxjava android java
基本介绍项目源码路径Github:RxJava介绍RxJava（ReactiveExtensionsforJava）是JVM的一个响应式扩展（ReactiveX）实现。它通过使用可观察的序列来组合异步和基于事件的程序。定义与原理RxJava是一个在JavaVM上使用可观测的序列来组成异步的、基于事件的程序的库。它扩展了传统的观察者模式，增加了对事件序列的丰富操作和变换能力。在RxJava中，被观察
Visual Studio Code配置Python开发环境 ai74583 python 开发工具 json
1.安装Python插件在VScode界面按Crtl+Shift+P或者F1输入extinstall直接安装Python，也就是点击它，然后等待，安装好后会提示你重启2.配置运行Python程序同样的打开命令面板（Crtl+Shift+P或F1），然后输入Tasks:ConfigureTaskRunner（中文输入：任务，然后选择任务：配置任务运行程序），选择Other此时VScode会自动生成.
虚拟机可以ping通本地，但是本地ping不通虚拟机，java.net.ConnectException: Connection refused YDXD_C 服务器 linux 网络 java
问题：之前可以连接到finallshel，突然不行虚拟机可以ping通本地，但是本地ping不通虚拟机开着VMware时直接重启后无法连接finallshelljava.net.ConnectException:Connectionrefused经过查阅，需要检查虚拟机防火墙（关闭）、电脑防火墙（关于虚拟机网段等部分要关闭，例：VMwarenetwork等）、虚拟机ip（与虚拟机网虚拟网络编辑器中
Python | 学习type()方法动态创建类胜天半月子 Python基础及应用 python 学习开发语言
getattr方法的使用场景是在访问不存在的属性时，会触发该方法中的处理逻辑。尤其是在动态属性获取中结合type()动态创建类有着良好的使用关系。type()方法常用来判断属性的类别，而动态创建类不常使用，通过如下的几个实例来学习使用：defsay_hello(self):print("Hello,I'maninstanceofadynamicallycreatedclass!")#使用type函
MyBatis 深度解析：MyBatis是如何简化 JDBC的？以恒1 mybatis
MyBatis深度解析：MyBatis是如何简化JDBC的？一、JDBC的痛点与MyBatis的诞生传统JDBC开发虽然灵活，但存在诸多痛点，导致开发效率低下且易出错：样板代码冗余：每次操作需重复编写连接管理、try-catch-finally块、资源释放等代码。例如，一个简单的查询需要至少20行代码处理异常和资源关闭。SQL与代码强耦合：SQL硬编码在Java类中，修改SQL需重新编译代码，且难
Python实用技巧：轻松上手自动化数据爬取与存储傻啦嘿哟 python 自动化开发语言
目录一、准备阶段：确定目标与安装工具1.确定目标网站2.安装Python及必要库二、编写爬虫程序：发送请求与解析网页1.发送HTTP请求2.解析网页内容三、处理反爬虫机制：应对挑战与策略1.设置请求头2.使用代理IP四、数据存储与处理：保存与分析数据1.存储为文本文件2.存储为数据库3.存储为Excel文件五、实战案例：爬取电商平台商品价格1.分析目标网站2.编写爬虫程序3.运行爬虫程序六、优化与
Azimuth Superresolution of Forward-Looking Radar Imaging Which Relies on Linearized Bregman论文阅读青铜锁00 论文阅读 Radar 论文阅读
AzimuthSuperresolutionofForward-LookingRadarImagingWhichReliesonLinearizedBregman1.论文的研究目标与意义1.1研究目标1.2实际应用意义2.论文提出的新方法、公式与优势（重点）2.1方法框架2.1.1贝叶斯建模2.1.2线性化Bregman算法2.2与传统方法的对比2.3公式总结3.实验设计与结果3.1点目标仿真3.
JavaScript--核心语法基础丿狴犴λ js javascript html 前端
JavaScript--核心语法基础1.编程语言2.js历史3.js的作用4.JS组成部分5.JS的使用5.1引入方式5.2script位置5.3语法规则5.46.变量（重点）6.1什么是变量？6.2创建变量6.3变量命名规则7、数据类型（重难点）7.1分类7.2基本数据类型7.3引用数据类型--对象（object）7.4数据类型的检测8.数据类型的转换8.1隐式转换8.2强制转换9.运算符9.1
使用 Vosk 实现语音识别分发吧语音识别 xcode 人工智能
在近两年里，如果说想要在本地部署离线语音识别模型，那么Whisper和FunASR肯定是首选项。所以为什么要使用Vosk呢？优势Vosk是一个离线开源语音识别工具包，它的优点在于：轻量：Vosk提供轻量级的模型（小于50MB大小），可以用于低功耗平台（例如Android、树莓派之类）多编程语言、多平台支持：Python、Java、Node.js、C#、C++、Rust、Go等多语种支持：支持二十多
Java面试题整理 Amberish java
exist和in有什么区别select*fromAwhereidin(selectidfromB)有两点区别：（1）使用上的区别：exists中放一个子查询有记录返回true，无记录返回false（NULL也算有记录），in中查询结果集只能有一个字段（2）性能上的区别：in要把缓存到内存中，exists不需要缓存结果in()适合B表比A表数据小的情况exists()适合B表比A表数据大的情况当A表
10个简单、有趣且适合初学者的Python编程实例！！ shuaige_shiwoa python+AI python 开发语言
好的！以下是10个简单、有趣且适合初学者的Python编程实例，每个例子都附带简要说明和代码（可直接运行）：猜数字游戏用户猜一个随机生成的数字，程序会提示“太大”或“太小”。importrandomnumber=random.randint(1,100)whileTrue:guess=int(input("猜一个1-100之间的数字:"))ifguess==number:print(“猜中了！”)
哪个python解释器好？ lmseo5hy python培训 python解释器
Python是一门解释器语言，代码想运行，必须通过解释器执行，Python存在多种解释器，分别基于不同语言开发，每个解释器有不同的特点，但都能正常运行Python代码，以下是常用的五种Python解释器：CPython当从Python官方网站下载并安装好Python2.7后，就直接获得了一个官方版本的解释器：Cpython，这个解释器是用C语言开发的，所以叫CPython，在命名行下运行pytho
本地大模型编程实战(11)与外部工具交互(2) 火云牌神 AI编程实战 python langchain llama deepseek
文章目录准备定义工具方法创建提示词生成工具方法实参以`json`格式返回实参自定义`JsonOutputParser`返回`json`调用工具方法定义通用方法用链返回结果返回结果中包含工具输入总结代码在使用LLM(大语言模型)时，经常需要调用一些自定义的工具方法完成特定的任务，比如：执行一些特殊算法、查询天气预报、旅游线路等。很多大模型都具备使用这些工具方法的能力，Langchain也为这些调用提
python编译安装vosk语音识别包 hzjxinyue python
不知道为什么，谁把vosk从pip源上删了。没办法只能自己编译安装了。下载源代码gitclonehttps://github.com/alphacep/vosk-api.git进入python文件夹cdvosk-api/python编译安装python3setup.pyinstall
webpack基础配置吃杠碰小鸡前端前端工具库 webpack 前端 javascript
文章目录一、默认入口和默认出口二、资源配置三、输出文件3.1多文件入口3.2HtmlWebpackPlugin插件四、环境4.1环境变量4.2热更新五、代码分离5.1公共模块5.2懒加载5.3预获取/预加载模块六、缓存七、TreeShaking八、公共路径webpack是一个用于现代JavaScript应用程序的静态模块打包工具，在许多项目中都有应用，但是往往平台搭建以后很少去修改配置，熟悉基础配
【探商宝】DeepSeek开源周第四弹：双向流水并行与专家负载均衡技术解析探熵科技数据分析人工智能
引言在千亿级大模型训练领域，计算资源利用率与通信效率是制约训练速度的核心瓶颈。DeepSeek开源周第四日重磅发布的DualPipe双向流水并行算法与EPLB专家并行负载均衡器（ExpertParallelismLoadBalancer），为解决这些难题提供了创新方案。本文将从技术原理、性能优势、应用场景三个维度深度解读这两项技术。一、DualPipe：重新定义流水线并行效率1.1传统流水线并行的
Eclipse极速安装指南：3分钟掌握Java开发环境三流搬砖艺术家 java java eclipse ide
目录为什么要选Eclipse？️准备工具清单步骤一：下载安装包⚙️步骤二：安装与配置步骤三：界面优化步骤四：创建第一个项目必装效率插件推荐❗常见问题排雷效率对比表为什么要选Eclipse？✅跨平台神器：Windows/Mac/Linux全支持✅免费开源：IBM开发，全球开发者共同维护✅插件生态强大：支持Java/Python/C++等20+语言✅智能代码提示：媲美IDEA的代码补全能力️准备工具清
WPS 加载项开发说明金山办公开发者 JSAPI二次开发 javascript
WPS加载项结构WPS加载项由自定义功能区和网页两部分组成。自定义功能区只需要一个配置文件，对应WPS加载项目录中的ribbon.xml文件；网页部分负责执行自定义功能区对应的逻辑功能。因为不需要显示网页，所以省略了HTML文件，并用main.js来引入所有的外部JavaScript文件；在这些JavaScript文件中通常包含了一系列用JavaScript实现的函数，这些函数与自定义功能区的功能
PythonLearn yadanuof yy的学习之路 python
简单数据类型数据类型转换int(x)float(x)str(x)chr(x)ord(x)hex(x)oct(x)bin(x)eval函数Python中的内置函数,用于去掉字符串最外侧的引号,并按照逻辑运算age=eval(input('请输入年龄:'))#将input读入的字符串类型转成了int类型,相当于int(age)print(age,type(age))#18hello='北京欢迎你'pr
Anaconda的详细配置过程（附图）椰卤工程师机器学习 anaconda tensorflow
Anaconda是Python的一个科学计算发行库，内置了上千个Python经常会用到的库，包括Scikit-learn、Numpy、Scipy、Pandas等。1.Anaconda下载下载地址：https://www.anaconda.com/download/官网下载速度很慢，慎用！建议通过国内镜像网站下载。Anaconda是跨平台的，有Windows、macOS、Linux版本，博主这里以W
yolo位姿估计实验 jarreyer YOLO
目录介绍实验过程2.1数据集下载2.2模型和数据配置文件修改2.3模型训练参考链接1.介绍1.1简介YOLOv8-Pose是基于YOLOv4算法的姿势估计模型，旨在实现实时高效的人体姿势估计。姿势估计在计算机视觉领域具有重要意义，可广泛应用于视频监控、运动分析、健康管理等领域。1.2背景传统的姿势估计方法常需复杂网络架构和大量计算资源，导致实时性不佳。YOLOv8-Pose通过对YOLOv4算法进
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh ickes@192.168.27.211 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_