字节数据平台

【无标题】

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群

背景介绍

Notebook 解决的问题

部分任务类型（python、spark等）在创建配置阶段，需要进行分步调试；
由于探索查询能力较弱，部分用户只能通过其他平台 or 其他途径进行开发调试，但部署到 Dorado时，又发现行为不一致等问题（运行环境问题），整体体验较差，需要提升探索查询模块的能力；
目前探索查询仅支持 SQL，可支持更多语言类型，扩展数据开发手段；

总体架构介绍

火山引擎DataLeap notebook 主要是基于 JupyterHub、notebook、lab、enterprise kernel gateway 等开源项目实现，并在这些项目的基础上进行深度修改与定制化，以满足火山引擎DataLeap用户的需求。

基础组件方面，主要是基于 TCE、YARN、MYSQL、TLB、TOS。

核心目标是提供支持大规模用户、稳定的、容易扩展的 Notebook 服务。

系统总体架构如下图所示，主要包括 Hub、notebook server（nbsvr）、kernel gateway（eg）等组件。

多用户管理

Hub

JupyterHub 是一个支持 “多用户” notebook 的 Server，通过管理 & 代理多个单用户的 notebook server 实现多用户 notebook。

JupyterHub 服务主要三个组件构成：

a Hub (tornado process), which is the heart of JupyterHub;
a configurable http proxy (node-http-proxy): 动态路由用户的请求到 Hub 或者 Notebook server；
multiple single-user Jupyter notebook servers (Python/IPython/tornado) that are monitored by Spawners;
an authentication class that manages how users can access the system;

整个系统架构图如下所示：

用户通过 IP 地址或者域名访问 JupyterHub，基本流程为：

启动 Hub 服务，Hub 会启动 proxy 进程；
用户请求 Hub，请求会被打到 proxy，proxy 维护了 proxy table，每条 mapping 记录为用户请求到 target IP 或者域名的映射；proxy table 不存在当前请求的 mapping 时，proxy 默认把请求全部打到 Hub；
Hub 处理用户认证与鉴权，同时 Hub spawner 启动一个 Notebook server；
Hub 配置 proxy，路由该该用户的请求到创建的 notebook server 处；

1、火山引擎DataLeap authentication Hub 原生地支持 authentication，主要是用来解决多租户的问题。Hub 里主要是使用 authenticator 类来进行 authenticate 。

Hub 原生支持的 authenticator 主要有一下几个：

Local authenticator, work with local Linux/UNIX userst
PAM authenticator, authenticate local UNIX users with PAM
Dummy authenticator, any username + password is allowed for testing

考虑到方案1需要开发量大、维护成本高，我们采用了方案2。

采用了方案2的整个认证 & 鉴权步骤如下所示：

用户在 web 页面访问了火山引擎DataLeap notebook，frontend 会带上 session 信息请求 hub post /api/users/{name}/tokens api 获取一个 token，该流程需要 authenticate & authroization，包括：
通过 titan 认证该 sessionid 对应的 user；
通过火山引擎DataLeap backend ProjectControl /project/canedit api 验证用户是否具有项目权限；
后续该用户的访问均会带上 token，Hub 会使用该 token 进行用户认证。
每次生成的 token 会保存到 db；
认证时也是从 db 进行匹配；
Token 存在 expire time，expired 的会被从 db 清理掉；

2、TCE Spawner Spawner 负责启动 single-user notebook server，其本质是一个进程的抽象表示，一个定制化的 spawner 实现下面三个方法：

start the process
poll whether the process is still running
stop the process More info on custom Spawners. See a list of custom Spawners on the wiki.

目前我们的服务不是运行在物理机上，所以不会通过 k8s 管理 server & kernel。考虑到运维 & 扩展，我们考虑使用 TCE 作为 notebook server 的载体，因此我们需要实现 TCE Spawner。

设计 TCE spawner 时，有以下几点考虑：

Spawner.state 需要包含 service id、cluster id、psm、api token 等信息，这些信息会持久化在 db 中；hub 重启或者 server 关闭后，重新启动 notebook server 时，保证同一个用户映射到之前该用户启动的那个 sever（same user same server）；
为了加快启动过程，spawner 确认 tce 实例启动时，一旦发起了 tce cluster deployment 后就开始 sd lookup psm 确认 server 是否正常启动，不通过 poll deployment status 确认是否部署完成，这可以加快启动过程，因为 tce 部署过程中包括健康检查等步骤，占时较长；
Stop 中，并不真正 kill tce 实例，这样下次启动基本不消耗时间；
Poll server 状态时，需要考虑升级 & migrate 带来的状态变化，一旦发现立刻返回异常状态，这样 hub 就会认为这个 notebook server not running，就会异常该 spawner，后续新的请求到来时会重新启动 spawner，由于此时已经非第一次启动，过程极快，用户不感知。

整个 TCE spawner，主要用到了 tce 的两个特性：

Psm 唯一对应了一个服务；
通过 psm 发现 ip & port；
通过 tce 的 api 获取 server 状态；
方便运维（升级 & 迁移）；

题外话：最近调研了 server on yarn ，有点类似 k8s 的感觉，本质上都是走资源调度，但是 yarn 资源调度有个缺点：每个 application 调度到 yarn 时，都需要伴随一个 Application Master。虽然 AM 大多数时候主要是用来和 RM 保持心跳，只需要 0.5 核即可，但是总感觉很别扭，或者说多了一个不稳定的因素。

3、State isolated

(1) Hub migration

原生 jupyter hub 的升级或者实例迁移时，需要把所有的 spawner & server 关闭掉。这意味着，hub 实例变化后，之前的 server & kernel 都会被关闭。

由于当前系统采用了 remote server + remote kernel，且不会主动 shutdown kernel，因此当 hub 实例发生变化时， server & kernel 实例不会被关闭。但是新 hub 实例启动后，所有的 server 都将连接不到新的 hub 实例上，会产生幽灵 server & kernel。

我们提供了如下解决方案：

在 notebook server 里增加定时检查线程，根据 hub 的 psm 检查对应的 ip & port 是否发生改变；
如果发生改变，则切换 hub_activity_url & hub_api_url。如此，notebook server 就可以连接到新的 hub 实例了。

(2) Notebook server migration

如果 notebook server 实例升级或者迁移了，hub 也需要能及时感知，并能正确关闭 spawner。

这个目前是通过 tce spawner poll 实现，poll 里会 check 对应的 notebook server 的 ip & port 是否发生变化，如果发生了变化则返回非零状态，表示 server 异常，此时 hub 感知到并关闭 spawner。后续，用户的请求到来时，会重新创建 spawner 并连接到同一个 notebook server。

Resource pool

Pool 的设计有两个考虑：

Tce 资源无法独占；
Server 启动慢；

由于 notebook server 是启动在 TCE 上的，TCE 上启动一个 server 需要经历如下几个关键阶段：新建 service -> 新建 cluster -> 部署（构建镜像、部署）-> 一些检查整个过程耗时较长，预计耗时3-5分钟，如果每个 server 的启动过程都需要这么久，显然是无法接受的。

于是，我们申请了新建了一堆 tce 实例构建成 tce resource pool。每次新项目接入，Hub spawner 按照如下流程处理：

去 tce resource pool 中检查是否存在未被占用的实例，有则挑一个
否则，走原新建流程；

目前 pool 的建立是手动操作的，后期会支持自动检测扩容：

定时线程，检测当前 pool 的容量是否少于 30 （例如）；
少于则新建并加入 pool 中；

另一个问题是：pool 里的每个实例均需要支持 psm 服务发现，那么在 server 被分配前，他们处于什么状态呢？被分配后，如何按照 user 对应的配置启动 server 呢？ Pool 里的实例，均是启动了一个 idle server（原生的 notebook server）（该方式可以让该实例成功启动，并且能被服务发现），同时存在一个定时线程，不断去检查 tos 对应的配置文件是否 ready，ready 后 shutdown idle server，按照 tos 配置文件启动 single user notebook server。

这种方式后，启动时间从 3min+ 降到 8s，8s 为 single user notebook server 启动并稳定提供服务的时间。

Kernel 管理

book 存储

Notebook 中的代码和输出文本主要是通过后缀为 .ipynb 的 json 文件存储的，因此 notebook server 需要负责 ipynb 文件的新建、删除等管理。

Notebook server 对 notebook 的存储是通过 FileManager 来实现的，FileManager 主要负责 ipynb 的创建、保存、删除、重命名等文件操作，另外还会进行 ipynb 文件的 format 检查以保证格式正确。

FileManger 保存文件是通过 local filesystem 实现的。为了持久化存储 ipynb 文件，我们在 FileManager 中嵌入了 tos 文件存储的功能。具体过程为：

首次创建时，在本地生成 ipynb 后，并往 tos 上 put 一份；
每次更新保存时，在本地更新后往 tos put 一份；
每次打开 ipynb 时，首先判断本地是否存在对应的 ipynb 文件，如果不存在则从 tos 拉取；如果存在则不做拉取操作；
删除操作只是删除了本地的文件，没有删除 tos 的那份。

kernel 管理

当我们在页面上打开一个 notebook 任务时，notebook server 会尝试启动一个 kernel 来执行你点击运行的代码。火山引擎DataLeap上每个 task 都和一个 kernel 对应，notebook server 负责维护每个任务的 kernel。

Notebook server 是通过 KernelManager 来维护 kernel 信息的，KerneManager 负责 kernel 的启动、重启、删除等操作。

默认情况下，Kernel 是启动在 notebook server 所在的运行容器里，这种情况下单个 server 里无法支撑起大规模 kernel。

代理

如上一节所述，notebook server local 模式不支持大规模 kernel 的扩展，适用于小范围使用，主要原因有如下两点；

kernel 都是在 notebook server host 内启动的，单机必然无法容纳大规模 kernel ；
Kernel 间没有隔离，只是进程间的隔离，资源 & 执行环境等没有很好的隔离与定制化；

Enterprise kernel gateway （简称 EG）主要致力于解决上述问题，采用了 EG 的系统架构如下所示：

技术上来讲，EG 部分扩展了 notebook server 的功能，然后作出了如下改动：

复用 notebook server 中的 API （kernel 管理部分）；
提供了 WS 的管理；
基于 notebook server 中 MultiKernelManager & KernelManager & SessionManager，做出扩展，提供了 RemoteMappingKernelManager；

从图中可以看出，client 并非是 notebook 相关的系统，也可以是其他系统，这意味着可以直接把 EG 当成 Code Execution Server，只需要其 ws client 遵循 Jupyter msg protocol。

代理架构

在火山引擎DataLeap notebook 系统中，上图中的 client 即为 notebook server，此时 notebook server 只负责管理 notebook 文件（创建、读写、保存、删除），kernel 部分的操作全部转发给 EG 进行处理（注意这里的转发包含 http 转发与 ws 转发）。详细如下图所示：

用户在浏览器运行一段代码，整个交互流程如下图所示：

EG proxy 的详细过程参考：

当前 EG 支持往 yarn、k8s 等业界常用资源管理系统提交 kernel 。我们当前只支持 remote kernel on yarn ，后续考虑支持 k8s。

远程 Kernel

1、Remote kernel on yarn

开源 EG 往 yarn 上提交任务主要是使用 yarn_client，该 client 基于 yarn rm restful api 进行资源探查 & 任务的提交 & 状态轮询 & kill 等操作。公司内并非开放相应的 rest api，因此需要基于 YAOP 进行相应的改造。

2、Kernel configuration

开源 EG 往 yarn 上提交任务暂不支持指定动态参数，比如队列选择、镜像选择等等 yarn 参数。我们进行了简单的改造，可以支持用户设置更为丰富的 yarn 参数，来定制个性化执行环境。

3、Async

开源社区的版本没有完全异步化，为了单 eg server 支持更多的 kernel，我们做了完全的异步化改造。优化前，只能支持 10+ kernel，优化后，能够支持 100+ kernel（上限没具体测试过）。

4、image

支持用户选择自定义镜像启动 kenrel，该特性支持用户在 kernel 中安装自己需要的环境，极大地提高了 kernel 使用的场景。

定时调度

调度原理

Notebook 调度执行不同于每个 cell 里的人工调试执行，它需要定时自动执行，每次都是直接 run all cell，并且把执行结果保存在 notebook 里。

Jupyter 提供了可以直接执行一个 ipynb 文件的工具：nbconvert。nbconvert 会根据 ipynb 里的 kernel 信息启动对应的 kernel 来执行 ipynb 里的每个 cell，其本质上执行了 notebook kernel 启动 + run each cell 的功能。

但是 nbconvert 只能启动 local kernel，而目前系统是 remote kernel on yarn，这可以通过把 nbconvert 提交到 yarn 上，然后在 yarn 上运行上述过程。当然，这其中涉及到了 pyspark 任务的提交原理，总的来说，notebook 任务具备和 dorado 上其他任务一样的定时调度功能。

结束语

Jupyter Notebook 诞生至今，已数年有余，期间不断出现 Zeppelin、PolyNote、Deepnote。尽管如此， Jupyter Notebook 仍然拥有最大量的用户群体与比较完整的技术生态，因此我们选择了 Jupyter Notebook 做深度定制与改造来服务用户。

当前火山引擎DataLeap Notebook 已经基本具备了离线数据探索的能力，这些能力已经帮助了很多用户更好的进行数据探索、任务开发调试、可视化等。随着平台对流式数据开发的支持，我们也希望借助 Notebook 实现用户对流式数据的探索、流式任务的调试、可视化等功能的需求。相信不久的将来，Notebook 能够实现流批一体化，来服务更加广泛的用户群体。

点击跳转大数据研发治理套件 DataLeap了解更多

家用充电桩远程监控安全管理系统解决方案蓝蜂物联网物联网远程监控边缘计算物联网
家用充电桩远程监控安全管理系统解决方案在当今电动汽车日益普及的背景下，家用充电桩的安全管理成为了广大车主关注的重点问题。为了实现对充电桩的高效、精准、远程监控，一套完善的家用充电桩远程监控安全管理系统解决方案应运而生。本方案旨在通过先进的物联网技术、云计算、大数据分析以及人工智能等科技手段，构建一个集实时监测、异常预警、故障诊断、数据统计、远程控制于一体的智能化平台，确保充电桩的安全运行及用户充电
Android Profiler 功耗分析教程及案例 summerkissyou1987 android
以下是基于最新AndroidStudio工具链的EnergyProfiler功耗分析完整指南及实战案例，结合行业最佳实践和深度优化策略：⚙️一、环境配置与核心功能启用EnergyProfilerAndroidStudio→Profiler图标→连接设备（Android8.0+）→选择目标进程→点击Energy模块关键要求：测试设备需支持batteryhistorian数据采集（推荐Android1
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
Hadoop入门案例 'Wu' 学习日常大数据 hadoop hdfs 大数据
Hadoop的运行流程：客户端向HDFS请求文件存储或使用MapReduce计算。NameNode负责管理整个HDFS系统中的所有数据块和元数据信息；DataNode则实际存储和管理数据块。客户端通过NameNode查找需要访问或处理的文件所在的DataNode，并将操作请求发送到相应的DataNode上。当客户端上传一个新文件时（比如输入某些日志），它会被分成固定大小（默认64MB）并进行数据复
RabbitMq消息丢失解决方案回丿眸消息队列 rabbitmq
1、消息丢失的三种原因生产者：生产者写消息失败、消息发送到RabbitMq但是内部接收失败。消息队列：RabbitMq出现宕机，接收到的消息还在内存中，没有来得及消费，就会导致内存中的数据被搞丢啦。消费者：消费者还没有来的急处理就发生了宕机。1、解决消息丢失的方案。1)解决生产者丢失1、RebbitMq事务缺点：事务机制是同步机制，生产者发送消息会同步阻塞卡主等待发送结果，导致吞吐量降低publi
深入理解观察者模式及其JavaScript实现布兰妮甜 javascript 观察者模式网络
Hi，我是布兰妮甜！观察者模式（ObserverPattern）是一种行为设计模式，它定义了对象之间的一对多依赖关系，当一个对象的状态发生改变时，所有依赖于它的对象都会得到通知并自动更新。这种模式在事件处理系统、数据绑定和发布-订阅系统中广泛应用。文章目录一、观察者模式的核心概念二、观察者模式的优点三、JavaScript实现观察者模式1.基本实现2.更实用的例子-天气预报系统3.使用函数作为观察
JOIN顺序优化：小表驱动大表的执行原则数据狐（DataFox） 2025年爬虫实战项目 sql 性能优化数据库
在数据库查询优化中，特别是在使用SQL语句进行数据查询时，遵循“小表驱动大表”的原则是一种常见且有效的策略。这个原则的核心思想是首先处理小表，然后再与大表进行连接操作，这样可以显著提高查询的效率。下面详细解释这一原则及其背后的原因：为什么“小表驱动大表”有效？减少数据扫描量：当数据库系统执行JOIN操作时，如果先处理小表，那么只需要扫描小表中的每一行与大表中的行进行匹配。这样可以大幅度减少需要扫描
分区表设计：历史数据归档与查询加速
以下从核心原理、归档设计与查询优化三个维度系统阐述分区表技术，结合主流数据库实践提供可落地方案：‌一、分区表核心原理与价值‌‌物理存储与逻辑分离‌‌分区策略‌：通过分区键（如时间戳、ID范围）将单表数据划分为多个物理子表（分区），逻辑上仍视为整体表。‌双重优化机制‌：‌集群级‌：通过DISTRIBUTEBY分布数据到不同节点，实现负载均衡；‌节点级‌：通过PARTITIONBY在节点内细分数据，减
C++中的面向对象编程克斯维尔的明天_ c++开发语言
C++OOP面向对象编程，顾名思义，在编程中使用对象。面向对象编程旨在在编程中实现现实世界的实体，如继承、隐藏、多态性等。OOP的主要目标是将数据和对它们进行作的函数绑定在一起，以便代码的其他部分除了该函数之外，其他任何部分都无法访问这些数据。概述Class类C++中面向对象编程的构建块是Class。它是一种用户定义的数据类型，充当蓝图，表示一组共享一些常见属性和行为的对象。这些属性存储为数据成员
服务器异常宕机或重启导致 RabbitMQ 启动失败问题分析与解决方案代码怪兽大作战 RabbitMQ 服务器 rabbitmq 宕机启动失败
服务器异常宕机或重启导致RabbitMQ启动失败问题分析与解决方案一、深度故障诊断与解决方案1.权限配置不当故障2.端口占用故障3.数据目录残留故障二、故障类型对比与诊断矩阵三、完整恢复流程（10步法）四、风险规避与最佳实践️数据保护策略预防性配置五、高级故障排除技巧诊断工具集容器特有故障处理容器维护命令速查主机与容器方案对比总结⚡快速恢复决策树六、总结当服务器异常宕机或重启后，RabbitMQ启
【Python基础】14 内存管理与性能优化智算菩萨 python 性能优化开发语言
前言在现代软件开发中，性能优化已经成为每位开发者必须掌握的核心技能。Python作为一门高级编程语言，虽然在语法简洁性和开发效率方面具有显著优势，但其解释型语言的特性也带来了性能上的挑战。深入理解Python的内存管理机制，掌握有效的性能优化策略，不仅能够帮助我们编写出更高效的代码，还能在处理大规模数据和高并发场景时游刃有余。本文将从Python内存管理的底层原理出发，深入探讨垃圾回收机制、内存分
BAAI/BGE-VL多模态模型部署、原理、代码详解（实现图像文本混合检索），包含BEG-VL多模态模型的本地部署详细步骤及代码原理解析令令小宁 python 语言模型自然语言处理 nlp 人工智能
本文包含BGE-VL多模态模型的本地部署详细步骤及代码原理解析文章目录前言一、模型下载二、计算流程解析1.BGE-VL-base/Large2.BGE-VL-MLLM-s1/s2三、总结前言提示：这里可以添加本文要记录的大概内容：包含四个模型及数据集，数据集未开源，四个模型可以分别下载：其中，BGE-VL-base/Large是基于CLIP训练的模型，BGE-VL-MLLM-S1/S2是基于LLM
[精选] 2025最新MySQL和PostgreSQL区别、迁移、安全、适用场景全解析猫头虎数据库技术专区 #MySQL专栏 #PostgreSQL专栏 mysql postgresql 安全运维云原生数据库容器
[精选]2025最新MySQL和PostgreSQL区别、迁移、安全、适用场景全解析在当前的数据库技术领域，MySQL和PostgreSQL作为两大主流数据库，拥有各自独特的优势和应用场景。随着技术的不断演进，特别是2025年的最新动态和趋势，两者在功能、迁移、性能、安全性等方面都有了一定的变化和优化。因此，本文将通过详细的对比和分析，帮助初学者更好地理解这两种数据库，帮助你做出选择，或者顺利进行
mbuf 全面分析：从概念到应用的深度解析
一、mbuf基础概念与原理1.1mbuf的定义与基本原理mbuf（memorybuffer，内存缓冲区）是一种高效的内存管理机制，主要用于存储和处理网络数据包及其他需要临时存储的数据。它最初由BSD（BerkeleySoftwareDistribution）操作系统引入，并在后续的网络处理框架中得到广泛应用，特别是在高性能网络数据处理领域，如DPDK（DataPlaneDevelopmentKit
go channel用法三金C_C go golang channel
介绍channel在Go中是一种专门用来在goroutine之间传递数据的类型安全的管道。你可以把它理解成：多个goroutine之间的**“传话筒”**，谁往通道里塞东西，另一个goroutine就能接收到。Go语言采用CSP（CommunicatingSequentialProcesses）模型，也就是鼓励：“不要通过共享内存来通信，而要通过通信来共享内存”也就是通过channel来传递数据，
揭开 MCP 的神秘面纱：标准化 AI 上下文管理的未来(上) 愤怒的可乐大模型自然语言处理人工智能 python 开发语言
引言最近MCP大火，本文尝试揭开它神秘的面纱。文章较长，分为上下两篇。架构MCP协议遵循客户端-主机-服务器架构，其中一个主机应用运行多个客户端实例，每个客户端实例维护了和服务器建立的独立的连接。Host：希望通过MCP访问数据的程序，比如一个聊天应用程序。Client：与服务器保持1:1连接(会话)的客户端，Host通过这个Client连接不同的Server提供的功能。Server：通过MCP公
手把手从零打造 Llama3：解锁下一代预训练模型会飞的Anthony 信息系统人工智能 AIGC 自然语言处理人工智能 llama3 AIGC
引言Llama3相较于Llama2，不仅在模型架构上做了显著优化，尤其是全局查询注意力机制（GQA）的引入，使得模型在大规模数据处理上表现更加出色。同时，Llama3采用了与GPT一致的tiktoken分词器，大幅提升了分词效率。本篇文章将带你从头构建Llama3预训练流程，深入了解其关键细节和实现方式，让你掌握这一下一代模型的核心技术。1.启动训练脚本在这一步中，我们将实现Llama3的预训练框
Redis缓存击穿、缓存穿透、缓存雪崩(定义、产生原因、解决方案--代码示例) 卜锦元 redis 数据库数据优化缓存 redis 数据库
前言Redis缓存作为高性能的数据访问层，在实际开发中经常面临三大经典问题：缓存击穿、缓存穿透、缓存雪崩。本文将从它们各自的定义、产生的原因、实际开发过程中的解决方案出发，为大家详细描述相关的信息，并附有相关的go代码示例（嗯…最近go写的比较多，大家也可以用其它语言带入，原理都是一样的）一、缓存穿透（CachePenetration）❓是什么？客户端频繁请求数据库中根本不存在的Key，缓存不命中
Redis主从复制详解卜锦元 redis 高可用性数据库 redis 数据库 linux 缓存
前言本文对于redis主从复制相关知识进行详细的解释，主要从主从复制的原理、配置方式、数据流转过程、重要概念与机制、常见问题与解决方案、典型使用场景、局限性与处理方案等方面出发，帮助我们更好的理解Redis的主从复制知识。一、Redis主从复制原理（Replication）主从复制是指一个Redis主节点（Master）将数据同步到一个或多个从节点（Slave/Replica），从节点一般以只读方
抗辐照芯片在核电厂火灾探测器中的应用优势与性能解析国科安芯科普网络人工智能运维自动化
一、引言核电厂作为能源供应的关键设施，其安全性备受关注。火灾是威胁核电厂安全运行的重要风险因素之一。在核电厂的特殊环境下，火灾探测器肩负着及时发现火情、保障核电厂安全运行的重任。然而，核电厂存在高能辐射等复杂环境因素，这对火灾探测器中的芯片性能提出了极为严苛的要求。传统芯片在辐射环境下易出现性能退化、功能异常等问题，导致火灾探测器无法准确工作。因此，研发和应用抗辐照芯片成为解决这一问题的关键。抗辐
Boost.Asio 同步读写操作详解
Boost.Asio同步读写操作详解Boost.Asio是一个高效的C++网络和底层I/O库，提供了多种API用于同步和异步数据传输。本文将详细介绍同步操作及其具体实现，包括write_some、send、write、read_some、receive、read和read_until等。1.同步写：write_some功能:将指定数量的字节写入到套接字。如果发送缓冲区已满，则只写入一部分数据并返回
如何训练一个 Reward Model：RLHF 的核心组件详解茫茫人海一粒沙深度学习人工智能强化学习
RewardModel（奖励模型）是RLHF的核心，决定了模型“觉得人类偏好什么”的依据。本文将系统介绍如何从零开始训练一个rewardmodel，包括数据准备、模型结构、损失函数、训练方法与注意事项。什么是RewardModel？RewardModel（RM）是一个评分器：它输入一个文本（通常是prompt+模型回答），输出一个实数分值（reward），表示这个回答的“人类偏好程度”。它不是分类
pytorch小记（二十七）：深入理解 PyTorch 中的 `.contiguous()`：内存布局与数据不变性
pytorch小记（二十七）：深入理解PyTorch中的`.contiguous`：内存布局与数据不变性深入理解PyTorch中的`.contiguous()`：内存布局与数据不变性一、张量连续性（contiguity）概念二、`.contiguous()`的作用三、`.contiguous()`是否改变数值？四、与`.clone()`的区别五、常见使用场景六、总结深入理解PyTorch中的.co
深入理解Redis-数据清除策略&数据持久化策略&缓存策略-面试篇心平愈三千疾 redis 缓存 redis 面试 java 数据库
文章目录数据删除过期删除定时过期惰性过期定期清除内存淘汰数据持久化AOF日志RDB快照混合持久化可能的问题缓存缓存雪崩（大堆的雪下榻）缓存穿透（穿针）缓存击穿（打洞）缓存预热缓存更新数据删除过期删除什么是过期删除？Redis是Key-Value数据库，我们可以设置Key的过期时间。过期策略就是指当Redis中的缓存过期了，Redis如何处理。定时过期定时过期是指为每个设置了过期时间的key都需要设
【Rust日报】2024年Rust回顾：接下来是什么？ Rust语言中文社区 rust 开发语言后端
Avian-一个基于ECS（实体组件系统）的2D和3D物理引擎Avian是一个基于ECS（实体组件系统）的2D和3D物理引擎，专为Bevy设计，Bevy是一个在Rust中构建的，非常简洁的数据驱动游戏引擎。Avian注重人体工程学和模块化设计，重点提供一种原生的、由ECS驱动的用户体验。https://joonaa.dev/blog/07/avian-0-22024年Rust回顾：接下来是什么？本
Qt 使用QAxObject 快速写入execl失败问题 HL_风神 QT
最近工作开发需要写一个读翻译ts文件，ts文件实际上就是xml文件，数据量比较大所以写一个工具将ts文件中的原文和译文提取到execl中给翻译人员翻译，我用的是QAxObject，按范围写入数据：使用函数setProperty(“Value”,value)，函数返回总是false咨询别人才知道office支持的是setProperty(“Value”,value)电脑装的是wps的话，写入成功就需
C++标准库大全(STL)
C++标准库大全(STL)1.容器（Containers）*问题类型：序列容器（std::vector,std::deque,std::list,std::forward_list,std::array,std::string）：各自的特点、底层实现、优缺点和适用场景？容器特点底层实现优点缺点适用场景std::vector动态数组，支持快速随机访问连续内存+三指针（数据头/尾/容量尾）随机访问O(
解锁数据潜能——亮数据Web数据集，精准、全面、即时程序猿追其他领域嵌入式效率性能优化科技计算机外设
解锁数据潜能——亮数据Web数据集，精准、全面、即时在数据驱动的时代，获取高质量的网络数据成为许多企业与研究机构的核心需求。亮数据推出的Web数据集产品，试图通过技术手段解决传统数据采集中的痛点，为使用者提供更高效的数据支持方案。该数据集的核心优势体现在三个维度：数据精准度、覆盖全面性和更新即时性。在精准度方面，通过动态IP网络与智能解析算法的结合，有效降低了传统爬虫常遇到的反爬干扰，使获取的数据
利用人名语言分类案例演示RNN、LSTM和GRU的区别（基于PyTorch） .30-06Springfield rnn lstm gru 分类人工智能 python pytorch
文章目录一、程序结构1.1程序整体结构1.2各模块功能关系流程图二、数据预处理模块详解2.1定义字符集和语言类别2.2读取数据2.3人名转换为one-hot编码张量2.4自定义数据集类2.5数据加载器三、模型定义模块详解3.1RNN模型3.2LSTM模型3.3GRU模型四、模型训练与测试模块详解4.1测试模型基本功能4.2模型训练主函数五、结果可视化与对比模块详解六、模型预测模块详解七、案例结果分
YOLOv8 轴承缺陷检测使用YOLOv8进行训练、评估和可视化预测结果包含1440张图片的轴承缺陷检测数据集 YOLO格式或XML格式 OICQQ67658008 YOLO xml 深度学习轴承缺陷数据检测算法人工智能
轴承缺陷检测4类1440张names:[‘aocao’,‘aoxian’,‘cashang’,‘huahen’]名称：：[‘凹槽’，‘凹陷’,‘卡伤’,‘划痕’]共1440张，8:1:1比例划分train：1152张，val：144张，test：144张标注文件为YOLO适用的txt格式或xml格式。可以直接用于模型训练。YOLOv8轴承缺陷检测importosimporttorchfromIPy
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f