图数据库NebulaGraph

如何高效搭建资产管理平台？众安科技告诉你答案是图技术

本⽂整理⾃ NebulaGraph x 阿⾥云计算巢专场中众安保险的⼤数据应⽤⾼级专家曾⼒带来的《众安资产在 NebulaGraph 的应⽤实践》分享，视频⻅链接。

⼤家好，我是众安数据科学应⽤中⼼的曾⼒，今天很⾼兴在这⾥可以跟⼤家分享 NebulaGraph 在众安资产的实践。

01 基于事件的数据资产平台设计

在了解这⼀切之前，我们需要先知道什么是资产管理平台以及它可以解决什么样的问题。

资产管理平台是全域的元数据中⼼，它可以对数据资产进行管理监控，解决企业内部的数据孤岛问题，挖掘数据价值并对业务赋能。它主要解决我们数据找不到、数据从哪⼉取，排查路径⻓、数据复⽤率低这四个非常核⼼的关键问题。

设计目标

对于资产管理平台，我们有三个⾮常重要的设计⽬标——

强扩展：是指实体关系定义、资产操作以及资产查询的扩展性。
低耦合：是指资产平台与其他系统对接时，对接入系统业务流程零影响。
高时效：是指需要近实时的数据采集、快速的数据处理和查询性能。

核心功能

数据资产管理平台核⼼功能包括以下三个：

类型定义：需提供⼀个抽象的设计定义不同的实体/关系，以及它们包含的属性。每个定义的实体/关系均需要定义唯一性约束，用于数据判重。在此基础上我们可以扩展一些定义类型，比如标签、术语、标签传播等等。
元数据采集：主要有通过周期性、流式和手工录入三种方式进行数据采集。
元数据管理：数据存储常见的选型是关系型数库存储定义或数据，搜索引擎存储数据、变动记录、统计类信息，图数据库则负责关系查询。数据分析常见的场景是数据地图、血缘及影响性分析、全链路血缘分析。数据应用则是在相关数据采集到平台后，可以快速实现资产割接、数据安全管理以及数据治理等更高层次应用需求。

类型定义

开源系统 Apache Atlas

借鉴于开源系统 Apache Atlas 和 DataHub，我们来初步了解类型定义设计的核心要素。

Atlas 的类型定义模式是一套基于 JSON 的 TypeSystem，可以自定义扩展，它的核心概念是实体、关系和属性，并在此基础上扩展出分类、术语、业务数据等定义设计。

DataHub 则采用 Avro 进行事件模型的定义、PEGASUS 建模语言进行实体、关系和属性的建模，值得一提的是 Aspect 这个概念，其描述实体特定方面的属性集合，同一实体关联的的多个 Aspect 可以独立更新，相同的 Aspect 也可以再多个实体间共享。DataHub 预置了一些实体和关系模型，我们可以复用这些模式或自定义新模型。

通过两个开源系统的类型定义设计，我们不难看出实体、关系、属性是元数据系统当中最基础的三个核心类型定义的元素。基于整体的架构、内部数据模型场景、数据存储选型、学习成本等方面因素的考虑，众安数据资产平台的类型定义是参照 Apache Atlas 的 TypeSystem 设计，定义一套独立的类型定义系统。

实体类型定义 EntityDef 的核心要素是类型名称、父类型名称和属性列表。

对于类型名称，需要单租户下约束唯一；对于父类型名称，其实就是对一些公共属性集的复用，类似于 Java 类的继承机制，我们可以通过获取父类型及其超类的所有属性。目前为方便类型解析，一个实体仅能定义一个父类型。对于属性列表，一个实体可以有 1~n 个属性，且至少有一个唯一性属性。

关系定义 RelationshipDef 的核心要素是定义名称、关系类别、起始/结束端点定义和属性定义；

对于类型名称，需要单租户下约束唯一；对于关系类别，根据是否容器关系和端点实体生命周期分为三类。

Association 关系：是一种非容器关系，比较典型的例子是调度作业的依赖关系，两者之间不为包含关系，且生命周期独立。
Aggregation 关系：是一种容器关系，但端点实体的生命周期独立，比如我们的报表系统，数据模型和画布关系，画布包含模型，但模型可以独立于画布而出存在，生命周期独立。
Composition 关系：是一种容器关系，且端点生命周期完全一致，最直观的例子是表和列之间的包含关系，删除表的时候列实体自动被删除。

对于端点定义 RelationshipEndDef，端点即是实体关系中关系实体的映射，所以需要定义来源和目标两个端点。每个端点定义需要端点的实体类型名称以及是否为容器。如果关系类别是⼀个容器类型的关系的话，需要设置某⼀个端点容器标志为 true，此时边方向是子项实体指向容器实体。如果关系类别是非容器的关系的话，所有的端点容器标志都需要设置为 false，此时边方向是端点 1 实体指向端点 2 实体。

对于属性列表来，一个关系可以有 0~n 个属性。同实体属性定义不同的是，关系定义可以不配置属性定义。

属性定义 AttributeDef 核心要素是名称、类型、是否可选、是否唯一属性、是否创建索引、默认值等内容。对于属性类型，因 NebulaGraph 图库支持的类型有限，仅支持基础数据类型。是否支持索引创建，是指创 Nebula tag/edge schema 的时候，对于某个属性是否创建一个 tag/edge 索引，以支持在特殊查询场景下的数据查询。

实体的判重是资产平台类型定义的关键设计，我们首先看看开源产品的设计理念。

Atlas 类型定义系统当中，所有实体都继承于⼀个⽗实体 Referenceable，它只有⼀个唯一属性 QualifiedName，且被标记为了唯⼀的属性。所有继承于它的实体类型属性中均没有唯一属性。QualifiedName 没有用固定格式，在 Atlas 内置的几个 Hook 中，主要格式为 xxx@meta-namespace。在 Hook 写入时指定，上图的例子就定义的是某个集群、某个存储卷在的唯一性标识。

DataHub 实体唯一性标志是 URN，也叫作唯⼀属性资源名称。它有一定的生成规则，即 urn::: 命名空间默认设置为 li，类别则是实体定义名称，ID 是指唯一属性集合拼接，可以嵌套 URN，上图的例子一个数据集，代表某个 Kafka 集群下的 Topic。

基于两个开源项目分析，不难看出唯一性判断均是基于唯一属性来处理，两者均是在 Ingest 扩展中进行了固定格式的定义写入，而不是基于实体定义中多个明确代表唯一属性进行灵活的拼接处理，其拼接的字段晦涩难以解析。

众安设计了一套唯一性判断定义方式，即某个实体注册时，先判断实体定义是否有 Composition 类别关系的边定义引用。如果不存在该关系类别定义，则直接从实体定义的属性定义中检索 isUnique=true 的属性。如果存在改关系类别定义，那当前实体的唯一性属性将不足以约束其唯一性，还需要带上边定义的容器实体的唯一属性才可以保证。这是一个递归的过程，可能需要传入多个实体的唯一性属性才可以判断。比如注册一个 MySQL 表，除了表实体的表名称之外，还需要 MySQL 库实体的 Host、端口、数据库名称等唯一属性才是完整的为唯一属性列表。

在获取了唯一属性列表后，还需要加上租户和类型定义名称，继而生成某一租户下对应的唯一实体标志。

操作需要三个流程，首先需要把唯⼀性的属性列表，根据其对应的类型名称跟属性名称进行一次正序排序，然后对租户、类型定义名称、唯一属性 key 进行一次正序排序，生成一个可读性高的唯一名称。其次，因唯一名称可能较长，需要进行一次 32 位摘要后进行存储，并加以索引进行查询，可以提升整体查询的有效性。最终全局的资产唯一 ID，则是用 Snowflake 算法生成的唯一 ID。因摘要算法有效概率重复，故使用分布式 ID 生成算法生成 ID，用于数据存储。

资产采集

流式采集有非常好的优势，可以通过消息队列，实现系统间解耦，实现数据的准实时上报，同时对事件消息也有良好的扩展性。周期性采集是流式采集的⼀个补充，它包括两种⽅式基于 ETL 或系统接口的主动推送，或类似数据发现系统的数据主动拉取。

对于以上两种⽅式还没有达成的采集，可以用过人工补录的形式进行填写，以支持注入对接系统无法支持上报或部分血缘无法解析等场景，提升数据完整度。

下面给大家介绍一下众安元数据系统⼏个版本采集流程的迭代——

V1.0 版本是完全基于 T+1 的离线 ETL，我们会把数据开发⼯作台、调度系统以及阿⾥云 MaxCompute 元数据加载到数仓后，通过 ETL 处理推送到元数据平台，因数据量不大一个支持递归的关系型数据库即可满足要求。若数据量较大，则可以通过搜索引擎和图数据库进行扩展。

随着业务的发展，数据开发对于元数据的时效性要求会越来越高，比如分析师创建的临时数据想 T0 就直接分享给其他部门使用，以及元数据整体数量越来越大，处理耗时较长，获取的时间越来越晚。

基于以上需求，我们在元数据平台开了⼀层 API，在数据开发工作台进行表操作时，或调度系统创建调度任务时，会调用接口将数据同步给元数据平台。同时晚上我们依然会有离线的 ETL 进行数据补充，两者结合起来进行数据源的数据查询服务。

接口模式也会有一定的弊端，在各个对接的业务系统中，会有大量的同步嵌套流程，元数据服务不可用或执行时间过长，例如系统发版时的业务中断，创建一个数百列的表引发的接口超时等，均会影响正常业务流程。

于是我们参考各类开源元数据平台设计思路，设计了基于流式事件的元数据平台，基于不同的事件，对接系统通过消息队列上报后，实现系统间解耦。资产平台基于不同事件进行分类处理，并将最终的数据存储到搜索引擎、关系型数据库，以及图数据库当中。

平台架构

下⾯给⼤家介绍⼀下众安数据资产平台的架构，我们将平台分为了 5 个子系统。

Portal 服务对接前端，提供通用的实体页面布局配置接口，实现配置化的页面布局。同时转发请求到 Core Service 进行处理，比如查询、类型定义等。
Discovery 服务主要就是周期性的采集服务，通过配置定时的采集任务，并实现元数据的定时采集。
系统 SDK 所有服务对接资产平台，均需要通过 SDK 进行对接，包括 Discovery 服务、数据超市、报表平台、开发⼯作台、数据标签平台等，SDK 提供了统一的事件拼装、权限管理、事件推送等功能，可以极大的提升平台间交互的开发效率。
Event 服务负责消费消息队列中的消息，进行事件的解析和数据持久化。
Core 服务提供统一的查询 API、标签 API 以及类型定义的 API 来实现查询跟类型定义的管理。

同时我们提供了统一的数据存储层模块 Repo，来实现查询器和统一数据处理器的相关处理，其内部提供了数据库及图库的扩展 SPI，以便实现相关扩展。

我们将资产平台的事件抽象为以下三种：

元数据事件 MetadataEvent，包括实体/关系的增删改查等子事件。
元数据异常事件 FailMetadataEvent，在处理 MetadataEvent 时失败了，比如类型定义不存在或事件顺序有问题，我们会统一生成一个元数据异常失败事件，可以基于此事件做异常数据落库或告警通知。
平台事件 PlatformEvent，包括使用元数据平台触发的埋点事件，包括实体的收藏、查询、使用以及安全分级等事件，其中一部分会做按天级别的统计处理，以便在平台上可以看到类似的统计信息。

事件进⾏处理，需要关注以下三点：

分而治之，因为整体的事件的数据量会⽐较多，为了保证性能需要按照 Event 类别和影响，使⽤不同的消息队列。对于我们刚才介绍的三种型的事件，我们实际使用了三个 Kafka Topic 进行消息推送。
消息的顺序，对于元数据相关事件，消息消费需要严格保证有序，如何来保证有序呢？我们⽬前采⽤的⽅案是由 Kafka Topic 单分区模式来解决的，为什么不⽤多 Partition 呢？因为实体跟关系之间的注册有可能是会分到不同的 Partition 上来进⾏处理的，因为异步消费处理有可能不同分区的数据产生消费堆积，有概率出现不同的分区，消费注册事件先到，实体注册事件后到的情况，导致废消息的出现。
最终一致性，因为事件 Event 的异步处理，我们只能保证数据的最终⼀致性。

好，那讲完了事件的消费流程，我们下⾯就要来看数据持久化的流程。我们的数据事件从消息队列拿到之后，会被我们的事件服务 Event Service 所消费，Event Service 中的事件处理器在消费数据的时候会⽴刻对这个数据进⾏⼀份数据的存储，它会存到关系型数据库⾥⾯，作为⼀个审计的回溯⽇志。

在存储完回复⽇志之后，事件处理器就会开始对事件进⾏处理，如果事件处理异常的话，根据特定的这种事件类型，我们会有选择的把⼀些异常的事件放到异常事件的消息队列⾥⾯，然后供下游的系统进⾏订阅通知，或者是做内部后期的问题排查。

如果事件处理成功了之后，我们会把数据丢到联合数据处理器当中。那联合数据处理器内部其实就是我们对关系型数据库以及图库的数据进⾏了⼀个整体的事务的包裹，以便两者之间出现失败的时候，可以对数据内容进⾏回滚。

那在数据持久化当中，我们的关系型数据库跟图库当中分别存储了什么内容呢？像关系型数据库当中，我们往往存储了实体跟关系的数据，包括属性跟这种实际的这种名称的⼀些定义，同时还存储了实体的统计类的信息⽤于分析，还有类型定义的数据⽤于各种各样数据的这样⼀种校验。那图库当中主要就是点边的这种关系⽤于图谱的查询。

资产的查询分析集成于 Core Service 模块中，目前有两大场景分类，数据地图和血缘分析。

数据地图类检索，一般是分查询，我们定义一套类似于 ES DSL 风格的查询接口请求，通过查询解析器，翻译成要查询的关系型数据库语句，目前因为数据量还在PG的承受范围内，我们并没有使用 ES。同时使用、收藏、查询的统计类记录和变动记录，也是存放于 PG 当中，通过指定接口查询。

血缘分析类查询，一般是关系查询，我们也通过类似于 ES DSL 风格的查询接口请求，通过查询解析器，翻译成图数据库所识别的 nGQL 或 Cypher 语句，包括 N 跳关系查询、子图查询、属性查询等。

对于⼀些特殊场景查询需求，比如数据大盘，或特定实体的扩展事件，我们通过或定制化查询的方式进行处理。

02 NebulaGraph 在众安资产平台的实践

图数据库选型

我们在做⾃主化平台开发之前，对热门开源项目的图数据库选型做了调研。

选型主要考虑两⽅⾯的因素，数据库架构和资产平台设计的匹配性。

在架构因素⽅⾯，核心因素是读写性能、分布式扩展、事务支持和第三方依赖。对于 Neo4j 来说，虽然它的性能读写性能⾮常优越和原⽣存储，但是因为 3.x 版本之后，社区版已经不再⽀持分布式模式，所以说肯定不能达到我们预期的要求。JanusGraph 和 NebulaGraph 均支持分布式扩展和存算分离架构，但前者的存储、索引均依赖于第三方组件，带来大量额外运维工作，其支持分布式事务，而 NebulaGraph 不支持分布式事务处理。

资产平台设计的匹配性因素，核心因素是数据隔离、属性及 Schema 数量上线、属性类型、查询语言等。

JanusGraph/Neo4j 社区版属性集均不支持强 Schema，这意味着更灵活的属性配置。同时，属性类型也支持诸如 map、set 等复杂类型。NebulaGraph 属性集虽然有强 Schema 依赖，但属性和 Schema 数量没有上限，也支持 Schema 的修改，唯一美中不足的是不支持 map/set 等复杂类型属性，这将对类型定义和系统设计有一定的影响，以及对潜在的需求场景有一定的约束。三种数据库均有通用的查询语言、以及可以基于 GraphX 进行图算法分析。

为什么选择 NebulaGraph

基于以下四点的考虑，众安选择了 NebulaGraph——

第⼀是分布式的存算分离架构，可以以最优的成本，快速扩缩容相关服务。

第二是外部组件依赖较少，⽅便运维。

第三是卓越的读写性能，在19 年年底众安金融风控场景，我们对 NebulaGraph 就进⾏了⼀定的性能测试，我们在纯 nGQL的 insert 这种写入方案下，通过 DataX 可以实现 300w record/s 的数据写⼊速度，这个是一个非常惊人的数据同步的体验。

第四是数据存储格式，因为众安有大量的子公司租户，需要进行数据的存储隔离，如果是其他产品就需要部署多套图库，或一套图库数据里打租户标签。NebulaGraph可以使用图空间的方式实现天然的数据隔离，大大简化了我们开发的工作量。

NebulaGraph 阿⾥云部署模式

因为众安没有独立机房，所有的服务均依赖于阿里云金融云，基于阿⾥云 ECS 的能力，可以快速实现服务器以及服务器上存储资源的弹性扩收容。实际部署中，我们将 graphd 跟 mated、 storaged 进行了分开部署，避免大量查询导致内存过高，影响到其他图数据服务的稳定性。

graphd 占用了 2 台 4C 8G 服务器，metad/storaged 占用了 3 台 4C 16G 服务器。当前资产平台的实体数量在 2,500w 个左右，边数据在 4左右，主要为数据集类型数据。

我们使用每台 ECS 使用了两块 200G 的 ESSD 进行存储，根据 NebulaGraph 的推荐，磁盘的数量越多，图空间 Partition 的扩展的数量就可以越多，可以获得更好的并发处理能力。

众安在NebulaGraph中的模型设计

下面介绍一下基于 NebulaGraph 的模型设计。

对于实体定义来说，对应 NebulaGraph 的某一个 Tag，其相对于其他图数据库类似于 Label 概念，就是某个属性集的名称，通过 Tag 可以更快检索倒到某一个实体点下的属性，类型定义的 Tag 必须同这一类型的点 ID 进行强绑定，注册时需要进行相关校验。另一个属性集的概念是公共标签，公共标签可以做很多事情，比如业务属性集、实体标签等。公共标签在 NebulaGraph 当中也对应一个 Tag，这个 Tag 可以绑定到多种不同的实体，比如环境公共标签，可以赋给 MySQL 数据源实体，也可以赋给 MaxCompute数据源实体等。

对于关系定义来说，对应 NebulaGraph 中的某个 Edge Type，类型定义中的来源目标端点的实体类型，必须同这一类型的点 ID 进行强绑定，注册时需要进行相关校验。

对于数据隔离来说，上述实体和关系模型，通过 NebulaGraph 的图空间进行隔离，在众安内部的多个租户实体下，比如保险、小贷、科技等，会在租户初始化时创建指定图空间，后续的类型定义均在租户图空间下进行。

最后我们再来看⼀下模型设计的继承关系。我们所有的实体根节点是⼀个叫做 Asset 的实体定义，我们将一些公共属性定义其中，包括名称、展示名称、备注、类型等；

基于 Asset 类型，我们实现了对接平台的各种资产实体，报表平台里的模型、视图、画布、⻔户等实体，数据超市里的路由 API、数据 API 以及外部扩展 API 等实体，开发工台里的调度任务、流计算任务、工作空间、文件等实体，以及两个比较特殊的资产属主实体和服务资产实体。

另一个特殊的实体是数据集实体，我们将不同数据源数据源、表、列等信息均定义了独立的资产实体定义，以便实现不同数据源的差异化属性展示。

我们最终的全链路数据资产，均是通过数据集及其子类自定义实现串联，从而实现跨平台的链路分析。比如调度作业的库表血缘，可以关联到报表平台的数据模型，也可以关联到数仓的 Data API 依赖的 Table Store 的某张表等等。

03 未来展望

2022年年底，众安基本上已经实现了各个平台的各种资产的注册跟上报的过程。

2023年，我们将在围绕数据资产割接、数据安全管理和数据治理三个方面进行扩展性开发。

数据资产割接，将站在用户实体的角度上，快速识别个人关联的数据资产，时间属主资产切换和离职交接功能。
数据安全管理，基于资产平台的能力做出多种扩展，迁移内部老元数据系统的表分级、权限审批功能；内部脱敏规则配置平台及 SDK，扩展支持基于表分级数据加密和白名单策略等。
数据治理，基于资产平台的全链路血缘分析能力，观察资产热度、使用等关键指标，清理无效作业和重复计算作业，实现降本增效，减少云平台使用费用。

要来感受同众安科技一样的图数据库体验嘛？NebulaGraph 阿里云计算巢现 30 天免费使用中，点击链接来搭建自己的资产管理系统吧！

众趣SDK重磅升级：空间物联IOT新视界，赋能实景三维场景深度应用 zhongqu_3dnest 物联网 3d 点云处理人工智能计算机视觉点云扫描
近日，空间数字孪生云服务行业领导者—众趣科技宣布旗下核心产品云服务平台QverseSDK迎来里程碑式升级！本次升级聚焦行业前沿需求，重磅推出IoT设备监控系统、iframe跨平台页面无缝集成、BI数据智能三大解决方案，旨在将三维空间计算能力转化为更强大、更易用的生产力工具，为企业用户和开发者构建下一代空间数字化应用提供坚实底座。一、IoT空间物联，让设备运行尽在掌控痛点解决：告别传统分散的设备管理
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
5.8g微波雷达芯片_导弹、卫星、雷达的军用芯片龙头——亚光科技小胖娃 5.8g微波雷达芯片
亚光电子（上市公司持股97.38%）是国内最大的微波半导体器件、微波电路军用企业之一，与中电科13所、55所同处国内军用微波组件第一梯队。亚光电子主要产品为半导体分立器件、芯片、微波电路及组件，应用于三大领域：雷达、导引头、航天通信（卫星等航天器）。从产业逻辑上来看，亚光电子与紫光国微同处高景气度的军用芯片赛道。亚光电子做军用模拟芯片，实现微波信号的接收与发射，亚光电子的产业也聚焦于收发处理环节；
马斯克整出的半仙儿，Chat GPT会让多少白领失业？可能会带来哪些变化？良辰美景5566
这几天，ChatGPT火了，是美国一家叫OpenAI的高科技公司研发的，背后的投资人是谁？——埃隆马斯克！这哥们儿只要一出手，注定就和新奇呀伟大呀啥的绑在一起了，他搞的项目，比如特斯拉、星链、脑机接口，光听名字就透着不俗。很多人纳闷儿，他这次搞得ChatGPT是个啥玩意儿？简单说就是一个人工智能聊天软件，这个软件比以往的智能聊天软件强在哪儿？这么说吧，这简直就是个半仙儿啊。如果您是一位老人，这个C
告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“ 小张在编程 python 大数据开发语言
引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
量子计算与AI融合的技术突破与实践路径
量子计算与人工智能的融合正开启一个全新的技术纪元，这种"量智融合"不是简单的技术叠加，而是多领域、多学科的横向连接，通过协同创新实现非线性增长。本文将深入探讨这一领域的最新进展、技术实现路径以及行业应用案例。电子-光子-量子一体化芯片：硬件基础突破2025年7月，美国波士顿大学、加州大学伯克利分校和西北大学团队联合开发出全球首个电子-光子-量子一体化芯片系统。这一突破性成果发表在《自然·电子学》杂
python大数据论文_大数据环境下基于python的网络爬虫技术 weixin_39775976 python大数据论文
软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
Redis性能测试：工具、参数与实战示例 Seal^_^ 数据库专栏 #数据库--Redis redis 数据库 Redis性能测试
Redis性能测试：工具、参数与实战示例1.Redis性能测试概述2.redis-benchmark基础使用2.1基本语法2.2简单示例3.性能测试参数详解4.实战测试示例4.1基础测试4.2指定命令测试4.3带随机key的测试4.4大数据测试4.5管道测试5.性能测试流程图6.测试结果分析与优化建议6.1结果解读6.2优化建议7.高级测试场景7.1持久化影响测试7.2集群测试7.3长时间稳定性测
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
2024年，想要靠做软件测试获得高薪，还有机会吗？朱公子的Note 软件测试
2024年，科技行业风云变幻，随着自动化技术和人工智能的发展，软件测试领域的竞争愈发激烈。很多人会问，现在还投身软件测试，真的能拿到高薪吗？尤其是当越来越多的自动化工具涌现，手动测试员会不会被淘汰？时间过得真快，一眨眼，2024年已经过去了一大半。最近正值金九银十招聘季，后台不免又出现了这几个同学们关心的问题：2024年还能转行软件测试吗？零基础转行可行吗？那么，2024年，软件测试行业的高薪岗位
初识linux 贩卖纯净水. Linux linux
Linux从哪里来？（东土大唐）它是怎么发展的？（一个筋斗云翻身）历史沿革我是程序猿，你是运动员，我们都有缘。作为一个码农，有一些计算机界的“常识”是需要了解的。计算机是在什么时候诞生的呢？又是在一个怎样的背景下，计算机诞生了呢？计算机的发明其实早期的计算机是为了给军事提供支持才被发明出来的，被用于计算导弹弹道轨迹。在美苏冷战时期，军备竞赛转变为科技竞赛，计算机于对抗中产生，首先应用于军事。计算机
流量卡19元100g全国通用最划算还是流量卡19元155g全国通用最划算全网优惠分享
流量卡哪个最划算？呵呵，这可是个热门话题啊！对于我来说，也对流量卡这个现代科技产物很是感兴趣。流量卡，就像我杯中的美酒一样，能够让人随时沉醉于互联网的海洋中。那么，哪一款流量卡最能够引发我无尽的兴趣呢？让我来为你细细描绘。关注微•信•公•众•号"卡泡泡"就知道啦！☞大流量卡套餐「→点这免费申请办理」或关注微·信·公·众·号「卡泡泡」自助办理！首先，我们需要明确自己的需求。就像笔者饮酒一样，选择一款
C#语法基础总结（超级全面）（二） inwith C#语法基础 c#开发语言
文章目录c#语法基本元素关键字操作符（operator）类型转换标识符（Identifier）语句try语句迭代语句（循环语句）索引器文本（字面值）五大数据类型引用类型：值类型：变量、对象与内存装箱和拆箱类类的实例化类的三大成员（属性、方法、事件）属性（property）方法（函数）方法参数值参数引用参数输出参数数组参数具名参数可选参数扩展方法（this参数）方法的重载构造器（constructo
2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
区块链来了｜跨境转账可以实时到账？全球支付体系将重构 weixin_34185512 swift 数据库区块链
面对资金的速度远不及信息传输速度的现实，欧美银行巨头们期望通过区块链技术，实现全球范围的实时结算清算。从金融业到IT领域，去年下半年开始，凭借其去中心化、去信任的机制迅速蹿红，在全球市场上得到包括各国央行、欧美银行们的认同后，迅速蹿红的“区块链”技术，将首先对哪个行业产生冲击？不少人的答案都指向了支付行业。毕竟，眼下传统的支付方式并不令人满意，从银行到企业，都希望利用新科技重构原本累赘的业务体系，
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
SQL 常用版本语法概览：标准演进与关键语法分析
一、引言SQL（StructuredQueryLanguage，结构化查询语言）是关系型数据库系统的核心语言，自1986年成为ANSI和ISO标准以来，经历了多次版本演进，不断增强语义表达能力以适应复杂的企业数据需求。随着数据库技术的不断发展，各大数据库厂商（如Oracle、SQLServer、PostgreSQL、MySQL等）在实现标准的基础上扩展了大量方言语法，使得掌握SQL的标准语法版本成
主流数据库语言语法对比两圆相切数据库
以下是五大数据库（MySQL、PostgreSQL、Oracle、SQLServer、SQLite）核心语法对比，涵盖DDL、DML、查询、函数、事务等全场景，包含底层原理差异和实用示例。##一、数据一、类型深度对比分类MySQLPostgreSQLOracleSQLServerSQLite整数TINYINT,INT,BIGINTSMALLINT,INT,BIGINTNUMBER(10)TIN
“希望是比钻石更珍贵的，在当下最需要的东西”，袁明辉《六项精进》打卡学习273天 YuanWelldon
流浪地球流浪地球姓名：袁明辉公司：宁波惠尔顿婴童安全科技股份有限公司364期学员组别：利他一组403期志工组别:谦虚一组宁波盛和塾8月月度学习会《用数字经营企业》志工宁波盛和塾道盛哲学全国企业家践行成果发表会志工【知～学习】背诵《六项精进大纲》3遍，共761遍。背诵《大学》3遍，共761遍。【经典名句分享】今天开启2019年农历新年计划一、修身1、背诵《般若波罗蜜多心经》0遍，共808遍2、陪女儿
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
CAD图纸一键共享，永久轻松办公! Bro_8d72
时代在进步，科技在不断发展，人们的生活习惯也在逐渐改变着，从最初的办公室计算机办公到现在的移动端办公的兴起这不但说明了信息的发展迅速也代表了我们的办公方式正在与时俱进，俗话说：“落后就要挨打！”这句话相信大家都有听说过吧！说的就是这个道理，弱肉强食，弱者必定会淘汰，所以软件在不断的开发，不断的为我们工作带来了便利。今天要给大家介绍的就是一款移动端CAD看图软件-迅捷CAD看图。软件支持CAD图纸一
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
现代人的困境该如何是好？ Aangel晨
现代人面对的困境包括，市场经济带来的世俗化，使得人们过于重视物质生活，以至于让人失去了原本敬畏的传统神圣价值观，与此同时，科学和科技的进步，也冲击了原本的信仰。此外，都市化还带来了个人的孤独。“人际疏离与价值观失落，是现代都市人的通病。”针对现代人的困境，在观念和行为两个层面给出了自己的建议。在观念层面，我们可以发展下面三种理念。首先，人和大自然，大自然和宇宙，实际上是息息相关的网络。人和自然是一
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23