【翻译】防腐层：面向领域驱动设计的更为稳健的系统集成方案

本文翻译自领域驱动设计官方网站的一篇实践性论文，原文题为《IAnticorruption – A Domain-Driven Design Approach To More Robust Integration》，我觉得这篇论文写得很不错，实践性非常强，通过对一个真实项目的研究，并结合整个团队在项目实践上的经验，总结了领域驱动设计在系统集成方面的指导作用：通过防腐层的引入，改善现有的系统集成架构，并引导整个项目和团队实现可持续化发展。本文还隐喻了架构设计的重要性：合理的架构不仅能够很好地支持项目管理（反之亦然），而且还能够让开发和测试朝良性化方向发展，最终获得项目的巨大成功。为了方便大家的阅读，我特将本文翻译成中文发布于此，欢迎大家阅读讨论，对于英语阅读不感到困难的朋友或者对我的翻译质量没有信心的朋友，可以直接点击上面的链接阅读原文（PDF格式）。

摘要

Custom House公司目前所使用的汇兑系统是与另一个老系统集成的。经过多年的演化，两套系统之间的关联与交互变得非常复杂，以至于对这两套系统的任何一处修改，都会带来一些难以预计的问题。而另一方面，从集成层（integration layer）对系统进行重构，不仅风险较大，而且也很耗时。于是，对于这样的现状，我们需要对两套系统进行革命性地重构。

要实现这样的重构，就需要在两套系统中间引入防腐层，从而对两套系统进行隔离。防腐层对两套系统之间的概念模型以及功能行为的转换进行了合理封装，并且能够确保其中一个系统的领域层不会依赖于另一系统。通过将领域层从系统集成任务中解放出来，防腐层还允许其它的外部系统能够在不改变现有系统的领域层的前提下，与该系统实现无缝集成。防腐层的实现，将系统集成所需的开发工作量从30%降低到10%。

实现防腐层的最大挑战在于对“转换（translation）”任务复杂度的控制，而这是通过一种比较创新的方式实现的：即为老系统所隐喻的领域模型建立一个对象模型。我们的经验是，对某个外部系统领域模型的充分提炼，并不要求这个系统是以面向对象的方式实现的，而这也正是在两套系统的领域模型与功能行为之间实现精准的、可扩展的“转换”的关键所在。

关键字

领域驱动设计、防腐层、领域模型、集成、观察者模式

背景

跟大多数企业级应用程序一样，Custom House的汇兑系统需要跟另一套老的后台系统进行集成，以实现完整的业务处理流程。这套汇兑系统（SPOT）会处理绝大多数来自于前台的在线事务。当SPOT完成一个汇兑事务的同时，需要将信息发送到后台系统以便完成后续的操作，而这套后台系统就是我们需要集成的系统，我们称之为TBS。

SPOT是一套使用Microsoft .NET技术实现的面向对象企业级应用，而TBS则是一套基于数据表和数据记录等概念的Microsoft FoxPro应用程序。

集成

为了集中数据导出、数据转换的处理以及跨平台通信，我们在SPOT和TBS之间创建了一个称之为TBSExport的枢纽组件（Gateway）。

图一老系统中SPOT与TBS之间的依赖关系

说明：为了简化讨论，在此只列出了两种最重要的信息：Order和Customer，而实际上从SPOT发送到TBS的信息种类是非常多的。

正如上图所示，TBSExport组件会读入以通用数据结构（实际上是.NET DataSet）的形式所组织的信息，并将其转换为TBS所能理解的数据格式，然后输出给TBS。例如，当客户下达一张订单后，SPOT会创建一个包含了订单信息的DataSet，然后调用TBSExport组件：

public class OrderManager

{

    public void BookOrder(Order order)

    {

        //…book order and update order entry in database

        DataSet orderDataSet = OrderDataSetBuilder.BuildTbsDataSet(order);

        TbsExport.ExportOrder(orderDataSet);

    }

}

在获得了导出的请求之后，TBSExport会把这种请求委托给真正的导出器（Exporter）以完成数据的导出、转换和传输。

架构之腐化

这样的设计的确正常地运行过一段时间。不过随着时间的推移，SPOT和TBS都需要实现新的功能，于是，系统集成就成为了一个繁重的任务。开发人员开始感觉到两套系统之间的转换逻辑变得越来越难理解。在SPOT系统上线两年后，与TBSExport相关的开发任务占据了整个项目开发任务的30%左右。QA团队也将两套系统的集成部分认定为bug的重灾区。最终，有个项目的实现需要对TBSExport进行大幅修改，然而系统集成的复杂度注定了该项目的失败。于是，无论是项目管理者还是开发人员，都希望能够尽快对TBSExport进行革命性地重构。

那么，问题究竟出在什么地方呢？

SPOT的领域模型与TBS之间的紧耦合

从上面的代码中我们可以看到，SPOT向TBS发送信息时，它做了两件事情：

创建了一个包含特定数据的DataSet
调用了一个定义在TBSExport组件上的导出服务

在第一步中，SPOT的领域对象将自身转换为DataSet。由于这种转换代码在领域对象中随处可见，这就使得这些对象中真正用于处理业务的逻辑变得非常混乱，从而使问题变得复杂。之后，我们将这部分转换代码移到一些独立的类中，类似OrderDataSetBuilder等。这样做虽然能够使逻辑变得清晰，但领域层仍然受这些转换逻辑的约束，而这些转换逻辑却与SPOT本身的业务逻辑毫无关系。

在第二步中，数据导出的行为是由SPOT发起的。这就要求SPOT中的多数操作（比如创建新的客户、下订单以及确认支付等）都需要对TBSExport进行引用。最开始的时候，这种依赖关系仅存在于处理工作流的服务层中。但久而久之，这种依赖也影响到了领域层，从而导致SPOT的领域对象不得不包含一些与TBS相关的代码。例如，BankDeposit类包含了一个内部成员类型：TBSFile，而它却是定义在TBSExport组件之中。

public class BankDeposit

{

    TBSFile tbsFile;

    public void DoDeposit()

    {

        // domain logic for deposits…

        tbsFile.Export();

    }

}

SPOT与TBSExport之间的紧耦合为系统维护带来了不少麻烦：

对SPOT领域逻辑的隔离/单元测试变得非常困难
在对TBSExport进行单元测试之前，需要花很大的功夫来准备一些SPOT对象
跟踪和修正与数据导出相关的Bug变得非常耗时。对TBS的一小点改动就很容易引起SPOT产生一些无法预知的问题，反之亦然

数据转换以一种较为底层的原始数据类型的方式进行

TBSExport向外界暴露了一系列接口，这些接口都使用DataSet作为方法的参数，而DataSet则以一种平展的结构保存着SPOT对象的数据。例如OrderDataSet，它保存了一些与SPOT中Order对象相关的数据。在获得DataSet之后，TBSExport还需要将这些DataSet转换为TBS能够识别的新的数据格式。由于SPOT和TBS分别基于两种完全不同的模型，因此这个转换逻辑是非常复杂的。在SPOT中，“Order”是一个聚合，它包含了一条或者多条“Line Items”。每条“Line Item”又通过“Drawdown”对象关联了一个或多个“Contract”对象。每当需要向TBS导出一条Order时，与Order、Line Item、Drawdown和Contract相关的信息都被一股脑地塞进了OrderDataSet中。

而另一方面，TBS却使用一种平展的表结构来表示不同类型的“汇兑交易”。每条TBS交易对应表中的一条记录。SPOT的领域概念在TBS中完全不存在，所以转换逻辑会将一个SPOT的Contract对象转换成两条TBS记录，一个SPOT的Line Item对象转换成一条TBS记录，而将一个SPOT的Drawdown对象转换成两条TBS记录。于是，一个SPOT的Order对象就被无形地映射成了多条TBS记录。

图二老的转换逻辑

OrderDataSet和TBS的交易数据表都仅包含了原始数据类型的数据，比如字符串（string）或者整数数据（integer）。为了确保转换的正确性，转换逻辑不得不去了解每条数据在两个系统下各自的含义，以及该数据在两个系统之间错综复杂的联系。这种底层的数据映射，不仅繁琐，而且很容易导致错误的出现：因为这种做法不仅需要涉及到每个数据的具体细节，而且还会在两个系统中出现大量的重复逻辑。比如，OrderExporter中就包含了超过3000行专门用于数据映射的代码。这种复杂性是导致混乱出现的根本原因，也致使系统组件变得难以维护。

业务逻辑过多地纠缠于TBSExport中的技术细节

在TBSExport组件的核心部分，包含了一系列的Exporter类，如下图所示：

图三老的TBSExport设计

在上面的设计中，抽象类TBSExporterBase提供了创建和保存数据文件的具体实现。每个继承于该类的子类，都必须重写“PopulateTBSDataTable()”方法以实现相应的转换逻辑；同时还须重写“OutputToDatabase()”方法以便执行相应的数据库操作。这其实是两种完全不同的操作：其中一个对业务逻辑进行了处理（比如创建TBS的交易记录），而另一个则纯粹地执行了一些与技术相关的操作（比如将记录保存到磁盘）。通过下面的例子我们可以看到，这种既处理业务，又负责技术的类是多么的复杂，在这些类中，业务逻辑甚至还与数据行、数据表以及数据库连接等技术细节交织在一起：

public class CustomerExporter

{

    protected override void PopulateTBSDataTable(DataSet dataSet)

    {

        DataRow drSpotCustomer = dataSet.Tables[0].Rows[0];

        DataRow drTBSCustomer = tbsData.NewRow();

        drTBSCustomer[COMPANY] = drSpotCustomer["CompanyName"];

        //......more

        tbsData.Rows.Add(drTBSCustomer);

    }

    protected override void OutputToDatabase()

    {

        OleDbCommand dbCommand = new OleDbCommand(tbsDBConnection);

        //…

        foreach (DataRow dataRow in tbsData.Rows)

        {

            dbCommand.CommandText = BuildQueryString();

            dbCommand.Parameters[COMPANY].Value = dataRow[COMPANY];

            //…more

            dbCommand.ExecuteNonQuery();

        }

    }

}

重构：引入防腐层

TBSExport与SPOT之间的关联不仅紧密，而且复杂，以至于每当需要对之进行扩展时，程序员都表现出了恐惧的心理。在2005年12月的时候，整个团队意识到，延续现有的开发方式已经不能很好地解决问题了：即使是对系统的一次很小的改动，都会对系统造成不同程度的负面影响，不仅耗时，而且风险很高。因此，我们决定对SPOT和TBS之间的系统集成部分大动手术。在Eric Evans和领域语言（Domain Language）团队的帮助下，我们整个项目组，包括项目管理人员、开发人员以及QA，都全力以赴地对TBSExport进行重新设计。经过讨论，我们决定使用下面的设计方案：

实现一个新的TBSExport组件，它必须是独立的，并且具有完善的功能。团队需要确保该组件的设计是合理的，并对其进行了完整的单元测试
建立一种机制，通过这种机制将新的TBSExport组件与SPOT连接起来。需要注意的是，应该以一种松耦合的方式实现这种机制（也就是说，SPOT应该不会意识到该机制的存在）
在确定这种新的机制能够正常工作后，在SPOT中激活它，然后进行集成测试和回归测试
最后，删除旧的TBSExport代码，仅保存这个新的、松耦合的设计

这个计划使我们能够在不变动已有功能的基础上，重新设计一个新的TBSExport组件，因此，整个系统不会长时间地处于宕机状态。这个计划也使我们能够将新老两种实现方式放在一起进行对比，以确保新组件能够正确运行。

整个设计中最重要的一点是，将TBSExport设计成为衔接SPOT和TBS的防腐层。防腐层“并非是系统间的消息传递机制，更确切地说，它的职责是将某个模型或者契约中的概念对象及其行为转换到另一个模型或者契约中”。换句话说，我们要将这个组件设计为能够直接访问SPOT领域对象的隔离层，以负责完整的转换逻辑；而对于SPOT，我们只需要让其专注于自己的领域模型，而无需关注任何与转换相关的逻辑。为了达到这样的效果，我们做了以下工作：

重新设计TBSExport的外观接口（façade interface），使其能够与SPOT的领域模型相接

请比较以下两个接口定义：

改动前：public void ExportOrder(DataSet orderDataSet);
改动后：public void OnOrderBooked(Order order);

老的接口定义需要SPOT将其领域对象转换成一个.NET的DataSet；而新的接口定义则直接将SPOT的领域对象用作函数参数。于是，SPOT只需要以自己的方式来使用这些接口即可，而无需做一些与业务无关的事情，比如“将对象转换成DataSet”。

提炼TBS的领域模型，并对TBS的行为进行抽象

老的TBS系统从一开始就不是面向对象的，但这并不表示它不包含一个领域模型，TBS的领域模型只不过是被大量的数据记录以及过程化程序所湮没而已。在重构的过程中我们发现，为了能够更加明确地表述TBS所包含的领域语义，从TBS中提炼出领域模型是非常必要的。在Order导出的案例中，虽然从TBS上看并没有一条明显的交易数据能够与SPOT中的Order相匹配，但在TBS中的确存在由多条TBS数据所表述的“Order”的概念：

图四 TBS所隐含的领域模型的一种表述

在完成了TBS领域模型的提炼后，我们就能够很自然地将SPOT中的Order对象转换为TBS的Order对象：

public class TbsOrderTranslator

{

    public TbsOrder TranslateSpotOrder(Order spotOrder)

    {

        TbsOrder tbsOrder = new TbsOrder();

        tbsOrder.Customer = MakeTbsCustomerId(spotOrder.CustomerId);

        tbsOrder.Branch = spotOrder.Branch.BranchCode;

        //….more

        tbsOrder.Settlement = ComputeSettlement(tbsOrder);

        return tbsOrder;

    }

}

在TBSExport中定义TbsOrder是非常重要的，它成为理解TBS中对象间关系的关键。两个系统都以一种更富意义的方式来表述各自的数据，这也使我们能够以对象的方式，而不是原始数据类型的方式，在两种模型之间进行转换。现在，我们就可以用它们各自的“通用语言”来对其各自的模型作进一步讨论。

接下来要做的就是将TbsOrder映射为TBS的数据记录。这是一个非常直接而且机械化的过程，并不包含任何业务逻辑。

将与TBS系统的通信部分从对象转换逻辑中分离出来

在老的Exporter类中，对象转换逻辑是跟与TBS系统的通信部分混杂在一起的，而在新的设计中，我们将TBSExport组件划分成三个层次，每个层次有且仅有一个职责：

转换器负责将SPOT对象转换成TBS对象
数据记录产生器负责通过TBS对象产生TBS数据记录
文件写入器负责将TBS数据记录输出到外部dbf文件中

下面的代码展示了SPOT中的Order对象是如何经历这三个层次，并最终被导入到TBS系统中的：

public void OnOrderBooked(Order order)

{

    //1) Translate Spot Order to TBS Order:

    TbsOrder tbsOrder = new SpotToTbsOrderTranslator(order).TranslateSpotOrder();

    //2) Create TBS specific data structure from TBSOrder:

TbsTable tqrTable = new OrderTqrGenerator(tbsOrder, database)

                        .GenerateOrderTqrTable();

    //3) Write TBS Files

    GetTbsFileWriter(tqrTable).Write();

}

TBSExport组件的整体结构如下图所示：

图五新的TBSExport设计

这种分离式的设计所带来的众多好处之一，就是我们能够很容易地对处理过程的每个阶段进行单元测试。因此，一旦出现Bug，我们也就能够很快地找到问题所在。

反转SPOT与TBSExport之间的依赖关系

在老的设计中，是SPOT负责将数据传递给TBSExport的。这就要求SPOT能够知道调用TBSExport的时机和方式，于是，SPOT中的很多对象都需要依赖TBSExport，它们甚至还需要了解TBSExport的实现细节，以便能够正确地将数据传递给TBSExport。这种数据“推送”方式存在很多问题，它将原本就具有复杂业务逻辑的SPOT变得更为复杂：因为SPOT不仅需要专注于处理其本身的业务逻辑，而且还要关注数据传递的技术细节。不仅如此，今后可能还会有其它的外部系统需要与SPOT进行集成，如果仍然沿用旧的设计，那么SPOT将会乱成一团。

一种比较可行的方案是采用观察者模式：即当SPOT中发生某个事件时通知TBSExport。我们可以使用.NET中的事件来实现观察者模式。为了让实现起来更为简单，我们使用了定义在类级别的“静态”事件，这就使我们能够在服务启动的时候，直接将TBSExport的事件处理函数注册到SPOT的事件上，同时也使我们能够以一种更为灵活的方式来配置测试项目。

图六 SPOT和TBS之间的依赖关系

比如，OrderManager中定义了一个静态事件，创建新的Order对象时，都会触发这个静态事件：

public class OrderManager

{

    public static event OrderEventHandler OrderBooked;

    public void BookOrder(Order order)

    {

        //…book order and update order entry in database

        if (OrderBooked != null)

            OrderBooked(order); //fire event

    }

}

TBSExport将会订阅这个OrderBooked事件：

public class TbsExportManager

{

    public void SubscribeToSpotEvents()

    {

        OrderManager.OrderBooked += new OrderEventHandler(OnOrderBooked);

        //subscribe to other SPOT events

    }

}

在每次创建Order时，OrderManager所要做的仅仅是触发OrderBooked事件，而对接下来能够发生的事情一无所知（事实上它也不需要知道）。当订阅了该事件的TBSExport发现事件已被触发时，它的 OnOrderBooked()方法将被调用，数据导出工作正式开始。这种设计反转了SPOT与外部系统的依赖关系，而且更重要的是，今后如果有其它的外部系统需要与SPOT集成的话，这些系统都能够通过事件来获得SPOT中的信息，而无需对SPOT进行任何修改。

总而言之，以上描述的所有设计上的更改都遵循一个简单的原则：尽可能地减少SPOT领域层对TBS的引用。

结论

通常情况下，我们都会很自然地将TBSExport设计成类似本文最开始所描述的“集成枢纽（integration gateway）”组件，这样的设计一开始是能够正常工作的。然而，随着越来越多的外部系统的引入，这样的设计不仅会给TBSExport带来不可控制的复杂度，而且会将TBS的相关逻辑带入SPOT的领域层中，使得SPOT的领域层不仅需要处理本身的业务逻辑，而且还需要完成与TBS相关的数据导出操作。最关键的问题是，这种设计没有能够完全地将SPOT和TBS的数据转换逻辑封装起来，从而导致两者的概念模型都越过了各自的边界而交织在一起。

解决这些问题的方案是，将TBSExport设计为防腐层，以便隔离SPOT与TBS，使两者各自的业务逻辑都不会泄漏到对方的领域中。我们所设计的防腐层大致包含了以下几个方面：

TBSExport所提供的服务都是用SPOT的领域语言来描述的，它包含的接口都是以SPOT中的领域对象作为参数的，比如Order和Customer
TBSExport完全封装了从SPOT领域对象到TBS数据记录的转换逻辑。我们采用了一种更为创新的方式来应对转换逻辑的复杂度：先从TBS中提炼出隐含的领域模型，一开始并不需要将整个TBS的领域模型完全提炼出来，只需要关注我们需要进行数据转换的部分。我们的经验是，对一个外部系统模型的充分提炼，并不要求这个系统是以面向对象的方式实现的，而这也正是在两套系统的概念模型与功能行为之间实现精准、可扩展的“转换”的关键所在
转换逻辑与底层的通信机制分离
SPOT领域对象并不依赖于TBSExport，TBSExport通过观察者模式与SPOT松耦合

在完成了新的设计后，TBSExport就成为了整个软件系统中最复杂的部分，但新设计所带来的松耦合与延展性，保证了系统的可维护性。整个模型重构工程花费了4至6个团队近6个星期的时间，之后项目就进展得非常顺利，花费在开发和测试TBSExport组件上的工作量仅占了整个项目工作量不到10%的比例，比原来减少近66%。开发人员对TBSExport产生恐惧心理的日子从此一去不复返。

感谢

感谢Heather Regehr在项目管理方面给予的支持；感谢Eric Evans对架构设计的独特见解以及对项目开发的专业指导；感谢Daniel Gackle对项目和本文所作出的贡献；感谢Brenda Lowe以及QA团队的积极配合；感谢Taj Khattra、Alex Aizikovsky、George Zhu、Todd Ariss以及整个Custom House开发团队为项目的成功所作出的贡献。

参考文献

Eric Evans, Domain-Driven Design, Tackling Complexity in the Heart of Software（《领域驱动设计：软件核心复杂性应对之道》）, Addison-Wesley, 2003, ISBN 0-321-12521-5
Ying Hu and Sam Peng, So We Thought We Knew Money（《我们原以为自己知道“货币”》注：一篇有关于值对象的论文）, available from http://www.domaindrivendesign.org/practitioner_reports/hu_ying_2007_01.html

三分钟让你搞懂云计算中的CDN是什么？云上的阿七云计算
随着互联网的快速发展，网站的访问速度和稳定性越来越受到重视。而在众多提升网站性能的技术中，CDN（内容分发网络）无疑是一个非常重要的工具。今天，我们就来聊聊云计算中的CDN是什么，以及它是如何为网站带来显著好处的。CDN是什么？CDN，全称ContentDeliveryNetwork，翻译过来就是“内容分发网络”。它是一种分布式的网络架构，通过将网站的静态资源（如图片、视频、JavaScript文
RNN及其变体 EmbodiedTech 人工智能大模型自然语言处理
第三章RNN及其变体1认识RNN模型【根据RNN内部结构，可以分为哪几类】定义循环神经网络：一般接受的一序列进行输入，输出也是一个序列作用和应用场景RNN擅长处理连续语言文本，机器翻译、文本生成、文本分类、摘要生成RNN模型的分类根据输入与输出结构NVsN:输入和输出等长，应用场景：对联生成；词性标注；NERNVs1:输入N，输出为单值，应用场景：文本分类1VsN:输入是一个，输出为N，应用场景：
linux makefile tutorial oushaojun2 linux makefile
一个makefile的教程，几个小时就能看完，对makefile有个总体加细节的系统了解，非常不错：LearnMakefilesWiththetastiestexamples中文翻译版：起步-Makefile教程(gavinliu6.github.io)gcc官网手册（用于查找语法细节）：GNUmakemakefile总体跟shell有八成是类似的，不一样的只是几个判断语句和内部函数，以前老是掌握
我的Notepad++插件推荐硫酸锌01 Windows ide 编辑器
上一篇文章我对x86版本的Notepad++官方支持的167个第三方插件，做了一个总结和翻译介绍。这几天我对感兴趣的插件做了一些测试，推荐22个高频使用的实用插件。Notepad++的插件可以从菜单栏的插件-插件管理中查找并下载：或者也可以下载文件后将插件拷贝到Notepad++安装目录下的plugins目录下。其中本文提到的全部22个插件我已经上传到了网盘。其中我对dll文件使用了upx压缩，所
LangChain使用Prompt02 科研小达人 langchain 前端
1.设置提示fromlangchain.promptsimportChatPromptTemplateprompt_template=ChatPromptTemplate.from_messages([("system","你是一位专业的翻译，能够将{input_language}翻译成{output_language}，并且输出文本会根据用户要求的任何语言风格进行调整。请只输出翻译后的文本，不要
Lec01-什么是安全？蛋蛋deべ忧桑安全
本文使用人工智能协助翻译，内容仅供参考，可能有错误或遗漏。如果你对内容或超链接有疑问，可以查看原文。参考资料地址：https://github.com/PKUFlyingPig/MIT6.16006.1600课程团队：HenryCorrigan-Gibbs,YaelKalai,BenKettle(TA),NickolaiZeldovich2022年秋季[!warning]免责声明本套笔记为正在进行
goldengate sqlserver mysql_Oracle GoldenGate 之 SqlServer数据同步到Mysql数据库 Huawei_Germany goldengate sqlserver mysql
C:\OGG>INSTALLADDSERVICEService'GGSMGR'created.Installprogramterminatednormally.C:\OGG>配置ODBC数据源MicrosoftSQLServerODBC驱动程序版本06.01.7601数据源名称:oa_test数据源描述:服务器:WIN-UGCMTTOTKE7数据库:(Default)语言:(Default)翻译字
Mothur 命令手册-Mothur命令中文解释（二） a12141986 人工智能操作系统 shell
Mothur命令中文解释——Mothur中文简易教程这些是mothurH-Z的目前所有命令的说明的翻译，第二部分。（使用Ctrl+F搜索你所查命令）参看http://www.mothur.org/wiki/Category:Commands页面上查阅的所有命令我查了一下网上的中文教程，似乎没有。现在国内使用Mothur的人还很少，不过国外有不少做生态的都用到mothur了。毕竟有很多都是命令行操作
OpenAI Agents SDK 中文文档中文教程（6） wtsolutions openai agents sdk openai agents sdk python 中文
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接(3)
Linux下的socket编程学习（TCP）小苏同学的脱发日记 linux 学习 tcp/ip
1.什么是socket？socket的英文翻译就是接口，插座的意思，很形象，就相当于将2台电脑用一根线连起来，线的两头插在不同的电脑上，借此实现通讯的功能。两台电脑通信，实际上是这两台电脑上的某个进程在进行通信。而两个进程进行通信，实际上是往同一个文件中读取数据。2.TCP/IP（3次握手）在tcp/ip协议中，tcp通过三次握手建立起一个tcp的链接，大致如下第一次握手：客户端尝试连接服务器，向
【多模态处理篇五】【DeepSeek文档解析：PDF/Word智能处理引擎】再见孙悟空_ 「2025 DeepSeek技术全景实战」web安全 notion 人工智能 DeepSeek DeepSeek文档 DeepSeek解析文档 DeepSeek PDF
你知道吗？全球每天产生的PDF文档超过10亿份，但90%的上班族还在用复制粘贴的笨办法处理文档！DeepSeek文档解析引擎就像给你的电脑装上了"文档翻译官"，能把PDF/Word里的文字、表格、公式甚至排版样式都变成AI能理解的"语言"。举个真实场景：法务小姐姐用这个工具处理200页的英文合同时，5分钟就能提取出关键条款、风险点、履约时间线，效率直接翻10倍！一、核心技术解析：文档处理的"庖丁解
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
DIFFERENTIAL TRANSFORMER UnknownBody LLM Daily 深度学习人工智能 transformer
本文是LLM系列文章，针对《DIFFERENTIALTRANSFORMER》的翻译。差分Transformer摘要1引言2差分Transformer3实验4结论摘要Transformer倾向于将注意力过度分配到无关的上下文中。在这项工作中，我们引入了DIFFTransformer，它在消除噪声的同时增强了对相关上下文的关注。具体而言，差分注意力机制将注意力得分计算为两个单独的softmax注意力图
[官文翻译]Flutter状态管理库Riverpod - 所有的Provider - StateProvider 2401_84166236 2024年程序员学习 flutter
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提
selenium 等待ajax,如何等待Selenium IDE中的所有ajax请求完成？华西怀 selenium 等待ajax
我有一阵子没用过IDE。这是我用于WebDriver的。但算法翻译;JavaScript是JavaScript。这就是说，这取决于你的框架。对于角度，我用这个：publicbooleanwaitForAngularToLoad(WebDriverdriver,intwaitTimeInSeconds){WebDriverWaitwait=newWebDriverWait(driver,waitTi
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
数据增强正在杀死你的模型：90%开发者不知道的回译质量陷阱人工智能
1回译增强的核心机理1.1跨语言语义重构原理目前文本数据增强方面效果较好的增强方法。回译数据增强（Back-translationAugmentation）是基于神经机器翻译的文本再生技术，其核心运作流程包含三个关键阶段：语义编码阶段：源语言文本通过NMT模型编码为中间语义表示跨语言迁移阶段：语义表示解码为目标语言文本（建议选择阿尔巴尼亚语、斯瓦希里语等低资源语种）语义重构阶段：目标语言文本二次编
Linux和RTOS简析 niuTaylor linux 运维服务器 macos macbook air 换硬盘扩内存
以下是针对Linux驱动开发、RTOS（实时操作系统）任务状态（就绪态）以及互斥锁的详细解释：一、Linux设备驱动1.什么是设备驱动？定义：设备驱动是操作系统内核的一部分，用于管理和控制硬件设备（如摄像头、键盘、传感器等）。作用：充当硬件与操作系统/应用程序之间的“翻译官”，将操作系统的指令转换为硬件能理解的信号，反之亦然。2.驱动分类字符设备驱动：按字节流访问的设备（如键盘、鼠标）。块设备驱动
热门AI创作助手推荐【第一期】量子星澜文心一言 AI写作 chatgpt
星游AI创作助手人工智能在现代科技中的应用非常广泛，涵盖了诸多领域，包括但不限于以下几个方面：1.语音识别和自然语言处理：人工智能技术被广泛应用于语音识别和自然语言处理领域，例如智能助手、翻译系统、语音交互系统等。2.机器学习和数据分析：人工智能的机器学习算法被用于数据分析、预测建模、用户个性化推荐等领域，帮助企业做出更准确的商业决策。3.计算机视觉：人工智能在计算机视觉领域的应用包括图像识别、视
OpenAI Agents SDK 中文文档中文教程（1） wtsolutions openai agents sdk openai agents sdk python 中文文档教程
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接目录O
大规模语言模型从理论到实践开源指令数据集 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践开源指令数据集1.背景介绍大规模语言模型（LargeLanguageModels,LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。诸如GPT-3、BERT等模型在各种任务中表现出色，从文本生成到翻译，再到问答系统，几乎无所不能。这些模型的成功离不开庞大的训练数据集和复杂的算法架构。然而，如何有效地构建和利用开源指令数据集，仍然是一个值得深入探讨的话题。2.核
Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
大语言模型原理与工程实践：大语言模型强化对齐 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：大语言模型强化对齐作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的迅猛发展，大语言模型（LargeLanguageModels，LLMs）如GPT-3、LaMDA等，在自然语言处理（NLP）领域取得了显著的突破。这些模型在问答、翻译、文本生成等方面展现出惊人的能力，但同时也引发了
Transformer动画讲解 - 工作原理 ghx3110 transformer 深度学习人工智能
Transformer模型在多模态数据处理中扮演着重要角色，其能够高效、准确地处理包含不同类型（如图像、文本、音频、视频等）的多模态数据。Transformer工作原理四部曲：Embedding（向量化）、Attention（注意力机制）、MLPs（多层感知机）和Unembedding（模型输出）。阶段一：Embedding（向量化）“Embedding”在字面上的翻译是“嵌入”，但在机器学习和自
lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
Android Jetpack qq_39892855
AndroidJetpack翻译Jetpack是一套让开发者更容易开发出完美安卓应用的组件。这个组件帮助你遵循最好的实践，让你减少写一些模板代码，简化复杂的task任务，能让你更加专注自己的业务代码。Jetpack使用的是androidx.*包名，与旧的android.*分开。这意味着它提供向后兼容性并且他会更频繁地更新，确保您始终可以访问最新和最好的Jetpack组件版本。特点加速开发组件可以单
2025年开源大模型全景：语言、多模态与开发工具的前沿探索软件职业规划开源
语言类开源大模型1.Llama系列开发者：Meta发布时间：2024年7月参数量：8B、70B、405B特点：Llama系列模型以其强大的多语言支持和广泛的自然语言处理能力而闻名。它支持文本生成、问答、翻译等多种任务，尤其在处理长篇文本时表现出色，支持高达128K的上下文长度。Meta与超过25个合作伙伴共同推出该系列模型，包括亚马逊云科技、Databricks和英伟达等，推动了开源大模型在工业界
吴恩达的翻译Agent项目，复现教程来了！ datawhale
原创郭才高DatawhaleDatawhale教程作者：郭才高，Datawhale创作者1.TranslationAgent复现效果展示#执行任务#调用编译后的工作流，传入初始状态字典result=app.invoke({ "source_lang": "English", #源语言为英语 "target_lang": "中文", #目标语言为中文 "source_text": ""
C语言：整数、浮点数在内存中的存储代码AC不AC 学习分享 c语言
hello，我又来了！~内存存储1、整数在内存中的存储2、浮点数在内存中的存储3、2中的例题解释1、整数在内存中的存储我们知道：整数的表达式有三种，即：原码、反码和补码。正整数的原码、反码和补码都相同。负整数的三种表达式各不相同。原码：将数值按照负数的形式翻译成二进制得到原码。反码：原码的符号位（首位）不变，其他位依次按位取反就得到反码。补码：反码+1。对整型来说，数据存放的是二进制的补码。原因：
吴恩达机器学习笔记复盘（二）监督学习和无监督学习 wgc2k 机器学习机器学习笔记学习
监督学习经济价值以及定义监督学习是机器学习中创造了99%经济价值的类型，它是学习输入到输出映射的算法，关键在于给学习算法提供包含正确答案（即给定输入X的正确标签Y）的学习例子。生活中的例子邮件分类，输入是电子邮件，输出是判断邮件是否为垃圾邮件。语音识别，输入音频剪辑，输出文本记录。机器翻译，输入一种语言文本，输出其他语言的相应翻译。在线广告，输入广告和用户信息，预测用户是否点击广告，为公司带来大量
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修