Orleans 2.0 官方文档 —— 4.8.1 Grains -> Grain持久化 -> grain持久化的目标

grain持久化的目标

  1. 允许不同的grain类型,使用不同类型的存储提供程序(例如,一个使用Azure表,一个使用ADO.NET),或相同类型的存储提供程序但具有不同的配置(例如,两者都使用Azure表,但一个使用存储帐户#1和一个使用存储帐户#2)
  2. 允许只更改配置文件而不需要更改代码,就能交换存储提供程序实例(例如,Dev-Test-Prod)。
  3. 提供一个框架,以便以后可以由Orleans团队或其他人,编写其他的存储提供程序。
  4. 提供最少一组的生产级存储提供程序
  5. 存储提供程序可以完全控制如何在持久化后端存储中,存储grain的状态数据。结果就是,Orleans没有提供全面的ORM存储解决方案,但允许自定义存储提供程序在需要时支持特定的ORM要求。

grain 持久化 API

可以通过以下两种方式之一声明grain类型:

  • 继承Grain:如果它们没有任何持久化状态,或者它们自己处理所有的持久化状态。
  • 继承Grain:如果它们有一些持久化状态,这些状态希望由Orleans运行时来处理。换句话说,通过继承Grain,grain类型自动选择加入Orleans系统管理的持久性框架。

对于本节的其余部分,我们将仅考虑第2种声明方式 (扩展Grain) ,因为第1种声明方式,grain将继续像现在一样运行,而不会有任何行为更改。

grain 状态存储

Grain继承的grain类,(其中T是需要被持久化的、特定于应用程序的状态数据类型)将从指定的存储中自动加载其状态。

grain将标记一个[StorageProvider]属性,该属性指定存储提供程序的命名实例,用于读取/写入此grain的状态数据。

[StorageProvider(ProviderName="store1")]
public class MyGrain<MyGrainState> ...
{
  ...
}

Orleans框架提供了一种机制,来指定和注册不同的存储提供程序,并使用ISiloHostBuilder来配置它们。

var silo = new SiloHostBuilder()
    .AddMemoryGrainStorage("DevStore")
    .AddAzureTableGrainStorage("store1", options => options.ConnectionString = "DefaultEndpointsProtocol=https;AccountName=data1;AccountKey=SOMETHING1")
    .AddAzureBlobGrainStorage("store2", options => options.ConnectionString = "DefaultEndpointsProtocol=https;AccountName=data2;AccountKey=SOMETHING2")
    .Build();

配置IGrainStorage提供程序

Orleans本身支持一系列的IGrainStorage实现,您可以将这些实现用于您的应用程序,来存储grain的状态。在本节中,我们将介绍如何在一个silo中,配置AzureTableGrainStorageAzureBlobGrainStorageDynamoDBGrainStorageMemoryGrainStorage,和AdoNetGrainStorage在。其他IGrainStorage提供程序的配置类似。

AzureTableGrainStorage提供程序

var silo = new SiloHostBuilder()
    .AddAzureTableGrainStorage("TableStore", options => options.ConnectionString = "UseDevelopmentStorage=true")
    ...
    .Build();

通过AzureTableGrainStorageOptions,以下设置可用于配置AzureTableGrainStorage提供程序:

    /// 
    /// Configuration for AzureTableGrainStorage
    /// 
public class AzureTableStorageOptions
{
        /// 
        /// Azure table connection string
        /// 
        [RedactConnectionString]
        public string ConnectionString { get; set; }

        /// 
        /// Table name where grain stage is stored
        /// 
        public string TableName { get; set; } = DEFAULT_TABLE_NAME;
        public const string DEFAULT_TABLE_NAME = "OrleansGrainState";

        /// 
        /// Indicates if grain data should be deleted or reset to defaults when a grain clears it's state.
        /// 
        public bool DeleteStateOnClear { get; set; } = false;

        /// 
        /// Stage of silo lifecycle where storage should be initialized.  Storage must be initialzed prior to use.
        /// 
        public int InitStage { get; set; } = DEFAULT_INIT_STAGE;
        public const int DEFAULT_INIT_STAGE = ServiceLifecycleStage.ApplicationServices;

        #region json serialization
        public bool UseJson { get; set; }
        public bool UseFullAssemblyNames { get; set; }
        public bool IndentJson { get; set; }
        public TypeNameHandling? TypeNameHandling { get; set; }
        #endregion json serialization
}

注意:状态大小不应超过64KB,这是Azure Table Storage强加的限制。

AzureBlobGrainStorage提供程序

var silo = new SiloHostBuilder()
    .AddAzureBlobGrainStorage("BlobStore", options => options.ConnectionString = "UseDevelopmentStorage=true")
    ...
    .Build();

通过AzureBlobStorageOptions,以下设置可用于配置AzureBlobGrainStorage提供程序:

public class AzureBlobStorageOptions
{
        /// 
        /// Azure connection string
        /// 
        [RedactConnectionString]
        public string ConnectionString { get; set; }

        /// 
        /// Container name where grain stage is stored
        /// 
        public string ContainerName { get; set; } = DEFAULT_CONTAINER_NAME;
        public const string DEFAULT_CONTAINER_NAME = "grainstate";

        /// 
        /// Stage of silo lifecycle where storage should be initialized.  Storage must be initialzed prior to use.
        /// 
        public int InitStage { get; set; } = DEFAULT_INIT_STAGE;
        public const int DEFAULT_INIT_STAGE = ServiceLifecycleStage.ApplicationServices;

        #region json serialization
        public bool UseJson { get; set; }
        public bool UseFullAssemblyNames { get; set; }
        public bool IndentJson { get; set; }
        public TypeNameHandling? TypeNameHandling { get; set; }
        #endregion json serialization
}

DynamoDBGrainStorage提供程序

var silo = new SiloHostBuilder()
    .AddDynamoDBGrainStorage("DDBStore", options =>
    {
        options.AccessKey = "MY_ACCESS_KEY";
        options.SecretKey = "MY_SECRET_KEY";
        options.Service = "us-wes-1";
    })
    ...
    .Build();

通过DynamoDBStorageOptions,以下设置可用于配置DynamoDBGrainStorage提供程序:

public class DynamoDBStorageOptions
{
        /// 
        /// Gets or sets a unique identifier for this service, which should survive deployment and redeployment.
        /// 
        public string ServiceId { get; set; } = string.Empty;

        /// 
        /// AccessKey string for DynamoDB Storage
        /// 
        [Redact]
        public string AccessKey { get; set; }

        /// 
        /// Secret key for DynamoDB storage
        /// 
        [Redact]
        public string SecretKey { get; set; }

        /// 
        /// DynamoDB Service name 
        /// 
        public string Service { get; set; }

        /// 
        /// Read capacity unit for DynamoDB storage
        /// 
        public int ReadCapacityUnits { get; set; } = DynamoDBStorage.DefaultReadCapacityUnits;

        /// 
        /// Write capacity unit for DynamoDB storage
        /// 
        public int WriteCapacityUnits { get; set; } = DynamoDBStorage.DefaultWriteCapacityUnits;

        /// 
        /// DynamoDB table name.
        /// Defaults to 'OrleansGrainState'.
        /// 
        public string TableName { get; set; } = "OrleansGrainState";

        /// 
        /// Indicates if grain data should be deleted or reset to defaults when a grain clears it's state.
        /// 
        public bool DeleteStateOnClear { get; set; } = false;

        /// 
        /// Stage of silo lifecycle where storage should be initialized.  Storage must be initialzed prior to use.
        /// 
        public int InitStage { get; set; } = DEFAULT_INIT_STAGE;
        public const int DEFAULT_INIT_STAGE = ServiceLifecycleStage.ApplicationServices;

        #region JSON Serialization
        public bool UseJson { get; set; }
        public bool UseFullAssemblyNames { get; set; }
        public bool IndentJson { get; set; }
        public TypeNameHandling? TypeNameHandling { get; set; }
        #endregion
    }

ADO.NET grain存储提供程序

ADO .NET grain 存储提供程序,允许您在关系数据库中存储grain状态。目前支持以下数据库:

  • SQL Server
  • MySQL/ MariaDB
  • PostgreSQL
  • Oracle

首先,安装基础包:

Install-Package Microsoft.Orleans.Persistence.AdoNet

还原项目的nuget包后,您就会找到支持的数据库供应商的不同SQL脚本,这些脚本被复制到项目目录\OrleansAdoNetContent中,其中每个受支持的ADO.NET扩展都有自己的目录。您也可以从Orleans.Persistence.AdoNet库中获取它们。创建数据库,然后运行相应的脚本来创建表。

接下来的步骤是,安装第二个特定于所需数据库供应商的NuGet包(参见下表),并以编程方式或通过XML,配置存储提供程序。

数据库 脚本 NuGet包 AdoInvariant 备注
SQL Server SQLServer的-Persistence.sql System.Data.SqlClient System.Data.SqlClient  
MySQL / MariaDB MySQL-Persistence.sql MySql.Data MySql.Data.MySqlClient  
PostgreSQL PostgreSQL-Persistence.sql Npgsql Npgsql  
Oralce Oracle-Persistence.sql ODP.net Oracle.DataAccess.Client 不支持.net core

以下是如何通过ISiloHostBuilder配置ADO.NET存储提供程序的示例:

var siloHostBuilder = new SiloHostBuilder()
    .AddAdoNetGrainStorage("OrleansStorage", options=>
    {
        options.Invariant = "";
        options.ConnectionString = "";
        options.UseJsonFormat = true;
    });

实质上,您只需要设置特定于数据库供应商的连接字符串和标识供应商的 Invariant(参见上表)。您还可以选择保存数据的格式,可以是二进制(默认),JSON或XML。虽然二进制是最紧凑的选项,但它是不透明的,您将无法读取或处理数据。建议使用JSON。

您可以通过AdoNetGrainStorageOptions,设置以下属性:


/// 
/// Options for AdonetGrainStorage
/// 
public class AdoNetGrainStorageOptions
{
        /// 
        /// Connection string for AdoNet storage.
        /// 
        [Redact]
        public string ConnectionString { get; set; }

        /// 
        /// Stage of silo lifecycle where storage should be initialized.  Storage must be initialzed prior to use.
        /// 
        public int InitStage { get; set; } = DEFAULT_INIT_STAGE;
        /// 
        /// Default init stage in silo lifecycle.
        /// 
        public const int DEFAULT_INIT_STAGE = ServiceLifecycleStage.ApplicationServices;

        /// 
        /// The default ADO.NET invariant used for storage if none is given. 
        /// 
        public const string DEFAULT_ADONET_INVARIANT = AdoNetInvariants.InvariantNameSqlServer;
        /// 
        /// The invariant name for storage.
        /// 
        public string Invariant { get; set; } = DEFAULT_ADONET_INVARIANT;

        #region json serialization related settings
        /// 
        /// Whether storage string payload should be formatted in JSON.
        /// If neither  nor  is set to true, then BinaryFormatSerializer will be configured to format storage string payload.
        /// 
        public bool UseJsonFormat { get; set; }
        public bool UseFullAssemblyNames { get; set; }
        public bool IndentJson { get; set; }
        public TypeNameHandling? TypeNameHandling { get; set; }
        #endregion
        /// 
        /// Whether storage string payload should be formatted in Xml.
        /// If neither  nor  is set to true, then BinaryFormatSerializer will be configured to format storage string payload.
        /// 
        public bool UseXmlFormat { get; set; }
}

ADO.NET持久化具有:版本数据,以及使用任意应用程序规则和流定义任意(反)序列化程序的功能,但目前没有方法将它们暴露给应用程序代码。参见ADO.NET Persistence Rationale中的更多信息。

MemoryGrainStorage

MemoryGrainStorage是一个简单的grain存储实现,它背后实际上并没有使用持久化数据存储。便于快速学习使用grain 存储,但不要打算用于生产场景。

注意:此提供程序将状态持久化为易失性内存,该内存将在silo关闭时被删除。仅用于测试。

以下通过ISiloHostBuilder,如何设置内存存储提供程序 。

var siloHostBuilder = new SiloHostBuilder()
    .AddMemoryGrainStorage("OrleansStorage", options=>options.NumStorageGrains = 10);

您可以通过MemoryGrainStorageOptions,设置以下属性:

/// 
/// Options for MemoryGrainStorage
/// 
public class MemoryGrainStorageOptions
{
        /// 
        /// Default number of queue storage grains.
        /// 
        public const int NumStorageGrainsDefaultValue = 10;
        /// 
        /// Number of store grains to use.
        /// 
        public int NumStorageGrains { get; set; } = NumStorageGrainsDefaultValue;

        /// 
        /// Stage of silo lifecycle where storage should be initialized.  Storage must be initialzed prior to use.
        /// 
        public int InitStage { get; set; } = DEFAULT_INIT_STAGE;
        /// 
        /// Default init stage
        /// 
        public const int DEFAULT_INIT_STAGE = ServiceLifecycleStage.ApplicationServices;
}

存储提供程序的注意事项

如果没有为一个Grain的grain类指定[StorageProvider]属性,则将搜索名为Default的提供程序。如果未找到,则将其视为缺少存储提供程序。

如果在配置时,未将grain类引用的存储提供程序添加到silo中,则该类型的grain将无法在运行时激活,并且对它们的调用将失败,异常信息Orleans.Storage.BadProviderConfigException指出此grain类型未被加载。但其余的grain类型不会受到影响。

不同的grain类型,可以使用不同的已配置的存储提供程序,即使两者都是相同的类型:例如,两个不同的Azure表存储提供程序实例,它们连接到不同的Azure存储帐户(请参阅上面的配置文件示例)。

存储提供程序的所有详细配置的信息都是通过ISiloHostBuilder定义的。目前没有提供动态更新或更改一个silo所使用的存储提供程序列表的机制。但是,这是一个优先级/工作负载约束,而不是一个基本设计约束。

状态持久化 API

状态持久化API有两个部分:grain状态API和存储提供程序API。

grain状态API

Orleans 运行时中的grain状态存储功能,将提供读写操作,以自动填充/保存该grain的数据对象GrainState。在幕后,这些功能将连接(在Orleans client-gen工具生成的代码中)到为该grain配置的适当的持久化提供程序。

grain状态的读/写功能

当一个grain被激活时,grain状态会被自动读取,不过,grain负责在必要时显式地触发任何改变的grain状态的写入。有关错误处理机制的详细信息,请参阅下面的“ 故障模式”部分。

在为该激活调用OnActivateAsync()方法之前GrainState被自动读取(等同于使用base.ReadStateAsync())。 在任何方法调用一个grain之前,除非该grain被这个调用激活,否则GrainState不会被刷新。

在任何grain方法调用期间,grain都可以通过调用base.WriteStateAsync(),请求Orleans运行时将该激活体的当前grain状态数据,写入指定的存储提供程序。当对其状态数据进行重大更新时,grain负责显式地执行写操作。最常见的做法是,grain方法把base.WriteStateAsync() 的Task,作为从该grain方法返回的最终结果Task,但不是必须要遵循此模式。在任何grain方法调用之后,运行时不会自动更新存储的grain状态。

在grain中的任何grain方法或定时器回调处理方法中,grain通过调用base.ReadStateAsync(),请求Orleans运行时从指定的存储提供程序中,重新读取当前grain状态数据,以进行该激活操作。这将使用从持久化存储中读取的最新状态数据,完全覆盖存储在grain状态对象中的当前的状态数据。

一个隐性的特定于提供程序的Etag值(string),当状态被读取时,可以由存储提供程序设置为占据grain状态的元数据的一部分。某些提供程序如果不使用Etag的话,可以选择将其保留为null

从概念上讲,Orleans 运行时会持有grain状态数据对象的深拷贝,以供自己在任何写操作时使用。在幕后,运行时可以使用优化规则和启发式方法,来避免在某些情况下执行部分或全部的深拷贝,前提是预留了预期的逻辑隔离语义。

grain状态读/写操作的示例代码

grain必须继承Grain类,才能参与Orleans的grain状态持久化机制。上述定义中的T将被替换为该grain的特定于应用程序的grain状态类;见下面的例子。

grain类还应该使用一个[StorageProvider]属性进行注解,该属性告诉运行时,哪个存储提供程序(实例)与此类型的grain一起使用。

public class MyGrainState
{
  public int Field1 { get; set; }
  public string Field2 { get; set; }
}

[StorageProvider(ProviderName="store1")]
public class MyPersistenceGrain : Grain<MyGrainState>, IMyPersistenceGrain
{
  ...
}

grain状态读取

在调用grain的OnActivateAsync()方法之前,Orleans运行时将自动进行grain状态的初始读取;不需要任何应用程序代码即可实现此操作。从这一刻起,grain的状态可以通过grain类内的属性Grain.State来获得。

grain状态写入

在对grain的内存状态进行任何适当的更改之后,grain应该调用base.WriteStateAsync()方法,通过为此grain类型定义的存储提供程序,将更改写入持久化存储。此方法是异步的,并返回一个Task,此Task通常被grain方法作为它自己的完成Task返回。

public Task DoWrite(int val)
{
  State.Field1 = val;
  return base.WriteStateAsync();
}

grain状态刷新

如果grain希望从后端存储显式地重读此grain的最新状态,那么grain应该调用base.ReadStateAsync()方法。这将通过为该grain类型定义的存储提供程序,从持久化存储中重新加载grain状态,当ReadStateAsync() Task完成时,将覆盖并替换在先前的内存中的grain状态副本。

public async Task<int> DoRead()
{
  await base.ReadStateAsync();
  return State.Field1;
}

grain状态持久化操作失败的模式

grain状态读取操作失败的模式

在初始读取特定grain的状态数据期间,存储提供程序返回的失败,将导致该grain的激活操作失败; 在这种情况下,不会调用该grain的生命周期回调方法OnActivateAsync()。对引发该grain激活的原始请求,将以与grain激活期间的任何其他失败相同的方式,以失败的形式被返回给调用者。存储提供程序在读取特定grain的状态数据时,所遭遇的失败将导致ReadStateAsync() Task失败。grain可以选择处理或忽略失败的Task,就像Orleans的其他任何Task一样。

在silo启动时,某个grain由于存储提供程序配置的缺少/错误,而未能成功加载,此时尝试将消息发送到该grain,将返回永久性错误Orleans.BadProviderConfigException

grain状态写入操作失败的模式

存储提供程序写入特定grain的状态数据时遇到的失败,将导致WriteStateAsync() Task失败。通常,这意味着,grain调用将以失败的形式,被返回给客户端调用程序,前提是WriteStateAsync() Task被正确地链入到此grain方法的最终返回的Task。但是,某些高级场景下,可能会编写grain代码来专门处理此类写入错误,就像它们可以处理任何其他失败的Task一样。

执行错误处理/恢复代码的grain,必须捕获异常/失败的WriteStateAsync() Task,而不是重新抛出,以表示它们已成功处理写入错误。

存储提供程序API

有一个服务提供程序API,用于编写额外的持久化提供程序 —— IGrainStorage

Persistence Provider API涵盖了GrainState数据的读写操作。

/// 
/// Interface to be implemented for a storage able to read and write Orleans grain state data.
/// 
public interface IGrainStorage
{
        /// Read data function for this storage instance.
        /// Type of this grain [fully qualified class name]
        /// Grain reference object for this grain.
        /// State data object to be populated for this grain.
        /// Completion promise for the Read operation on the specified grain.
        Task ReadStateAsync(string grainType, GrainReference grainReference, IGrainState grainState);

        /// Write data function for this storage instance.
        /// Type of this grain [fully qualified class name]
        /// Grain reference object for this grain.
        /// State data object to be written for this grain.
        /// Completion promise for the Write operation on the specified grain.
        Task WriteStateAsync(string grainType, GrainReference grainReference, IGrainState grainState);

        /// Delete / Clear data function for this storage instance.
        /// Type of this grain [fully qualified class name]
        /// Grain reference object for this grain.
        /// Copy of last-known state data object for this grain.
        /// Completion promise for the Delete operation on the specified grain.
        Task ClearStateAsync(string grainType, GrainReference grainReference, IGrainState grainState);
}

存储提供程序的语义

当存储提供程序检测到Etag约束冲突时,任何执行写入操作的尝试,都应该导致写入Task失败,并出现瞬时错误Orleans.InconsistentStateException,并包装底层的存储异常。

public class InconsistentStateException : AggregateException
{
  /// The Etag value currently held in persistent storage.
  public string StoredEtag { get; private set; }
  /// The Etag value currently held in memory, and attempting to be updated.
  public string CurrentEtag { get; private set; }

  public InconsistentStateException(
    string errorMsg,
    string storedEtag,
    string currentEtag,
    Exception storageException
    ) : base(errorMsg, storageException)
  {
    this.StoredEtag = storedEtag;
    this.CurrentEtag = currentEtag;
  }

  public InconsistentStateException(string storedEtag, string currentEtag, Exception storageException)
    : this(storageException.Message, storedEtag, currentEtag, storageException)
  { }
}

写入操作的任何其他失败,都应该导致写入Task中断,并带有一个异常信息,此异常信息包含底层的存储异常。

数据映射

各个存储提供程序应该决定如何最好地存储grain状态 ——blob(各种格式/序列化形式)或column-per-field是显而易见的选择。

Azure Table的基本存储提供程序,使用Orleans二进制序列化,将状态数据字段编码为单个表列。

ADO.NET持久化基础理论

ADO.NET支持的持久化存储的原则是:

  1. 在数据,数据格式和代码的演变过程中,保护关键业务数据的安全。
  2. 利用供应商和特定于存储的功能。

实际上,这意味着遵循ADO.NET的实现目标,并在特定于ADO.NET的存储提供程序中,添加一些实现逻辑,以使存储中的数据形态不断演化。

除了通常的存储提供程序功能外,ADO.NET提供程序还具有内置功能:

  1. 在往返状态时,将存储数据格式从一种格式更改为另一种格式(例如,从JSON到二进制)。
  2. 以任意的方式,塑造要保存或从存储中读取的类型。这有助于改进版本状态。
  3. 以流数据的形式,从数据库中获取数据。

1.和2.可以被应用任意的决策参数,例如grain IDgrain类型有效载荷数据

这样做是为了选择一种格式,例如简单二进制编码(SBE),并实现了 IStorageDeserializer和IStorageSerializer。内置的(反)序列化器是使用此方法构建的。该OrleansStorageDefault(反)序列化 可以用作如何实现其他格式的示例。

当(de)序列化器被实现后,它们需要添加到AdoNetGrainStorage中的StorageSerializationPicker属性中。这是IStorageSerializationPicker的一个实现。默认情况下, 将使用StorageSerializationPicker。在RelationalStorageTests中,可以看到更改数据存储格式或使用(反)序列化器的示例。

目前没有方法将此公开给Orleans应用程序消费,因为没有方法可以访问框架创建的AdoNetGrainStorage。

你可能感兴趣的:(Orleans)