ChaITSimpleLove

ETL.NET 助力海量数据轻松处理

什么是 ETL & EtlT ？
- About ETL
- About EtlT
谈谈 ETL 作用
- ETL 对企业的作用
- ETL 对个人职业发展的作用
ETL.NET 介绍
- ETL.NET 功能特点
- - 1、它包含 SSIS 的所有转换和功能
  - 2、开箱即用的功能
如何使用 ETL.NET ?
- ETL.NET 相关资源
- Paillave.EtlNet 系列 Nuget 包
- Examples 应用举例
- - 1、创建控制台项目
  - 2、添加依赖 nuget 包
  - 3、应用案例代码编写
  - 4、准备数据库表结构
  - 5、准备数据源
- 验证测试

随着数字化转型的不断深入，数据在企业和个人生活中扮演着日益重要的角色。

在企业方面，数据可以帮助企业更好地了解客户需求、市场趋势和业务表现，从而更好地制定战略和决策。此外，数据还可以帮助企业优化业务流程、提高效率和降低成本。

在个人生活方面，数据也扮演着越来越重要的角色。例如，我们使用智能手机、智能手表等设备时，这些设备会收集我们的健康数据、位置数据等信息，帮助我们更好地管理自己的生活和健康。此外，社交媒体、电子商务等应用程序也会收集我们的数据，以便更好地为我们提供个性化的服务和推荐。

什么是 ETL & EtlT ？

About ETL

ETL（抽取、转换和加载）是一种数据处理方法，它对于企业和个人来说都具有重要意义。

ETL 是一种数据处理方法，它由以下三个步骤组成：

抽取（Extraction）：从多个数据源中提取数据。
转换（Transformation）：对抽取的数据进行清洗、整合、转换和验证，以满足特定的需求。
加载（Loading）：将经过转换的数据加载到目标系统或数据仓库中。

About EtlT

EtlT 它拆分了原有 ETL 和 ELT 的结构，并力求 实时 和 批量 统一在一起处理以满足实时数据仓库和 AI 应用的需求。

EtlT 由以下四个步骤组成：

E(xtract) 抽取：从数据源角度来看，支持传统的线下数据库、传统文件、传统软件同时，还要支持新兴云上数据库、SaaS 软件 API 以及 Serverless 数据源的抽取；从数据抽取方式来看，需要支持实时 CDC（Change Data Capture）对数据库 Binlog 日志的解析，也要支持实时计算（例如 Kafka Streaming），同时也需要支持大批量数据读取（多线程分区读取、限流读取等）。
t(ransform) 规范化：相对于 ETL 和 ELT，EtLT 多出了一个小 t，它的目标是数据规范化（Data Normalization）将复杂、异构的抽取出来数据源，快速地变为目标端可加载的结构化数据，同时，针对 CDC 实时加载 Binlog 进行拆分、过滤、字段格式变更，并支持批量和实时方式快速分发到最终 Load 阶段。
L(oad) 加载：准确的说，加载阶段已经不是简单的数据加载，而是配合 Et 阶段，将数据源的数据结构的变更、数据内容的变更以适合数据目标端（Data Target）的形式快速、准确的加载到数据目标当中，其中，对于数据结构的变化要支持同源数据结构变更（Schema Evolution），数据加载也应该支持大批量加载（Bulk Load）、SaaS 加载（Reverse ETL）、JDBC 加载等。确保既支持实时数据和数据结构的变化，还要支持大批量数据快速加载。
T(ransform) 转化：在云数据仓库、线下数据仓库或新数据联邦的环境下，完成业务逻辑的加工，通常使用 SQL 方式，实时或批量地将复杂业务逻辑准确、快速变为业务端或者 AI 端使用的数据。

在 EtLT 架构下，使用者人群也有了明确的分工：

EtL 阶段：以数据工程师为主，他们将复杂异构的混合数据源，变为数据仓库或者数据联邦可加载的数据，放到数据存储当中，他们无需对企业指标计算规则有深入理解，但需要对各种源数据和非结构化数据变为结构化数据转化有深入理解。他们需要确保的是数据的及时性、数据源到结构化数据的准确性。
T 阶段：以数据分析师、各业务部门数据 SQL 开发者、AI 工程师为主，他们深刻理解企业业务规则，可以将业务规则变为底层结构化数据上的 SQL 语句进行分析统计，最终实现企业内部的数据分析和 AI 应用的实现，他们需要确保的是数据逻辑关系、数据质量以及最终数据结果满足业务需求。

通常情况下，在大数据的处理基本倾向于前面部分的 Etl 环节，而后面的 T 环节 的数据处理倾向于 SQL 统计分析，也就是俗称的 最后一公里。

谈谈 ETL 作用

ETL 对企业的作用

数据整合：企业通常有多个数据源，包括数据库、文件、应用程序等，ETL 能够将这些分散的数据整合在一起，为企业提供全面且一致的数据视图。
数据清洗与质量控制：ETL 可以清洗和验证数据，排除重复、不完整或不准确的数据，提高数据的质量和可靠性。
决策支持：通过将多个数据源中的数据整合起来，并进行转换和分析，ETL 可以为企业提供准确的决策支持信息，帮助管理层做出更明智的决策。
业务流程优化：ETL 可以将数据从不同系统中抽取出来，并进行转换和加载，实现数据在不同系统之间的流动，优化业务流程，提高企业的效率和竞争力。

ETL 对个人职业发展的作用

数据处理和分析能力：掌握 ETL 技术可以使个人具备处理和分析大规模数据的能力。在当今数据驱动的时代，数据处理和分析已成为许多职业领域的核心需求，如数据科学家、业务分析师、市场营销人员等。ETL的知识和技能使个人能够有效地抽取、转换和加载数据，为数据分析和洞察提供基础。
数据整合和管理能力：ETL 能够将分散的数据源整合为一致的数据视图。掌握ETL技术的个人可以有效管理和整合不同来源的数据，提供准确和可靠的数据资源。这对于数据管理岗位、数据架构师、数据工程师等职业来说尤为重要。
决策支持和业务优化能力：ETL 可以为企业提供准确的决策支持信息，并帮助优化业务流程。具备ETL技能的个人可以参与数据驱动的决策制定过程，通过数据抽取、转换和加载，为管理层提供准确的数据报告和分析结果，促进企业的业务发展和效率提升。
跨行业换工作的机会：ETL 技能是一种跨行业的技能，可以应用于各种行业和领域。掌握ETL技术可以使个人具备在不同行业和领域中进行数据处理和分析的能力，扩展个人的职业发展机会。无论是金融、健康、零售还是制造业等，ETL 技能都是广泛需求的，因此具备这一技能可以为个人提供更多的就业和发展选择。

ETL.NET 介绍

.neter 人员大数据处理框架终于来了。

ETL.NET 是一个完全用 .NET 编写的开源框架，可用于多平台使用，并可直接集成到任何 .NET 应用程序中。可以毫不费力地实现快速的、低内存的和易于维护的数据处理，即使是百万数据也能轻松应对。所有用于规范化、更新插入、查找或连接的工具都大大减少了任何导入和转换目的的工作量。处理跟踪的所有内容，错误跟踪都是为开发人员自动完成的。

ETL.NET 功能特点

ETL.NET 是一组 .NET 库，允许将常规商业智能 ETL 功能嵌入到任何 .NET 应用程序中。

.NET 支持：ETL.NET 完全用 .NET 编写，用于多平台使用，并可直接集成到任何 .NET 应用程序中。
易于实施：ETL.NET 的工作原理与 SSIS 类似，ETL 进程要像 Linq 查询一样用 .NET 编写。
易于运行：简单明了的 .NET，ELT.NET 运行时无需安装即可执行 ETL 进程。

缺少什么？没有问题！任何类型的扩展 都可以在瞬间实现，以创建新类型的数据源/目标或任何类型的运算符。ETL.NET 就是为此而设计的。

1、它包含 SSIS 的所有转换和功能

ETL.NET 提供了对任何数据源进行任何转换所需的每个运算符。ETL.NET 实现的运算符的灵感来自 SQL 提供的运算符：Map、Join、Sort、Distinct、Lookup、Top、Pivot、Cross Apply、Union、Group By、Aggregate 等；
数据源，如 Excel，平面文件，如：csv、SQL Server、Xml、Entity Framework（实体框架） 等；
通过自动过滤和保存功能跟踪整个活动；
Process 流程的参数化；

2、开箱即用的功能

ETL.NET 支持从多种数据类型和数据源中读取可写入数据，可以满足各种使用场景。

2.1、Read or write any file type and any data source.（读取或写入任何文件类型和任何数据源）

Native SQL server
Entity Framework
CSV
Excel
Bloomberg response files
Searchable PDF
XML
Anything .NET can read or write whatsoever（任何 .NET 可以读取或者写入的内容）

2.2、Read or write files on any source.（在任何源上读取或写入文件）

File system
FTP
SFTP
FTPS
Dropbox
eMail and MailBox
zip archives
Anything .NET can access whatsoever（任何 .NET 可以访问的内容）

如何使用 ETL.NET ?

ETL.NET 是一系列的类库，可以方便的通过 Nuget 包安装集成到任何 .NET 应用程序即可使用。

ETL.NET 相关资源

Github 项目地址，https://github.com/paillave/Etl.Net
ETL.NET 官网，https://paillave.github.io/Etl.Net/
Nuget 包资源，https://www.nuget.org/packages/Paillave.EtlNet.Core

Paillave.EtlNet 系列 Nuget 包

Examples 应用举例

实验目标：提取特定格式 .zip 文件中所有的 .csv 文件数据，并处理数据写入到指定数据库表中。

1、创建控制台项目

执行 .net cli 命令，创建 ConsoleAppEtl 项目：

dotnet new console -o ConsoleAppEtl --no-https -f net8.0

查看创建控制台（console）项目更多帮助信息：

PS C:\Users\Jeffrey.Chai> dotnet new console -h
控制台应用 (C#)
作者: Microsoft
描述: 用于创建可在 Windows、Linux 和 macOS 上 .NET 上运行的命令行应用程序的项目

用法:
  dotnet new console [options] [模板选项]

选项:
  -n, --name <name>       正在创建的输出名称。如未指定名称，则使用输出目录的名称。
  -o, --output <output>   要放置生成的输出的位置。
  --dry-run               如果运行给定命令行将导致模板创建，则显示将发生情况的摘要。
  --force                 强制生成内容 (即使它会更改现有文件)。
  --no-update-check       在实例化模板时，禁用对模板包更新的检查。
  --project <project>     应用于上下文评估的项目。
  -lang, --language <C#>  指定要实例化的模板语言。
  --type <project>        指定要实例化的模板类型。

模板选项:
  -f, --framework <net6.0|net7.0|net8.0>  项目的目标框架。
                                          类型: choice
                                            net8.0  目标 net8.0
                                            net7.0  目标 net7.0
                                            net6.0  目标 net6.0
                                          默认: net8.0
  --langVersion <langVersion>             在创建的项目文件中设置 LangVersion 属性
                                          类型: text
  --no-restore                            如果指定，则在创建时跳过项目的自动还原。
                                          类型: bool
                                          默认: false
  --use-program-main                      是否生成显式程序类和主方法，而不是顶级语句。
                                          类型: bool
                                          默认: false
  --aot                                   是否启用将项目以 native AOT 发布。
                                          类型: bool
                                          默认: false

要查看有关其他模板语言(F#, VB)的帮助，请使用 --language 选项:
   dotnet new console -h --language F#

2、添加依赖 nuget 包

该项目中使用到的 nuget 包信息如下：

<Project Sdk="Microsoft.NET.Sdk">

  <PropertyGroup>
    <OutputType>ExeOutputType>
    <TargetFramework>net8.0TargetFramework>
    <ImplicitUsings>enableImplicitUsings>
    <Nullable>enableNullable>
  PropertyGroup>

  <ItemGroup>
    <PackageReference Include="Paillave.EtlNet.Core" Version="2.0.47" />
    <PackageReference Include="Paillave.EtlNet.FileSystem" Version="2.0.47" />
    <PackageReference Include="Paillave.EtlNet.SqlServer" Version="2.0.47" />
    <PackageReference Include="Paillave.EtlNet.TextFile" Version="2.0.47" />
    <PackageReference Include="Paillave.EtlNet.Zip" Version="2.0.47" />
  ItemGroup>

  <ItemGroup>
    <Folder Include="Files\Input\" />
  ItemGroup>

Project>

3、应用案例代码编写

在编写 demo 代码之前，先在项目中添加一个文件夹：

Files\Input\，用来模拟输入的数据源；

下面是一个 ETL.NET 处理数据的场景：

首先从文件夹中读取所有的 zip 文件。
解压 zip，并读取其中的 .csv 文件。
解析 .csv 文件内容，添加的 Person 的集合中。
去除重复项（以 email 作为唯一依据），并写入到 Sql Server 数据库中。

依据上面的处理流程，在 Program.cs 中编写如下代码：

using Paillave.Etl.FileSystem;
using Paillave.Etl.Zip;
using Paillave.Etl.TextFile;
using Paillave.Etl.SqlServer;
using System.Data.SqlClient;
using Paillave.Etl.Core;

namespace ConsoleAppEtl;

internal class Program
{
    static async Task Main(string[] args)
    {
        Console.WriteLine("Hello, ETL.NET! https://paillave.github.io/");

        var processRunner = StreamProcessRunner.Create<string>(DefineProcess);
        processRunner.DebugNodeStream += (sender, e) => {
            /* PLACE A CONDITIONAL BREAKPOINT HERE FOR DEBUG ex: e.NodeName == "parse file" */
            Console.WriteLine($"NodeName = {e.NodeName},Count = {e.Count},HasError = {e.HasError},ToSequenceId = {e.ToSequenceId},FromSequenceId = {e.FromSequenceId}");
        };

        string inputFilesPath = @"C:\Users\Jeffrey.Chai\Desktop\test\ConsoleAppEtl\Files\Input";
        string connStr = "Data Source=.;User Id=sa;[email protected];Initial Catalog=EtlTest;Encrypt=True;TrustServerCertificate=True;Pooling=true;Min Pool Size=1;Max Pool Size=10;";
        using (var cnx = new SqlConnection(connStr))
        {
            cnx.Open();
            var executionOptions = new ExecutionOptions<string>
            {
                Resolver = new SimpleDependencyResolver().Register(cnx)
            };

            var res = await processRunner.ExecuteAsync(config: inputFilesPath, options: executionOptions);
            if (res.Failed && res.ErrorTraceEvent != null)
            {
                Console.WriteLine($"errors：{res.ErrorTraceEvent.Content.Type},{res.ErrorTraceEvent.Content.Level},{res.ErrorTraceEvent.Content.Message}");
            }
            Console.WriteLine(res.Failed ? "Failed" : "Succeeded");
        }
    }

    /// 
    /// 定义处理流程
    /// 
    /// 
    private static void DefineProcess(ISingleStream<string> contextStream)
    {
        contextStream
          .CrossApplyFolderFiles(name: "列出所有的 .zip 文件", pattern: "*.zip", recursive: true)
          .CrossApplyZipFiles(name: "从 .zip 解压出 .csv 文件", pattern: "*.csv")
          .CrossApplyTextFile(name: "解析 .csv 文件",
             args: FlatFileDefinition.Create(item => new Person
             {
                 Email = item.ToColumn("email"),
                 FirstName = item.ToColumn("first name"),
                 LastName = item.ToColumn("last name"),
                 DateOfBirth = item.ToDateColumn("date of birth", "yyyy-MM-dd"),
                 Reputation = item.ToNumberColumn<int?>("reputation", ".")
             }).IsColumnSeparated(','))
          .Distinct("email 去重", item => item.Email)
          .SqlServerSave("写入 mssql2022 数据库", o => o
             .ToTable("dbo.Person")
             .SeekOn(p => p.Email)
             .DoNotSave(p => p.Id))
             .Do("输出到控制台", item => Console.WriteLine($"fullname:{item.FirstName}-{item.LastName},email:{item.Email}"));
    }
    
    /// 
    /// 数据库表实体模型
    /// 
    private class Person
    {
        public int Id { get; set; }
        public string Email { get; set; }
        public string FirstName { get; set; }
        public string LastName { get; set; }
        public DateTime DateOfBirth { get; set; }
        public int? Reputation { get; set; }
    }
}

4、准备数据库表结构

4.1、创建数据库

创建数据库命名为 EtlTest，此处我就使用 docker 容器化部署一个 mssql2022，执行如下命令：

# 搜索镜像
docker search mssql
# 拉取镜像
docker pull mcr.microsoft.com/mssql/server:2022-latest

# 运行容器 mssql2022
docker run -d --name mssql2022 --hostname mssql2022 \
-p 1433:1433  \
-e "ACCEPT_EULA=Y" \
-e "[email protected]" \
-e "TZ=Asia/Shanghai" \
-e "MSSQL_PID=Developer" \
-e "MSSQL_COLLATION=Chinese_PRC_BIN" \
mcr.microsoft.com/mssql/server:2022-latest

4.2、测试数据库连接

数据库容器运行成功后，使用数据库工具 dbeaver-ce 连接测试，看数据库是否能够正常访问，如果正常访问即显示如下信息：

4.3、创建数据库表

依据上面的 Person.cs 实体模型，创建数据表 Person，执行如下 sql 脚本：

-- mssql
CREATE TABLE "Person" (  
  "Id" INT identity(1,1) PRIMARY KEY NOT NULL, 
  "Email" VARCHAR(32) NOT NULL, 
  "FirstName" VARCHAR(32) NOT NULL, 
  "LastName" VARCHAR(32) NOT NULL, 
  "DateOfBirth" DateTime NOT NULL,
  "Reputation" INT NULL
);

此时该表的数据为空，改表主要用于从特定文件 .csv 提取数据，并写入表中保存。

5、准备数据源

这里我们准备的源数据是后缀为 .csv 类型的文件，并且压缩为 .zip 格式的文件夹。

Person.zip 文件存放入项目中 Files\Input 文件夹里面，该压缩文件中，存放了 3 个 .csv 的文件，用于模拟分批导出数据的情况。下面 3 个文件中，分别在每个文件中放入 10 条数据。

.csv 文件的内容格式类似如下：

"id","email","first name","last name","date of birth","reputation"
1,"[email protected]",hu,pingan,"2023-12-12",10
2,"[email protected]",ma,liuliu,"2023-11-12",5
3,"[email protected]",zhan,xiaosan,"2023-12-15",2

验证测试

说明：Person.zip 文件可以存放多个结构相同的 .csv 文件，这里为了方便测试，模拟 3 个文件即可。

经过上面的环节，我们已经准备好了项目测试的基础条件。接下来我们就运行项目，启动看下，能否把 Person.zip 文件中的 3 个 .csv 文件给解析出来，并提取到里面的数据写入到提前准备好的数据库表中。

执行完成，控制台输出信息如下：

Hello, ETL.NET! https://paillave.github.io/
fullname:项-栋,email:[email protected]
fullname:谈-震,email:[email protected]
fullname:滑-超浩,email:[email protected]
fullname:慕容-伦,email:[email protected]
fullname:司空-群,email:[email protected]
fullname:壤驷-泰,email:[email protected]
fullname:国-才,email:[email protected]
fullname:尤-建,email:[email protected]
fullname:公西-毅,email:[email protected]
fullname:邢-飞,email:[email protected]
fullname:昝-龙,email:[email protected]
fullname:麻-军,email:[email protected]
fullname:崔-朗,email:[email protected]
fullname:籍-清,email:[email protected]
fullname:缑-克,email:[email protected]
fullname:赫连-广,email:[email protected]
fullname:印-信,email:[email protected]
fullname:扈-强,email:[email protected]
fullname:漆雕-波,email:[email protected]
fullname:堵-山,email:[email protected]
fullname:左-民,email:[email protected]
fullname:乔-言若,email:[email protected]
fullname:郁-江,email:[email protected]
fullname:翟-新利,email:[email protected]
fullname:褚-才,email:[email protected]
fullname:郁-奇,email:[email protected]
fullname:寇-平,email:[email protected]
fullname:须-厚,email:[email protected]
fullname:宓-奇,email:[email protected]
fullname:窦-超浩,email:[email protected]
NodeName = 列出所有的 .zip 文件,Count = 1,HasError = False,ToSequenceId = 1,FromSequenceId = 1
NodeName = 从 .zip 解压出 .csv 文件,Count = 3,HasError = False,ToSequenceId = 5,FromSequenceId = 3
NodeName = 解析 .csv 文件,Count = 30,HasError = False,ToSequenceId = 123,FromSequenceId = 7
NodeName = email 去重,Count = 30,HasError = False,ToSequenceId = 124,FromSequenceId = 8
NodeName = 写入 mssql2022 数据库,Count = 30,HasError = False,ToSequenceId = 125,FromSequenceId = 9
NodeName = 输出到控制台,Count = 30,HasError = False,ToSequenceId = 126,FromSequenceId = 10
Succeeded

此时我再次查看数据库表信息，是否有把 .csv 文件的数据提取处理保存到指定的数据库表中。

SELECT Id, Email, FirstName, LastName, DateOfBirth, Reputation
FROM EtlTest.dbo.Person;

数据库表 Person 查询信息显示如下：

结论： Person.zip 文件中的 3 个 .csv 文件合计数据量 30 行，存入数据库表 EtlTest.dbo.Person 的数据符合预期。

你可能感兴趣的:(.NET,Core,跨平台,etl,etl.net,大数据,big,data,.net)

Node.js-fs模块会飞的鱼先生 node.js vim 编辑器
文件写入异步写入文件(fs.writeFile())//语法:fs.writeFile(file,data[,options],callback)//参数：文件路径、数据、选项（可选）、回调函数（err）constfs=require('fs');fs.writeFile('file.txt','HelloNode.js',function(err){if(err)throwerr;console
verilog ascii码 0-99翻译成16进制数 LEEE@FPGA FPGA学习记录 fpga开发
VerilogASCII码转16进制数(0-99)moduleascii_to_hex(inputclk,inputrst_n,input[7:0]ascii_high,//十位数的ASCII码input[7:0]ascii_low,//个位数的ASCII码outputreg[7:0]hex_data//输出的16进制数);reg[7<
golang游戏开发学习笔记-开发一个简单的2D游戏(基础篇）
2.人物运动图（只展示第一帧）2.方块纹理图将资源准备完成之后，就能开始代码的开发了五.开始实现！1.资源管理在上一篇文章中我们将纹理和着色器分别封装成了两个类，这里我们创建一个资源管理类对这两个类进行管理，由于golang中是没有静态变量的，需要用包内变量对其进行模拟shader.gopackageresourceimport(“github.com/go-gl/gl/v4.1-core/gl”
探索未来Android开发：深度解析JetHub项目宗廷国Kenyon
探索未来Android开发：深度解析JetHub项目JetHubSampleAppwithJetpackcomponents(LiveData,Navigation,ViewModel)+MVVM+coroutine+singleactivity项目地址:https://gitcode.com/gh_mirrors/je/JetHub随着Android技术的不断演进，开发者们总是在寻找那些能够引领
使用datax进行mysql的表恢复是桃萌萌鸭~ mysql 数据库
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台，实现包括MySQL、SQLServer、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。FeaturesDataX本身作为数据同步框架，将不同数据源的同步抽象为从源头数据源读取数据的Reader插件，以及向目标端写入数据的Writer插件，理论上Dat
Oracle 导入导出 dmp 数据文件实战 dazhong2012 数据库 oracle 数据库
一、DMP文件基础知识1.DMP文件定义DMP（DataPumpDumpFile）是Oracle数据库专用的二进制格式文件，由expdp/impdp或旧版exp/imp工具生成。它包含数据库对象的元数据（表结构、索引等）和实际数据，是数据备份、迁移和恢复的核心载体。2.DMP文件结构文件头：记录Oracle版本、字符集、导出时间等元信息。数据段：存储表数据，按数据块组织，支持并行读写。索引段：加速
Spring Cache+Redis缓存方案详解：从代码到实践大手你不懂 Java Java项目实战 Redis spring 缓存 redis
描述：在现代Java开发中，缓存是提升系统性能的核心手段之一。本文通过实际代码案例，深入解析SpringCache与Redis的集成原理，结合项目中的ModuleDatabaseInfoService接口和RedisConfig配置，探讨如何通过声明式缓存实现高效的数据库访问优化。一、核心代码解析1.服务接口设计（拿查询数据源配置信息举例）publicinterfaceModuleDatabase
云原生灰度方案对比：服务网格灰度（Istio ）与 K8s Ingress 灰度（Nginx Ingress ）大手你不懂微服务-云原生 Java Java项目实战云原生 istio kubernetes 微服务
服务网格灰度与KubernetesIngress灰度是云原生环境下两种主流的灰度发布方案，它们在架构定位、实现方式和适用场景上存在显著差异。以下从多个维度对比分析，并给出选型建议：一、核心区别对比维度服务网格灰度（以Istio为例）K8sIngress灰度（以NginxIngress为例）架构层级网络层（L7），工作在服务间通信层面边缘网关层，工作在集群入口处流量控制范围服务间的全链路流量集群外部
tensorRT 与 torchserve-GPU性能对比 joker-G 计算机视觉 pytorch python
实验对比前端时间搭建了TensorRT、Torchserve-GPU，最近抽时间将这两种方案做一个简单的实验对比。实验数据Cuda11.0、Xeon®62423.1*80、RTX309024G、Resnet50TensorRT、Torchserve-GPU各自一张卡搭建10进程接口，感兴趣的可以查看我个人其他文章。30进程并发、2000张1200*720像素图像的总量数据TensorRT的部署使用
Bitnami Postgresql镜像和Docker官方镜像的区别 MyySophia GP(GreenPlum 大规模并行数据库)docker postgresql 容器
Docker官方PostgreSQL镜像不支持复制。如果您传递任何复制环境变量，这将被忽略。Docker官方镜像支持的唯一环境变量是POSTGRES_USER、POSTGRES_DB、POSTGRES_PASSWORD、POSTGRES_INITDB_ARGS、POSTGRES_INITDB_WALDIR和PGDATA。所有剩余的环境变量都特定于BitnamiPostgreSQL映像。Bitnam
DataX（2）—— 核心流程申尧强 datax
DataX的核心执行流程：初始化阶段创建JobContainer容器（主控进程）加载配置，初始化reader/writer插件准备阶段调用reader/writer的prepare()方法执行数据源和目标端的准备工作任务切分阶段根据channel数切分reader任务根据reader切分结果切分writer任务合并生成最终task配置调度执行阶段分配task到各个taskGroup启动TaskGr
pycharm——djiango之数据迁移，终端操作 Pop– python
首先在pycharm中找到terminal(终端)，输入指令：pythonmanage.pymakemigrations之后你会看到如下图：这表示创建成功。接着输入指令：pythonmanage.pymigrate就能看到好多ok，你在数据库中也能看到很多表你可以在终端打开数据库查看表，也可以使用客户端的可视化界面查看，还可以在pycharm中右边的database里边打开查看，如下图：之后你就可
C++基本语法与类和对象一 wangjialelele c++
//C++兼容绝大多数C语言语法//C语言的第一个问题是命名冲突，如rand在有头文件和没有的时候#include//是inputoutputstream的缩写，是标准的输入输出流库namespacewjl{intrand=10;//可以定义变量、函数、结构体等structNode{intdata;structNode*next;};//命名空间是可以无限嵌套的//访问方式：bit::pg::ra
开发者视角：一键拉起与快速安装的巧妙运用 tongjiwenzhang 携带参数安装信息可视化大数据 android ios
Apptrace技术集成方案SDK集成基础Android集成配置//build.gradle(Module)dependencies{implementation'com.apptrace.sdk:core:3.2.1'implementation'com.apptrace.sdk:deeplink:2.0.0'}//AndroidManifest.xmliOS集成配置//Podfilepod'A
C++封装python调用库技术大白 c++开发语言
传结构体中间用空字符串问题使用callback传输结构体，中间出现\0字符，使用std::vector类型voidPyProcessInterface::ProcessContent(constchar*buff,UINT32size,boolfromSelf){if(callback){std::vectordataVec(buff,buff+size);callback(std::move(d
Flutter 与 uni-app 的深度对比：鸿蒙开发的最佳选择竟是原生开发
Flutter与uni-app的深度对比：鸿蒙开发的最佳选择竟是原生开发在移动应用开发领域，Flutter和uni-app是两种非常受欢迎的跨平台开发框架。它们各自具有独特的优缺点，适用于不同的开发场景和需求。本文将从多个维度对Flutter和uni-app进行深度对比，帮助开发者更好地理解这两种框架的特点，并最终引出ArkTS在鸿蒙开发中的优势。一、Flutter与uni-app的概述Flutt
探索Kafka监控新维度：Burrow深度解析孙爽知Kody
探索Kafka监控新维度：Burrow深度解析BurrowKafkaConsumerLagChecking项目地址:https://gitcode.com/gh_mirrors/bu/Burrow项目介绍在大数据领域，ApacheKafka作为实时数据流处理的领军者，其稳定性和性能备受赞誉。然而，对于消费者端的监控始终是一个挑战。这时，LinkedIn开源的Burrow应运而生，它是一款专为Kaf
CRC3校验算法安庆平.Я C/C++语言总结 java 前端服务器 c语言 unix linux 算法
C在线工具|菜鸟工具CRC3，16位数据校验使用，多项式g(x)=x3+x+1->0b1011#include#includeuint8_tCrc3(constuint32_tdata,uint8_tlen){uint8_tchk=0x08;uint8_tpoly=0x03;/*多顶式1011*/uint8_tpoly_len=4;uint8_talu=0x00;alu=(data>>len-po
Linux 网络设置(ifconfig、route、traceroute、netstat、ss、nslookup、dig、ping状态返回分析）
Linux网络设置一、查看网络1、查看网络接口地址2、查看更改主机名3、查看路由表条目4、查看网络连接情况netstat命令ss命令二、测试网络连接1、测试网络连通性2、跟踪数据包的路由途径3、测试DNS域名解析nslookup命令dig命令三、使用网络配置命令1、临时配置和永久配置的解释2、修改网卡的地址、状态2、添加、删除静态路由与默认路由记录四、修改网络配置文件1、网络接口配置文件2、启用、
ifconfig工具源码分析 weixin_34357887 操作系统数据结构与算法
ifconfig是linux中用于显示或配置网络设备（网络接口卡）的命令，英文全称是networkinterfacesconfiguring。同netstat一样，ifconfig源码也位于net-tools中。源码位于net-tools工具包中，这是linux网络的基本工具包，此外还有arp,hostname,route等命令。项目链接：http://net-tools.sourceforge.
mysql 页分裂_Innodb页面分裂 zhuyuejituan mysql 页分裂
何时进行页面分裂插入操作时首先调用乐观插入函数btr_cur_optimistic_insert，若发现此次空间不足，进行悲观插入，函数btr_cur_pessimistic_insert，在这里会触发页面分裂。dberr_tbtr_cur_optimistic_insert(...){...if(leaf&&page_size.is_compressed()&&(page_get_data_si
ifconfig结果详解 LYSnowy linux 网络 linux
ifconfig命令是输出当前系统的网卡信息输出结果会有多个网卡第一个网卡是所有系统都会有的，是以太网的网卡信息，以太网即可以理解为有线网，输出后面会写(Ethernet)对于每一个网卡都会有相同的输出信息，分别是：第二个网卡也是所有系统都会有的，是lo，为回环接口，IP地址固定为127.0.0.1，表示机器本身剩余的网卡则是自己添加的网卡，比如wifi或者是无线网卡，如果不用有限的方式上方下面的
c++17标准std::filesystem常用函数 C++ 老炮儿的技术栈 c++算法开发语言 c语言数据库 visual studio git
std::filesystem是C++17引入的标准库，用于处理文件系统操作，提供了跨平台的文件和目录操作能力。以下是一些常用的函数和类：一、路径操作（std::filesystem::path）cpp运行#includenamespacefs=std::filesystem;//路径构造与分解fs::pathp="C:/data/file.txt";p.parent_path();//返回目录路
Spring Cloud Gateway 实战：网关配置与 Sentinel 限流详解述雾学java SpringCloud sentinel spring cloud GateWay java
SpringCloudGateway实战：网关配置与Sentinel限流详解在微服务架构中，网关扮演着统一入口、负载均衡、安全认证、限流等多种角色。SpringCloudGateway是SpringCloud官方推出的新一代网关组件，相比于第一代NetflixZuul，性能更强、功能更丰富，且基于Netty和WebFlux开发，完全非阻塞、响应式。本文将详细介绍SpringCloudGateway
Qt控件库：QCustomPlot 大白萝卜不紧张 qt qt qcustomplot
曲线添加#includeQCustomPlot*plot=newQCustomPlot(this);//创建曲线对象，创建时就已经添加QCPGraph*graph=plot->addGraph();//设置曲线的x和y数据QVectorx={1,2,3,4,5};QVectory={1,4,9,16,25};graph->setData(x,y);背景//设置背景颜色QLinearGradient
MYSQL中常见DDL语句为你奋斗！数据库 mysql sql
DDL：对数据库以及数据库内部的对象进行创建、删除、修改等操作的语言,DDL语句更多的是由数据库管理员(DBA)使用，开发人员一般很少使用。一、数据库：1、查看数据库列表：showdatabases;2、创建数据库：createdatabase[ifnotexists]数据库名;3、显示已创建的库创建时的创建语句：showcreatedatabases数据库名4、删除数据库：dropdatabas
说说自己Python 代码优化实践 chilavert318 大数据 linux 运维 python
今年上半年在外省做一个大数据相关的项目，在review项目组成员的代码时，发现一段处理大数据集的模块存在明显性能瓶颈：10万条数据的清洗流程耗时近20分钟，CPU占用率却始终在30%以下。深入分析后发现，看似简洁的Python代码背后，隐藏着诸多可以优化的细节——这并非个例，我们的程序在追求代码可读性时，往往忽略了Python特有的性能陷阱。今天抽点时间，从我实践中的代码就python开发，从内存
串行工作室：实时数据可视化工具，让嵌入设备数据一目了然！
在当今快速发展的技术世界中，如何高效处理嵌入式设备数据是许多开发者面临的重大挑战。本文将为大家介绍一个名为SerialStudio的工具，通过它，你可以实现嵌入式设备数据的可视化，无论是在教育、业余项目还是专业开发中，它都是一个不可多得的得力助手。SerialStudio简介SerialStudio是一款开放核心的跨平台遥测仪表板和实时数据可视化工具，它能够通过串口、蓝牙低能耗（BLE）、MQTT
安装黑苹果时提示未能与服务器,安装黑苹果遇到的问题与解决记录草莓味儿柠檬安装黑苹果时提示未能与服务器
前言–这篇文章讲了啥？这篇文件是我在安装黑苹果时遇到的问题与解决办法的总结所以更注重的是发现问题解决问题，关于黑苹果教程自己上网上找吧，资源非常多所以安装方面可能就几句话带过了1.硬件配置电脑型号戴尔Inspiron5680台式电脑操作系统Windows1064位家庭版处理器英特尔Corei5-8400主板戴尔0PXWHK(z370芯片组)，找efi驱动首先按照这个主板来就行(z370)内存三星D
abp 链接本地mysql_ABP Vnext使用mysql数据库漫小威 abp 链接本地mysql
ABPVnext支持Sqlserver、Mysql、PostgreSql等数据库，通过CLI模板建立的项目默认使用SqlServer，需要进行一定变更才支持其他数据库，下面以使用Mysql举例1.使用CLI建立一个带UI的MVC项目abpnewAcme.BookStoreUi--templateapp--database-provideref--uimvc--mobilenone建立后项目如下2.
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri