WongSSH

Clickhouse 以太坊分析:交易日志分析

概述

读者可前往我的博客获得更好的阅读体验。

在上一篇中，我们介绍了如何使用 Clickhouse 进行基础的信息提取，这些信息往往依赖于以太坊底层机制，我们只能获得如 ETH 转账、 gas 等信息，这些信息并没有涵盖以太坊中最重要的智能合约的相关数据。这使我们无法获得 ERC-20 代币转账或 NFT 转移等数据。

对于很多数据分析师而言，了解智能合约相关数据更加重要。本文主要介绍如何获得关于智能合约的相关数据，以进一步完善数据分析。本篇仍主要聚焦于数据清洗，但仍会给出部分数据分析案例以帮助读者理解。

前置知识

如果需要获取合约内的数据，我们必须了解对于智能合约非常重要的 Event 数据类型。该数据类型的一般定义如下:

event Transfer(address indexed _from, address indexed _to, uint256 _value)

上述定义来自 ERC-20 的 EIP 文档。在智能合约中，我们可以通过 emit Transfer(...) 来将 event 释放到区块空间中，这使我们可以从外部读取智能合约运行的结果。我们可以将此释放行为认为是日志记录，在 etherscan 中，该部分记录在 Logs 中，如下图:

我们需要关注 Topics 栏中的内容，该部分内容与上述定义是对应的:

Topics 0 是 Transfer(address,address,uint256) 的 Keccak-256 哈希结果
Topics 1 对应为 address indexed _from 表示代币转移的发起方
Topics 2 对应为 address indexed _to 表示代币转移的接受发
Data 对应为 _value 表示代币转移的数量

总结来说，Topics 0 是对事件整体名称的 Keccak-256 哈希结果，通过此 Topics ，我们可以获得区分不同的事件。读者可以通过 Signature Database 反查具体的事件名称，如下图:

标有 indexed 的变量为根据顺序逐一显示在 Topics 中，通过这些 Topics 我们可以获得合约运行过程中的大量信息。事实上，这也是获得链上智能合约运行信息最常见和最有效的方法，包括钱包在内的大量区块链基础设施都依赖于Event 释放获得的日志信息。由于 Event 如此重要，所以常见的 Event 基本都是由 EIP 规定，以实现兼容性。

假如你构造的 ERC-20 代币进行代币转移时不释放 Transfer 事件，这会导致钱包内对此 ERC20 代币余额信息不更新，对持币人造成巨大困扰。

最后，所有没有标识 indexed 的变量会被放在 Data 内，这部分数据往往重要性不高。

关于 emit 事件释放的底层逻辑，我们在 NFT合约分析:ERC721A 内已经进行过讨论。

在我们的数据源 0xfast 中，这部分数据结构如下:

"logs": [
    {
        "address": "0xdac17f958d2ee523a2206206994597c13d831ec7",
        "topics": [
            "0xddf252ad1be2c89b69c2b068fc378daa952ba7f163c4a11628f55a4df523b3ef",
            "0x0000000000000000000000004ad8d9cf9424b477e77a0d7c339c4de792b92fc6",
            "0x000000000000000000000000a144a5c6aaa3a11dfb63a9b7b836ec35ff7a9bf3"
        ],
        "data": "0x00000000000000000000000000000000000000000000000000000000886f5e40",
        "blockNumber": "0xfcd79e",
        "transactionIndex": "0x1",
        "logIndex": "0x4",
        "@type": "Log"
    }
]

我们需要使用 SQL 语言提取出这一部分并进行保存。

数据清洗

数据导入

此部分与上一篇一致，如果您当前数据库内仍存在 jsonTemp 表格，可不进行此部分。为方便读者，我们列出 SQL 代码:

CREATE TABLE jsonTemp
(
	field String
)
ENGINE = Memory

INSERT INTO jsonTemp 
SELECT * FROM url('https://eth-uswest.0xfast.com/stream/free?range=16448580-16448680', 'JSONAsString', 'field String');

此处，我们不再详细分析 SQL 代码，读者如感兴趣，请自行参考上一篇。

数据提取

我个人习惯于在进行表格建立前使用 SELECT 进行数据提取，以方便后期的表格建立和插入。

在此处，我决定提取交易的以下数据:

hash 交易的 hash 值
blockNumber 交易所处区块位置
value 交易转移的 ETH 价值
logs 获取智能合约数据，也是本篇文章的核心数据，具体来看，我们需要以下数据:
1. topics Event 的具体内容
2. address 释放 Event 的合约地址

读者可根据自身需求选择需要提取的数据。

接下来，我们需要构造提取字段，如下:

WITH JSONExtract(
	field, 
	'Tuple(transactions Nested(hash String, blockNumber String, value String, logs Nested(address String, data String, topics Array(String))))'
) AS parsed_json
SELECT 
	untuple(arrayJoin(tupleElement(parsed_json, 'transactions'))) as tx
FROM
	jsonTemp jt
LIMIT 5

如果读者无法理解上述 SQL 代码，请自行阅读上一篇文章

结果如下:

其中 tx.4 由于其为 Nested 导致较难理解，此处我们特别分析，如下:

通过上图，我们知道 tx.4(即 logs) 的具体构成。显然，我们需要将此部分进行重构。我们的目标是将 logs 的每一项拆分出来将其作为单独的一列存在。通过这种方式，我们既保留了 topics 的完整性，也将 logs 由过去的 3 层嵌套转变为 2 层嵌套。前者是几乎无法检索的而后者具有良好的可检索性。

我们分析 ARRAY JOIN 是可以解决这一问题的，简单来说，该函数可以进行如下转化:

原表格

┌─s───────────┬─arr─────┐
│ Hello       │ [1,2]   │
│ World       │ [3,4,5] │
│ Goodbye     │ []      │
└─────────────┴─────────┘

LEFT ARRAY JOIN转化后的表格

┌─s───────────┬─arr─┐
│ Hello       │   1 │
│ Hello       │   2 │
│ World       │   3 │
│ World       │   4 │
│ World       │   5 │
│ Goodbye     │   0 │
└─────────────┴─────┘

请参考文档获得其详细介绍。

SQL 代码如下:

SELECT *
FROM
(
WITH JSONExtract(
	field, 
	'Tuple(transactions Nested(hash String, blockNumber String, value String, logs Nested(address String, data String, topics Array(String))))'
) AS parsed_json
SELECT 
	untuple(arrayJoin(tupleElement(parsed_json, 'transactions'))) as tx
FROM
	jsonTemp jt
LIMIT 5
)
LEFT ARRAY JOIN `tx.4`;

此处选择 LEFT ARRAY JOIN 的原因是部分没有合约交互的交易的 logs 为空，但这部分交易在数据分析中不能丢弃。

结果为:

此数据已经可以进行导入步骤。

数据导入

在数据导入前，我们需要建立对应的表格，根据上文结果，我们可以使用以下 SQL 进行表格创建:

CREATE TABLE logsTemp
(
	txHash String,
	txblockNumber String,
	value String,
	contractAddress String,
	txlogsData String,
	topics Array(String)
)
ENGINE = MergeTree
ORDER BY txblockNumber

执行数据导入:

INSERT
	INTO
	logsTemp 
SELECT
	`tx.1`,
	`tx.2`,
	`tx.3`,
	untuple(`tx.4`)
FROM
	(
	SELECT
		*
	FROM
		(
    WITH JSONExtract(
      field,
		'Tuple(transactions Nested(hash String, blockNumber String, value String, logs Nested(address String, data String, topics Array(String))))'
    ) AS parsed_json
		SELECT
			untuple(arrayJoin(tupleElement(parsed_json,
			'transactions'))) as tx
		FROM
			jsonTemp jt
  )
  LEFT ARRAY
	JOIN `tx.4`
)

此处遇到了一个小问题，详情可以参考使用 clickhouse 遇到的一个奇怪问题

完成导入后，我们可以进行一个简单的检索以获得所有 ERC-20 转移交易:

SELECT
	*
FROM
	logsTemp lt
WHERE
	topics[1] == '0xddf252ad1be2c89b69c2b068fc378daa952ba7f163c4a11628f55a4df523b3ef';
LIMIT 10

注意在 Clickhouse 中只有单引号可以标识字符串，且 Array 的索引从 1 开始

数据补充

我们获得了很多合约地址，其中包含大量的 ERC-20 合约抛出的 Event ，我们希望可以获得这些代币的名字。

这意味着我们需要构造一个代币名称与合约地址的映射关系，使用关系型数据库很容易做到这一点。但数据来源可能对很大读者来说是一个问题，但很幸运，我找到了 Token Lists 网站。该网站以 JSON 的形式给出了一系列代币数据源。此处我们选择的是 1inch 提供的包含 987 种代币的数据源，版本为 145.0.0，读者可以点击此链接查看数据。

我们可以看到 JSON 文件地址为以 ens 地址，使用 eth.limo 网关(即访问 https://tokens.1inch.eth.limo/ )就可以获得其中的数据。

相信读者已经不想使用复杂的 Tuple 提取数据，所以此处我们直接使用 Clickhouse 的实验性数据结构 JSON 来提取数据。

在进行具体操作前，我们需要修正 Clickhouse 客户端:

右键数据库点击 编辑连接 如下图:
点击 驱动属性 ，如下图:
找到 session_id 属性，点击修改值，填入一个 UUID

UUID 可以使用命令行工具 uuidgen 或者 Online UUID Generator 网站生成

如果读者在后文操作时遇到 DB::Exception: There is no session or session context has expired. (THERE_IS_NO_SESSION) 报错则说明上述设置错误。

为什么需要设置 seesion_id? 因为后文我们使用了 SET 语句，此语句需要上下文指引，但 http 本身是无状态的，所以此处设置了 session_id 以方便服务端确定上下文，类似 cookie 的作用

为后文方便数据存储，我们创建如下表格:

SET allow_experimental_object_type = 1;
CREATE table tokenListJson(
	tokenInfo JSON
)
ENGINE = Memory

在 DBeaver 中，; 隔断的 SQL 语句会根据光标位置运行，如下图:

由于光标位置位于第一个分号前，所以运行时只会运行 SET allow_experimental_object_type = 1;语句，如果需要运行 CREATE table 语句，则需要调整光标位置到第二行或之后的行。

在操作中，如果读者遇到 DB::Exception: Cannot create table with column 'tokenInfo' which type is 'Object('json')' because experimental Object type is not allowed. Set setting allow_experimental_object_type = 1 in order to allow it. (ILLEGAL_COLUMN) 报错，则说明 SET allow_experimental_object_type = 1; 语句过期，需要重新运行此语句。

使用以下语句插入数据:

INSERT INTO tokenListJson 
SELECT *
FROM
url('https://tokens.1inch.eth.limo/', 'JSONAsObject', 'token JSON');

此处也可以使用 https://wispy-bird-88a7.uniswap.workers.dev/?url=http://tokens.1inch.eth.link 替换 https://tokens.1inch.eth.limo/ ，前者速度似乎更快。

运行以下语句，检查数据情况:

DESCRIBE tokenListJson SETTINGS describe_extend_object_types=1;

返回值如下:

Tuple(keywords Array(String), logoURI String, name String, timestamp String, tokens Nested(address String, chainId Int8, decimals Int8, logoURI String, name String, symbol String), version Tuple(major Int16, minor Int8, patch Int8))

可以发现事实上 JSON 数据格式在 Clickhouse 就是以 tuple 进行存储的。

使用以下代码直接提取 tokens 中的内容并转化为表:

SELECT untuple(arrayJoin(tokenInfo.tokens))
FROM tokenListJson tlj

构造表格以方便存储检索结果(数据类型和名称可参考 DESCRIBE 的返回结果):

CREATE TABLE tokenInfo(
	address String,
	chainId Int8,
	decimals Int8,
	logoURI String,
	name String,
	symbol String
)
ENGINE = MergeTree
ORDER BY address

使用以下语句插入表格:

INSERT INTO tokenInfo 
SELECT untuple(arrayJoin(tokenInfo.tokens))
FROM tokenListJson tlj

我们可以尝试查询 USDC 的相关数据:

SELECT *
FROM tokenInfo ti 
WHERE symbol == 'USDC'

数据分析

事实上，我们的数据清洗并不完整，我们没有加入比如 event 与文字的对应关系表等数据。我进行了大量搜索，并没有此类开源数据库，读者可以考虑自建此类基础设施。但本文中给出的数据以足够支持一般的数据分析工作。

ERC-20 交易频度

首先，我们需要确认转账的交易的 event 名称，使用 etherface text 可以解决这一问题。

搜索 e#Transfer(e# 表述搜索 event)，得到如下结果:

建立以下 SQL 检索:

SELECT
	contractAddress,
	symbol,
	COUNT(*) AS txCount
FROM
	logsTemp lt
LEFT OUTER JOIN tokenInfo ti ON
	lt.contractAddress = LOWER(ti.address)
WHERE
	topics[1] == '0xddf252ad1be2c89b69c2b068fc378daa952ba7f163c4a11628f55a4df523b3ef'
	AND
	topics.size0 == 3
GROUP BY
	contractAddress,
	symbol
ORDER BY
	txCount DESC

传说 Clickhouse 在 JOIN 关联索引方面性能较差，但此处我们的数据量较小，所以不考虑优化问题。一个可行的优化方案是构建宽表，直接把 tokenInfo 数据合并到 logsTemp 中。

此处使用了 topics.size0 == 3 来区别 ERC20 代币的转账事件和 ERC721 的转账事件。

前者 ERC20 定义为:

event Transfer(address indexed _from, address indexed _to, uint256 _value)

后者 ERC721 定义为:

event Transfer(address indexed _from, address indexed _to, uint256 indexed _tokenId);

所以两者在 topics 数量上是不同的，前者为 3 而后者为 4。为实现对 topics 的长度查询，我们使用了 size0 函数，具体请参考文档

上述检索的返回结果如下:

contractAddress	symbol	txCount
0xc02aaa39b223fe8d0a0e5c4f27ead9083c756cc2	WETH	2525
0xdac17f958d2ee523a2206206994597c13d831ec7	USDT	2365
0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48	USDC	1085
0x32c319ac8d2f4a79b2fbdea543473cc03a986aaf		787
0x4d224452801aced8b2f0aebe155379bb5d594381	APE	368

可以看到此处存在部分数据丢失，这是因为我们使用的 tokenList 较小，读者可有考虑使用 CoinGecko 的超大数据集。

ERC721 交易情况

NFT 是区块链的热门话题，我们可以使用以下检索获得 NFT 的全部转账情况:

SELECT
	contractAddress,
	COUNT() AS transferCount 
FROM
	logsTemp lt
WHERE
	topics[1] == '0xddf252ad1be2c89b69c2b068fc378daa952ba7f163c4a11628f55a4df523b3ef'
	AND topics.size0 == 4
GROUP BY contractAddress 
ORDER BY transferCount DESC

输出结果如下:

contractAddress	transferCount
0x5f12a00a9deabfb1299dcbbdc654904c3273f842	1171
0x9f44bb8fedb144c6b8e9c46e01375429e04244c3	1019
0x58c7ffcf5591166384beabca7661666c9d47709c	895
0x7eba6418388cac0b81c26f9b76d7ea6877bf8308	304
0x11b3cf25f300b8ec587dfc349d419b5181084909	289

可惜，我们没有 NFT 数据集来补充更多信息，但存在部分 API 可以实现此步骤，可以参考我写的基于Python与GraphQL的链上数据分析实战给出的 ERC721 数据获取

当然，对于 NFT 的铸造也是很多人关心的，我们可以通过以下检索查询 NFT 铸造:

SELECT
	contractAddress, 
	COUNT() AS mintCount 
FROM
	logsTemp lt
WHERE
	topics[1] == '0xddf252ad1be2c89b69c2b068fc378daa952ba7f163c4a11628f55a4df523b3ef'
	AND topics[2] == '0x0000000000000000000000000000000000000000000000000000000000000000'
	AND topics.size0 == 4
GROUP BY contractAddress 
ORDER BY mintCount DESC

铸造交易本质上就是 from 为空地址的交易，所以我们可以通过指定 topics[2] 为空地址来完成检索。

检索结果如下:

contractAddress	mintCount
0x9f44bb8fedb144c6b8e9c46e01375429e04244c3	1019
0x5f12a00a9deabfb1299dcbbdc654904c3273f842	946
0x58c7ffcf5591166384beabca7661666c9d47709c	887
0x6e87070593daa38ac275e718d11e0b496f075fc8	189
0x11b3cf25f300b8ec587dfc349d419b5181084909	188

WETH 平衡问题

众所周知，WETH 是以太坊中最重要的 ERC20 代币，我们想知道 WETH 在某一时间段内的存款(即 ETH 包装为 WETH) 和取款(即 WETH 兑换 ETH) 是否平衡。

首先，我们知道 WETH 合约地址为 0xC02aaA39b223FE8D0A0e5C4F27eAD9083C756Cc2，使用智能合约开发效率工具中介绍的链上合约阅读方法，使用此链接查看 WETH 合约源代码。

使用 Ctrl + F 快捷键进行 event 搜索，发现定义如下:

event  Approval(address indexed src, address indexed guy, uint wad);
event  Transfer(address indexed src, address indexed dst, uint wad);
event  Deposit(address indexed dst, uint wad);
event  Withdrawal(address indexed src, uint wad);

分析实现代码，发现 Deposit 为存款而 Withdrawal 为取款。

使用 foundry 中的 cast 工具获得 topics1 的内容:

cast sig-event "Deposit(address indexed dst, uint wad)"

输出如下:

0xe1fffcc4923d04b559f4d29a8bfc6cda04eb5b0d3c460751c2402c5c5cc9109c

同理可得，Withdrawal 的 topics1 内容如下:

0x7fcf532c15f0a6db0bd6d0e038bea71d30d808c7d98cb3bf7268a95bf5081b65

根据以上信息，我们可以构造如下检索:

SELECT
	topics[1],
	COUNT(),
	SUM(reinterpretAsUInt128(reverse(unhex(txlogsData))))
FROM
	logsTemp lt
WHERE
	topics[1] == '0xe1fffcc4923d04b559f4d29a8bfc6cda04eb5b0d3c460751c2402c5c5cc9109c'
	OR topics[1] == '0x7fcf532c15f0a6db0bd6d0e038bea71d30d808c7d98cb3bf7268a95bf5081b65'
GROUP BY topics[1]

输出结果如下:

name	count()	sum(reinterpretAsUInt128(reverse(unhex(txlogsData))))
0xe1fffc…	866	714652525202720698543661912
0x7fcf53…	798	959677908506807633161

由此我们发现进入 ERC20 体系流转的 ETH 大于退出的 ETH，可见以太坊智能合约生态系统是吸引人的。

总结

本文对以太坊智能合约的 event 数据进行了提取，又介绍了部分实战项目。总结来说，使用 Event 数据进行分析是目前以太坊智能合约数据分析中使用最广泛的方法，具体分析思路如下:

阅读项目文档和合约源代码找到与分析相关的 Event
获得 Event 对应的 topics1 对数据进行筛选
进行分组聚合分析

当然，在本文中，我们没有进行更加复杂且细致的分析工作，在未来，我们会引入图数据以便更加详细的分析数据。

你可能感兴趣的:(区块链数据分析基础设施,clickhouse,区块链,数据分析,ethereum,智能合约)

AI Agent赛道：昙花一现还是生态革命？6大咖拆解泡沫与未来人工智能比特币区块链web3
作者：CRYPTO币圈不设防币圈不设防第四期Space总结：AIAgent赛道还能火多久？在Web3华语主持人茄哥的主持下，第四期《币圈不设防》围绕“AIAgent赛道还能火多久？”展开深度探讨。本期嘉宾阵容强大，包括Uweb校长于佳宁、TradingBaseAI创始人Mr.Z、BuilderLogEarn、区块链爱好者flyawei、投研博主清风#BTC，以及社区领袖小智。以下是讨论的核心观点总
美国国家航空航天局（NASA）的PUNCH任务 novanova2009 数码相机
地球浸没在来自太阳的物质流中。这种被称为太阳风的流正在冲刷我们的星球，造成令人叹为观止的极光，影响太空中的卫星和宇航员，甚至影响地面基础设施。美国宇航局（NASA）的PUNCH（统一日冕和日球层旋光仪PolarimetertoUnifytheCoronaandHeliosphere）任务将首次将太阳的日冕（或外层大气层）和太阳风一起成像，以更好地了解太阳、太阳风和地球作为一个单一的互连系统。PUN
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
业务7——数据埋点嚯嚯嚯嚯什么都不会业务数据分析
文章目录一、数据生命周期：二、埋点是什么？1、含义2、方式三、埋点流程1、埋点生命周期2、业务需求分析3、埋点文档设计一、数据生命周期：还能从数据角度来看，数据在工作中的参与环节，帮助理清数据分析流程和思路。二、埋点是什么？1、含义数据埋点是数据采集的一种重要方式，是在有需要的位置采集相应的信息，主要是终端用户的操作行为，后续用于解决业务方提出的业务需求。2、方式全埋点代码埋点（百度统计、友盟、T
前端实现埋点&监控 Cipher_Y 前端
前端实现埋点&监控实现埋点功能的意义主要体现在以下几个方面：数据采集：埋点是数据采集领域（尤其是用户行为数据采集领域）的术语，它针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。通过埋点，可以收集到用户在应用中的所有行为数据，例如页面浏览、按钮点击、表单提交等。数据分析：采集的数据可以帮助业务人员分析网站或者App的使用情况、用户行为习惯等，是后续建立用户画像、用户行为路径等数据产
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
数据安全新纪元——多方安全计算与MySQL结合的隐私预算管理深度解析墨夶数据库学习资料1 安全 mysql android
在当今数字化时代，数据已成为企业最宝贵的资产之一。然而，随着数据泄露事件频发，如何确保数据的安全性和隐私性成为了亟待解决的问题。传统的加密技术虽然能在一定程度上保护静态数据，但在动态数据分析过程中却显得力不从心。为了解决这一难题，隐私计算作为一种新兴的技术应运而生，它允许在不解密原始数据的前提下进行有效的计算和分析。本文将深入探讨如何利用多方安全计算（MPC）与关系型数据库MySQL相结合的方式实
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
OpenStack 云平台的深度定制与性能优化算法探索者 openstack
引言OpenStack作为一款领先的开源云平台，以其高度的灵活性和可扩展性，为企业构建云计算基础设施提供了强大的支持。然而，不同企业的业务场景和技术需求千差万别，原生的OpenStack部署往往无法完全满足企业特定的要求。因此，对OpenStack云平台进行深度定制，并在此基础上进行性能优化，成为了企业充分发挥OpenStack优势、提升云服务质量的关键。本文将深入探讨如何针对企业特定需求对Ope
Orange 单体架构 - 快速启动 mmd0308 Orange 开源项目架构开源
1后端服务1.1基础设施组件说明版本MySQLMySQL数据库服务5.7/8+JavaJava17redis-stackRedis向量数据库最新版本Node安装Node22.11.0+1.2orange-dependencies-parent项目Maven依赖版本管理1.2.1项目克隆GitHubgitclonehttps://github.com/hengzq/orange-dependenci
谈谈互联网后端基础设施 GarfieldEr007 Java Web 互联网后端基础设施 web
本文更新于2016.12.06,加入了Netflix组件部分对于一个互联网企业，后端服务是必不可少的一个组成部分。抛开业务应用来说，往下的基础服务设施做到哪些才能够保证业务的稳定可靠、易维护、高可用呢？纵观整个互联网技术体系再结合公司的目前状况，个人认为必不可少或者非常关键的后端基础技术/设施如下图所示：这里的后端基础设施主要指的是应用在线上稳定运行需要依赖的关键组件/服务等。开发或者搭建好以上的
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
从5G向6G演进的三维连接宋罗世家技术屋智能科学与技术专栏 5G
【摘要】三维连接技术作为地面网络（TN）与非地面网络（NTN）的融合组网技术，既能解决TN空天地海覆盖受限与NTN服务场景受限问题，又能促进后5G（B5G）与6G网络基础设施产业链的健康发展。首先简述了三维连接技术的发展历程，然后重点介绍了未来两年将要完成的5GNTN标准需求、部署结构、空中接口、频谱与终端方面的设计考虑，最后给出了对未来B5G/6G三维连接技术展望，提出了需要全球产学研机构共同研
新能源智慧路灯：点亮城市未来之路 2501_91106766 材料工程
在城市发展进程中，新能源智慧路灯凭借其创新性，为可持续发展指引了方向。它不仅是照明设施的升级换代，更是城市基础设施向智能化转型的重要环节。一、能源供应的革新新能源智慧路灯的关键在于其能源系统。通常配备太阳能电池板，可将日间阳光转化为电能，并储存于高性能电池中，为夜间照明及其他功能提供动力。在光照条件欠佳的区域，出现了风能辅助发电的路灯，风力发电机与太阳能电池板协同运作，确保能源供应的稳定性。这种多
pycharm中使用anaconda部署python环境_pycharm部署配置anaconda环境教程 weixin_39796652
本篇文章小编给大家分享一下pycharm部署配置anaconda环境教程，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。pycharm部署anaconda环境Pycharm：python编辑器，社区版本Anaconda：开源的python发行版本(专注于数据分析的python版本)，包含大量的科学包环境基本指令(准备工作)：conda--version查看anaconda
网络安全知识：网络安全网格架构网络安全-杰克 web安全架构安全
在数字化转型的主导下，大多数组织利用多云或混合环境，包括本地基础设施、云服务和应用程序以及第三方实体，以及在网络中运行的用户和设备身份。在这种情况下，保护组织资产免受威胁涉及实现一个统一的框架，该框架根据组织内每个实体的上下文提供安全性。此外，强化组合环境需要可互操作的跨域功能，以增强协作，这样就不需要多个解决方案来实现相同的功能。在这种情况下，网络安全网格架构（CSMA）提供了一种可扩展的方法来
区块链环境配置自用 Xmas190 其它区块链
FabricLab1.Fabric环境搭建与基本操作2.Fabric链码基础3.Fabric项目架构Fabric实践一：环境搭建与基本操作一、Fabric环境搭建本文用于指导Fabric在基于Ubuntu的Linux系统中的安装与配置，如有未安装过的同学可以参考本指南自行配置。相关组件版本号：名称版本Ubuntu16.04Fabric1.4Docker20.10.5Docker-compose1.
使用Python构建去中心化预测市场：从概念到实现 Echo_Wish Python！实战！python 去中心化开发语言
使用Python构建去中心化预测市场：从概念到实现大家好，我是Echo_Wish。今天，我们将深入探讨一个前沿的区块链应用——去中心化预测市场，并学习如何使用Python来构建一个简易的预测市场平台。预测市场是基于市场参与者对未来事件的预测来产生结果的地方，通常被用来预测政治事件、金融市场走向、体育比赛结果等。传统的预测市场如Augur、Polymarket等，基于去中心化平台，利用区块链技术确保
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
华为OD机试统一考试D卷C卷 - 机器人仓库搬砖 py 愤怒的小青春 java
平安寿险北分和飞鹤职能哪个强度好一些呀，平安寿险北分和飞鹤职能哪个强度好一些呀，两个offer纠结经营分析应该属于什么序列#数据分析#在牛客搜经营分析貌似只有字节有这个单独岗位名字，其他大厂都是在从属于数据分析，所以这俩昇腾计算岗位扩招，绝佳上车AI机会，速来ai芯片业务发展太快，要大量补充人力缺口。嵌入式软件开发、测试，前后端岗位，硬件岗位都招。院校范围很春招补录两个公司总包差不多，都是后台开发
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
向量数据库技术系列三-Chroma介绍恰恰虎 chromadb 数据库向量
一、前言Chroma是一个开源的AI原生向量数据库，旨在帮助开发者更加便捷地构建大模型应用，将知识、事实和技能等文档整合进大型语言模型（LLM）中。它提供了简单易用的API，支持存储嵌入及其元数据、嵌入文档和查询、搜索嵌入等功能。主要有以下特点:轻量级：Chroma是一个基于向量检索库实现的轻量级向量数据库，不需要复杂的配置和大规模基础设施支持，非常适合小型或中型项目。易用性：提供简单的API，易
《Solidity智能合约开发：从零到一实战指南》大纲白马区块Crypto100 智能合约
为什么要学Solidity智能合约？在过去几年，区块链从一种“投机工具”进化为一种全新的技术基础设施。无论是NFT、DeFi、GameFi还是DAO，它们的核心都是——智能合约。✨什么是智能合约？智能合约是运行在区块链上的“自动执行程序”，不用依赖中介或第三方，信任直接写进代码里。而Solidity是智能合约开发的“通用语言”。为什么要做这个专栏？做区块链项目的人越来越多，但真正从零系统学习Sol
全国一体化算力网演进与多域协同发展智能计算研究中心其他
内容概要全国一体化算力网的建设正从技术探索迈向系统性布局，其核心目标是通过多源异构资源的动态调度与协同管理，构建覆盖全域的智能化算力基础设施。当前，东数西算战略通过跨区域算力资源整合，推动智能算力、超级算力与边缘计算的有机衔接，逐步形成支撑工业互联网、元宇宙、智能家居等多元化场景的泛在服务能力。技术层面，异构计算架构的突破与量子计算、模型压缩等创新技术的融合，正在重塑算力系统的可扩展性与可靠性边界
东南亚电商市场研究报告：机遇与挑战并存（Shopee、Lazada、TikTok、Tokopedia）萧十一郎@ 知识科普开发语言
一、引言1.1研究背景与目的在全球数字化浪潮的推动下，电子商务已成为经济发展的重要驱动力。东南亚地区，凭借其庞大的人口基数、快速增长的互联网普及率以及不断提升的经济水平，电商市场呈现出蓬勃发展的态势，成为全球电商领域中备受瞩目的新兴市场。东南亚拥有超过6.5亿的人口，其中年轻人口占比较高，消费潜力巨大。近年来，该地区互联网基础设施不断完善，智能手机的普及使得网络购物变得更加便捷，为电商的发展提供了
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
区块链在医疗数据共享中的应用：解锁安全与透明的新维度 Echo_Wish 人工智能前沿技术区块链安全
区块链在医疗数据共享中的应用：解锁安全与透明的新维度近年来，区块链技术在金融领域取得了显著的突破，然而，它的潜力不仅仅局限于数字货币和支付领域。随着医疗数据的数字化和信息化程度不断提升，区块链技术在医疗数据共享中的应用正逐渐成为一个热门话题。区块链以其去中心化、不可篡改、透明且高效的特点，为医疗行业的数据管理提供了全新的解决方案，尤其是在患者隐私保护、数据共享以及医疗服务的透明度方面。那么，区块链
XPipe：一款新型开源终端管理神器修己xj 工具开源
最近，一位朋友在使用Docker时遇到了一个问题：他对宿主机与容器之间的文件复制以及在容器内执行命令等操作感到困惑。这让我开始思考，如果有一款远程管理工具能够直接连接到容器内部，操作是否会变得更加便捷？恰巧，今天在浏览GitHub时，我发现了这样一款名为XPipe的工具。工具介绍XPipe是一款创新的Shell连接中心和远程文件管理器，它能够让你从本地机器轻松访问整个服务器基础设施。这款工具运行在
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持