原文来自:链闻ChainNews
区块链上数据是个宝藏,有大量的信息可以发掘。链闻前几天专门总结了 22 个链上数据资源与可视化工具,可以帮助投资者、交易员和分析师们更好发掘链上数据。文章推送后,大量读者收藏。当然,也有读者反馈:为什么只提供工具,不提供分析结论?
在区块链的世界,数据就在那里,等着你来探索,得出对自己有用的结论。如何探索?认真读读今天的文章,链上交易信息分析公司 TokenAnalyst 的数据科学家 Matthias De Aliaga 提供了一个绝妙案例。
作者:Matthias De Aliaga,链上交易信息分析公司 TokenAnalyst 数据科学家
编译:Perry Wang
以太坊区块链容纳了不同种类的用户,多数是普通人,但也有相当一部分地址分属于特定群体。当然也有一些非常引人瞩目。
比如,最引人瞩目的一些地址包括:
这些都是持有 ETH 的大户,甚至只是单一主体,其 ETH 也往往分布在多个不同的以太坊钱包地址。
更多情况下,人们故意狡兔三窟,让别人难以追查其持币情况。
不过,我们依然可以通过链上交易活动,收集到持币最多的那些地址的信息。
这些信息为什么值得探究?
想要追踪这些地址有很多原因,例如:
投资者希望预判价值走势
发币团队想要对大的持币地址空投自己的代币
政府机构想要审计可疑的区块链活动
研究人员希望更好了解区块链世界的动向
幸运的是,有关地址的链上信息多的数不胜数,可以有效帮助追踪不同类型账户的活动。
最显而易见的做法,是去寻找这些 ETH 的流出流入情况。也许你希望在加密货币世界看到比现实世界更小的贫富差距,但现实会让你感到震惊:
以上图标是对数尺度,图左第一部分是代表 ETH 前 10 大持币地址,接下来是前 11-100 大持币地址,之后一直到 3,500 万个持币地址,以持有 ETH 多少为续。
换种说法:
以太坊的前 10,000 个最大的地址拥有 83.3% 的 ETH!
如果这还不足以让你目瞪口呆,看看前 10 大地址,这前 10 个地址总计共持有 11.4% 的 ETH。ETH 集中在这么一小撮人手中,让追踪大账户资金走向这件事变得更有意义。
以太坊区块链的匿名性让持币大户难以被按图索骥。不过幸运的是,区块链也是透明的,每个举动都是可被追溯的。到笔者撰文时为止,以太坊网络共有 570 万个区块,每个区块中包含有价值的交易信息,可以用于识别出包括交易所、发币团队等不同群体的地址,并对他们进行种类。
让链上数据可视化
让我们盘点一下前 10,000 个大户地址的区块链数据,这样,具体的特征就会浮出水面。
在单个图表中无法连续呈现每个地址的数据量,我们先看四个关键的变量:发送交易和接收交易、经常账户余额以及持有的代币种类。
这些变量代表了一个账号的活动及资产情况,反映的是其最重要的资产。
其中可以看出的信息量很大!数据强调了 ETH 持币大户中有着鲜明的阵营划分。
首先它告诉我们,「交易发送大户」并不一定接收到很多交易,反之亦然。它还显示出,很多 ETH 持币大户 账户余额有的高达 150 万枚 ETH 相对而言在交易方面并不活跃。持有大量币种的账户通常接收到的交易比发送的交易多很多。
通过地址分类数据分析,我们可以进一步审视这些不同组别的活动特征。
这次我们只看接受交易、发送交易和账户余额 彩色变成分类组别,数据组别限制在交易所、矿池和发币团队钱包。
我们可以先看这些组别的数据特征:
可以从区块链浏览器 etherscan.io 中手动查询中相关地址的分类
显然,每个组别之间有着泾渭分明的差别,平均而言,矿池发送交易特别多,发币团队的钱包账户余额很高, 交易所接收和发送交易都很多。
三个组别彼此间泾渭分明的区别令人印象深刻,不过也完全讲得通:矿池收到挖矿奖励,然后发送交易给矿工;发币团队会持有他们募集的资金;客户通过交易所接受和发送 ETH 及其它代币交易。
可以清晰查询的数据还不仅限于此。另一个可以探索的维度是每个地址持有的代币种类。譬如,持有 50 枚 MANA 和 30 枚 EOS 会算作持有两种代币。另一个有价值的维度是区别智能合约地址和外部账户。
简单做一个科普。在以太坊中,有两类账户:外部账户和合约账户,两类账户都有一个与之关联的账户状态和一个 20 字节地址,都可以存储以太币。不过,外部账户由私钥控制,没有代码与之关联,地址由公钥决定,私钥可用于对交易签名,从而主动向其他账户发起交易,进行消息传递;而合约账户由合约代码控制,有代码与之关联,其地址由合约创建者的地址和该地址发出过的交易数量 nonce 共同决定,不可以主动向其他账户发起交易,但可以响应其他账户进行消息调用 message call。相比之下,智能合约是独特的地址类型,排除了多数普通用户类型,因此有助于归类地址的功能。
持有的币种数量可以让我们对地址有着更多了解,譬如投资者, 也许更有兴趣持有很多种代币。
上图中可以很快读出一些信息:
发币团队通常是智能合约账户;矿池基本都是外部账户
交易所地址通常持有超过 100 种的代币,其它账户基本不会。
交易所可能是地址账户,也可能是智能合约账户——这也是它们究竟是去中心化交易所 譬如 EtherDelta 还是中心化交易所 譬如币安 的标志。这层关系可能显而易见,但它可以让我们更进一步归类并标记不同的地址。
来,在区块链上创建用户画像原型
有了上面这些发现,我们可以做更多分析,先把地址按用户的类型进行划分,包括链上参数集合等,然后,我们我们就可以轻易识别出哪些未被标注的地址属于什么类型。
我们尝试做了一些模型,以下图表呈现:
继续探寻未来路径
根据对仅有的 77 个已标注出类别的账户地址进行的数据分析,我们能描绘出最为重要的一些以太坊地址类型。
未来对这一领域还有无穷无尽的探索潜能。简单提几个想法:比如,通过追踪并分析一些账号与交易所地址间的互动参数,可以更好的追踪出活跃的交易员账户。另外,通过分析以太坊最早一些区块相关地址的积累模式,可以更好的观察早期投资者的活动。
可以发掘的方向还有很多。在区块链的世界,数据就在那里,等着你来探索。