图片来自 Glenn Carstens-Peters[1]Unsplash[2]
欢迎来到.NET 性能系列的另一章。这个系列的特点是对.NET 世界中许多不同的主题进行研究、基准和比较。正如标题所说的那样,重点在于使用最新的.NET7 的性能。你将看到哪种方法是实现特定主题的最快方法,以及大量的技巧和窍门,你如何能以较低的努力最大化你的代码性能。如果你对这些主题感兴趣,请继续关注
在这篇文章中,我们将比较两个最突出的.NET 的 json 框架。:Newtonsofts Json.NET[3] 和 Microsofts System.Text.Json[4].
Newtonsoft.Json
是 NuGet 上下载量最大的软件包,下载量超过23 亿。System.Text.Json
稍稍落后,大约有6 亿次下载。然而,我们需要考虑的是,System.Text.Json
自.NET Core 3.1 起就默认随.NET SDK 交付。既然如此,Newtonsoft 似乎仍然是最受欢迎的 json 框架。让我们来看看,它是否能保持它的名次,或者微软是否在性能方面缓慢但肯定地领先。
为了模拟现实生活中应用的真实场景,我们将测试两个主要用例。
第一,单个大数据集的序列化和反序列化。
第二是许多小数据集的序列化和反序列化。
一个真实的场景也需要真实的数据。对于测试数据集,我决定使用 NuGet 包Bogus[5]。通过 Bogus,我能够快速生成许多不同的用户,包括个人姓名、电子邮件、ID 等。
[Params(10000)]
public int Count { get; set; }
private List testUsers;
[GlobalSetup]
public void GlobalSetup()
{
var faker = new Faker()
.CustomInstantiator(f => new User(
Guid.NewGuid(),
f.Name.FirstName(),
f.Name.LastName(),
f.Name.FullName(),
f.Internet.UserName(f.Name.FirstName(), f.Name.LastName()),
f.Internet.Email(f.Name.FirstName(), f.Name.LastName())
));
testUsers = faker.Generate(Count);
}
对于基准,我们将使用每个软件包的最新版本,目前是(2022 年 10 月):
Newtonsoft.Json — 13.0.1 and
System.Text.Json — 7.0.0-rc.2[6]
为了测试一个大对象的序列化,我们简单地使用List
,我们在GlobalSetup()
方法中设置了它。我们的基准方法看起来像这样:
[Benchmark(Baseline = true)]
public void NewtonsoftSerializeBigData() =>
_ = Newtonsoft.Json.JsonConvert.SerializeObject(testUsers);
[Benchmark]
public void MicrosoftSerializeBigData() =>
_ = System.Text.Json.JsonSerializer.Serialize(testUsers);
这些方法都使用默认的ContractResolver
,它只被实例化一次,因此是两个框架中性能最好的序列化选项。如果你使用自定义的JsonSerializerSettings
,注意不要多次实例化ContractResolver
,否则你会降低很多性能。
现在我们来看看结果:
Method | Count | Mean | Ratio | Allocated | Alloc Ratio |
---|---|---|---|---|---|
NewtonsoftSerializeBigData | 10000 | 7.609 ms | 1.00 | 8.09 MB | 1.00 |
MicrosoftSerializeBigData | 10000 | 3.712 ms | 0.49 | 3.42 MB | 0.42 |
尽管 Newtonsoft 在他们的第一个文档网站[7]上说。
高性能:比.NET 的内置 JSON 序列化器快
我们可以清楚地看到,到目前为止,他们并不比内置的 JSON 序列化器快。至少在这个用例中是这样。让我们来看看,在其他使用情况下是否也是如此。
这个用例在实际应用中比较常见,例如在 REST-Apis 中,每个网络请求都必须处理 JSON 序列化数据,并且也要用 JSON 序列化数据进行响应。
为了实现这个用例,我们使用之前建立的List
,并简单地循环通过它,同时单独序列化每个用户。
[Benchmark(Baseline = true)]
public void NewtonsoftSerializeMuchData()
{
foreach (var user in testUsers)
{
_ = Newtonsoft.Json.JsonConvert.SerializeObject(user);
}
}
[Benchmark]
public void MicrosoftSerializeMuchData()
{
foreach (var user in testUsers)
{
_ = System.Text.Json.JsonSerializer.Serialize(user);
}
}
在我的机器上,这个基准测试导致了以下结果:
Method | Count | Mean | Ratio | Allocated | Alloc Ratio |
---|---|---|---|---|---|
NewtonsoftSerializeMuchData | 10000 | 8.087 ms | 1.00 | 17.14 MB | 1.00 |
MicrosoftSerializeMuchData | 10000 | 3.944 ms | 0.49 | 3.64 MB | 0.21 |
我们可以看到对于许多小对象来说,性能又快了近 100%。不仅 System.Text.Json 的性能比 Newtonsoft 快了一倍,而且堆分配的内存甚至少了 5 倍! 正如我在以前的文章中提到的,节省堆内存甚至比速度更重要,你在这里看到了。堆内存最终将不得不被垃圾回收,这将阻塞你的整个应用程序的执行。
在现实世界的应用中,你不仅要序列化,还要从 JSON 序列化的字符串中反序列化对象。在下面的基准中,我们将再次使用 Bogus,创建一组用户,但这次我们要把它们序列化为一个大的字符串,用于大数据对象,并把许多小数据对象序列化为List
。
private string serializedTestUsers;
private List serializedTestUsersList = new();
[GlobalSetup]
public void GlobalSetup()
{
var faker = new Faker()
.CustomInstantiator(f => new User(
Guid.NewGuid(),
f.Name.FirstName(),
f.Name.LastName(),
f.Name.FullName(),
f.Internet.UserName(f.Name.FirstName(), f.Name.LastName()),
f.Internet.Email(f.Name.FirstName(), f.Name.LastName())
));
var testUsers = faker.Generate(Count);
serializedTestUsers = JsonSerializer.Serialize(testUsers);
foreach (var user in testUsers.Select(u => JsonSerializer.Serialize(u)))
{
serializedTestUsersList.Add(user);
}
}
第一个反序列化基准将一个大的 JSON 字符串反序列化为相应的.NET 对象。在这种情况下,它又是List
,我们在前面的例子中也使用了它。
[Benchmark(Baseline = true)]
public void NewtonsoftDeserializeBigData() =>
_ = Newtonsoft.Json.JsonConvert.DeserializeObject>(serializedTestUsers);
[Benchmark]
public void MicrosoftDeserializeBigData() =>
_ = System.Text.Json.JsonSerializer.Deserialize>(serializedTestUsers);
在我的机器上运行这些基准测试,得出以下结果:
Method | Count | Mean | Ratio | Allocated | Alloc Ratio |
---|---|---|---|---|---|
NewtonsoftDeserializeBigData | 10000 | 21.20 ms | 1.00 | 10.55 MB | 1.00 |
MicrosoftDeserializeBigData | 10000 | 12.12 ms | 0.57 | 6.17 MB | 0.59 |
就性能而言,微软仍然远远领先于 Newtonsoft。然而,我们可以看到,Newtonsoft 并没有慢一半,而是慢了 40%左右,这在与序列化基准的直接比较中是一个进步。
本章的最后一个基准是许多小对象的反序列化。在这里,我们使用我们在上面的GlobalSetup()
方法中初始化的List
,在一个循环中反序列化数据对象:
[Benchmark(Baseline = true)]
public void NewtonsoftDeserializeMuchData()
{
foreach (var user in serializedTestUsersList)
{
_ = Newtonsoft.Json.JsonConvert.DeserializeObject(user);
}
}
[Benchmark]
public void MicrosoftDeserializeMuchData()
{
foreach (var user in serializedTestUsersList)
{
_ = System.Text.Json.JsonSerializer.Deserialize(user);
}
}
其结果甚至比相关的序列化基准更令人吃惊:
Method | Count | Mean | Ratio | Allocated | Alloc Ratio |
---|---|---|---|---|---|
NewtonsoftDeserializeMuchData | 10000 | 15.577 ms | 1.00 | 35.54 MB | 1.00 |
MicrosoftDeserializeMuchData | 10000 | 7.916 ms | 0.51 | 4.8 MB | 0.14 |
在 Microsofts 框架下,速度又快了一倍,内存效率是惊人的7倍,比 Newtonsoft 还要好!
尽管 Newtonsoft 在他们的文档[8]上说:
高性能:比.NET 的内置 JSON 序列化器更快
很明显,至少从.NET 7 开始,Microsofts 的System.Text.Json
在所有测试的用例中至少快了一倍,命名为。
序列化一个大数据集
序列化许多小数据集
对一个大数据集进行反序列化
对许多小数据集进行反序列化
所有这些都是在每个框架的默认序列化器设置下进行的。
不仅速度快了 100%,而且在某些情况下,分配的内存甚至比 Newtonsoft 的效率高 5 倍以上。
我甚至认为,可以推断出结果,目前使用System.Text.Json
比Newtonsoft.Json
更快。
请记住,这些结果只对最新的.NET 7 有效。如果你使用的是其他版本的.NET,情况可能正好相反,Newtonsoft 可能会更快。
我希望,我的文章可以帮助你对序列化器做出选择选择,并让你对性能和基准测试的世界有一个有趣的切入点。
如果你喜欢这个系列的文章,请一定要关注我,因为还有很多有趣的话题等着你。
谢谢你的阅读!
原文版权:Tobias Streng
翻译版权:InCerry
原文链接:https://medium.com/@tobias.streng/net-performance-series-2-newtonsoft-vs-system-text-json-2bf43e037db0
[1]
Glenn Carstens-Peters: https://unsplash.com/@glenncarstenspeters?utm_source=medium&utm_medium=referral
[2]Unsplash: https://unsplash.com/?utm_source=medium&utm_medium=referral
[3]Newtonsofts Json.NET: https://www.newtonsoft.com/json
[4]Microsofts System.Text.Json: https://www.nuget.org/packages/System.Text.Json
[5]Bogus: https://github.com/bchavez/Bogus
[6]7.0.0-rc.2: https://www.nuget.org/packages/System.Text.Json/7.0.0-rc.2.22472.3
[7]第一个文档网站: https://www.newtonsoft.com/json/help/html/Introduction.htm
[8]文档: https://www.newtonsoft.com/json/help/html/Introduction.htm