  • String是一个UTF-16编码的文本
  • String是一个引用类型
  • String是不可变的


public class MonoTest : MonoBehaviour {
    const int SIZE = 1024;
    void Update () {
    string _UpdateStringAppend() {
        string str = string.Empty;
        for (int i = 0; i < SIZE; ++i) {
            str += i;
        return str;
    string _UpdateStringFormat() {
        string str = string.Empty;
        for (int i = 0; i < SIZE; ++i) {
            str += string.Format("{0}", i);
        return str;
    string _UpdateStringBuild() {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < SIZE; ++i) {
        return sb.ToString();
Func Time ms GC Alloc
StringAppend 9.09ms 2.9M
StringFormat 20.97ms 3.0M
StringBuilder 4.76ms 48.0KB




string _UpdateStringFormatEx() {
    string str = string.Empty;
    for (int i = 0; i < SIZE; ++i) {
        str = string.Format("{0}{1}", str, i);
    return str;
Func Time ms GC Alloc
StringAppend 9.09ms 2.9M
StringFormat 20.97ms 3.0M
StringBuilder 4.76ms 48.0KB
StringFormatEx 40.13ms 8.6M


string str = string.Format("{0}{1}....{n}", 0, 1, ..., n);



字符串是不可变,每次修改字符串都会生成一个新的字符串,那创建的字符串呢?尽管实验得到,每次创建字符串都会得到一个新串,即使已经存在一个相同的字符串。这里有一篇顾露分享的《Unity 游戏的 string interning 优化》已经做了这块内容详细描述。这里通过string.Intern来减少字符串数量达到优化内存的效果,同时让我发现了项目中存在着大量的字符串使用。如何更进一步的减少字符串数量是个有趣的问题。


Resources.Load(string path, Type type);

Resources.Load(ulong pathHash, Type type);
Resources.PathToHash(string path);


public class Template
   public int id = -1;
   public string name;
   public string path;
public class Template
   public int id = -1;
   public string name;
   public ulong pathHash;



public ulong PathToHash(string str) {
    ulong hashCode = 0;
    for (int i = 0; i < str.Length; ++i) {
        char ch = Char.ToUpperInvariant(str[i]);
        if (str[i] == '\\')  { ch = '/'; }
        hashCode = (hashCode << 7) + (hashCode << 1) + hashCode + ch;
    return hashCode;


public string GetUniString(string str) {
    return str.Replace('\\', '/').ToUpperInvariant();


由于Unity提供的Resources接口需要使用路径字符串来加载资源,所以之前说了那么多还没有解释为什么可以减少字符串对象这个问题。这里我们项目能使用主要是由于使用了AssetBundle。只需要先存Hash对应的AssetBundle ID然后加载这个AssetBundle的时候加载Hash对应Name即可。AssetBundle支持直接使用Name加载,也可以使用Asset Path加载。这里的AssetPath是相对于Assets目录的路径与Resources的相对于Resources目录还是有差异的,所以使用Name来加载。AssetBundle本身就有一个接口AssetBundle.GetAllAssetNames()获取所有资源路径。不过这里会包含被依赖的所有资源路径,所以一般自己存这个数据。

细心的人也注意到了上面提到的AssetBundle ID,由于AssetBundle打包是可以完全控制的。所以给AssetBundle命名一个数字ID,也是有效的减少字符串数量的方法。这对使用AssetBundle打包加载资源的项目是一个不错的参考。我们实现自己的AssetBundleManifest维护AssetBundle之间的依赖关系。




默认的字符串比较操作是非常低效的,《Best Practices for Using Strings in .NET》这篇文章讲了这方面的大部分细节。这里主要展示一些实践测试数据,让我们对性能有一个认识。

StringBuilder sBuilder = new StringBuilder();
System.Random random = new System.Random();
for (int i = 0; i < 100; ++i)
   sBuilder.Append((char)(random.Next() % 256));
string str = sBuilder.ToString();
string preStr = str.Substring(0, 16);
string lastStr = str.Substring(str.Length - 16, 16);
int cnt = 0;
for (int i = 0; i < 100 * 1024; ++i)
    if (str.StartsWith(preStr)) ++cnt;
    if (str.EndsWith(lastStr)) ++cnt;


Method Time(ms) 100k compares
String.StartsWith,default culture 360ms
String.EndsWith,default culture 12465ms
String.StartsWith,Ordinal 357ms
String.EndsWith,Ordinal 174ms
CustomStartsWith 18ms
CustomEndsWith 17ms
Func Name Default interpretation
String.Compare StringComparison.CurrentCulture
String.CompareTo StringComparison.CurrentCulture
String.Equals StringComparison.Ordinal
String.ToUpper StringComparison.CurrentCulture
Char.ToUpper StringComparison.CurrentCulture
String.StartsWith StringComparison.CurrentCulture
String.IndexOf StringComparison.CurrentCulture


Func Name Default interpretation
String.Compare StringComparison.CurrentCulture
String.CompareTo StringComparison.CurrentCulture
String.Equals StringComparison.Ordinal
String.ToUpper StringComparison.CurrentCulture
Char.ToUpper StringComparison.CurrentCulture
String.StartsWith StringComparison.CurrentCulture
String.IndexOf StringComparison.CurrentCulture



泛型容器内部实现会调用一些System.Object接口,如果我们不实现对应的泛型接口,在调用接口的时候就会找到基类Object的接口。而由于Struct是一个值类型,value type转class type会触发内存分配,定义这种行为为Boxing。《c-performance-tips-for-unity-part-2-structs-and-enums》这篇文章已经对这块做了详细描述与举例。我自己也做了一些数据测试,分享给大家做参考。

public struct SmallStruct
{   // 2 int fields. Total size: 2 * 4B + 16B = 24B
    public int a, b;
public struct LargeStruct
{   // 20 int fields. Total size: 20 * 4B + 16B = 96B
    public int a, b,  /* … */;
// Dictionary dict
// 1024 calls dict. ContainsKey
Struct GC Alloc Time ms
SmallStruct 72.0KB 2.50ms
LargeStruct 288.0KB 11.05ms
SmallStruct GC Alloc Time ms
None 72.0KB 2.50ms
IEquatable 24.0KB 1.77ms
GetHashCode 48.0KB 2.57ms
GetHashCode,IEquatable 0.0KB 1.81ms


SmallStruct GC Alloc Time ms
None 72.0KB 2.50ms
IEquatable 24.0KB 1.77ms
GetHashCode 48.0KB 2.57ms
GetHashCode,IEquatable 0.0KB 1.81ms

观察发现Dictionary内部使用 EqualityComparer

public abstract class EqualityComparer
    protected EqualityComparer();
    public static EqualityComparer Default { get; }
    public abstract bool Equals(T x, T y);
    public abstract int GetHashCode(T obj);

如果没有实现还GetHashCode触发一次boxing,而Equals则触发两次。实现IEquatable泛型接口,以及override int GetHashCode则可避免触发GC。非泛型的HashTable实现和泛型Dictionary基本一致,推荐使用Dictionary泛型版本,提高性能。


void DispatchEvent(string str, params object[] data);

static object[] _default = new object[] {};
void DispatchEvent(string str)  {
    _DispatchEvent(str, _default);
void _DispatchEvent(string str, object[] data);

params object每次调用会申请一个object数组,对于无参数的行为,实现一个默认接口减少GC。

一般情况下使用Profile Windows排查不必要的GC Alloc。

这个工具能帮助我们定位发生GC Alloc行为的代码,通常第一步优化那些每帧都存在的GC,之后优化那些峰值很高的GC。优化GC能带来什么好处呢,假设当前使用了30M内存,申请了50M内存。这里有20M的空间可以用于日常的GC Alloc。假设我们每帧的GC Alloc=100K,则20 * 1024 / 100 = 204帧。如果每帧的执行时间为33ms(30帧),则6.76S触发一次GC.Collect()。这个函数开销在100ms以上,当前帧的开销从33ms变成133ms,这会有明显的卡顿感。更多的GC优化可以参考《Structing out code to minimize the impact of garbage collection》。


从Rich Geldreich的《Lessons Learned While Fixing Memory Leaks in our First Unity Title》了解到对象数量过大造成额外的内存使用。这里再次谈对象数量优化,优化内存使用。

The Boehm collector grows its OS memory allocation so it has enough internal heap headroom to avoid collecting too frequently. You must factor this headroom into account when budgeting your C# memory, i.e. if your budget calls for 25MB of C# memory then the actual amount of memory consumed at the OS level will be significantly larger (approximately 40-50MB in our experience).


public class Dicitonary { 
    private int[] m_buckets;
    private int[] m_entryNext;
    private int[] m_entryHash;
    private TKey[] m_entryKey;
    private TValue[] m_entryValue;
public class PlayerTemplate {
    public int id;
    public ulong pathHash;
    public float height;
    /* ... more data */
} // assume size = 128B
Dictionary dict;


Set PlayerTemplate Count = 5000;
// 第一个大于Count * 2的素数
Dictionary ArraySize = 10103; 

ObjectCount = 5000 + 5 + 1 = 5006;
MemorySize = 5000 * 128B + 10103 * 24 = 882472B = 861.8KB 


public struct PlayerTemplate {/* … */}

ObjectCount = 5 + 1 = 6;
MemorySize = 10103 * 128B + 10103 * 16 = 1454832B = 1420.7KB


public interface ITableType {
    TKey GetKey();
public class TableOrderList {
    private bool m_sorted;
    private TValue[] m_data;
    private int m_size;
public struct PlayerTemplate : ITableType {
    public int GetKey() {
        return id;
    public int id;
    public ulong pathHash;
    public float height;
    /* ... more data */


public int LowerBounder(TKey key) {
    int low = 0, high = m_size;
    while (low < high) {
        int mid = (low + high) >> 1;
        if (m_list[mid].GetKey().CompareTo(key) < 0) {
            low = mid + 1;
        } else { 
            high = mid;
    return low;


Type Object Count Memory Use Complexity
Class,Dictionary 5006 861.8KB O(1)
Struct,Dictionary 6 1420.7KB O(1)
Struct,TableOrderList 1 625KB O(logn)


Struct只能整存整取,Class则可以简易的修改成员变量。但是对于只读的数据来说,使用Struct来存储数据有极大的优势。更多Struct与Class的讨论可以参考《What's the difference between struct and class in .NET》。

[完 Carber 2017-08-11]

