Unity序列化系统

转载至https://blog.uwa4d.com/archives/2025.html

作者Github:https://github.com/jintiao


一、前言

在使用Unity进行游戏开发过程中,离不开各式各样插件的使用。然而尽管现成的插件非常多,有时我们还是需要自己动手去制作一些插件。进入插件开发的世界,就避免不了和序列化系统打交道。

可以说Unity编辑器很大程度上是建立在序列化系统之上的,一般来说,编辑器不会去直接操作游戏对象,需要与游戏对象交互时,先触发序列化系统对游戏对象进行序列化,生成序列化数据,然后编辑器对序列化数据进行操作,最后序列化系统根据修改过的序列化数据生成新的游戏对象。

就算不需要与游戏对象交互,编辑器本身也会不断地对所有编辑器窗口触发序列化。如果在制作插件时没有正确地处理序列化甚至忽略序列化系统的存在,做出来的插件很可能会不稳定经常报错,导致数据丢失等后果。

下面的例子展示的是我们新接触插件开发时最常遇到的一种异常情况:插件本来运行地好好地,点了一下播放后插件就发疯地不断报错,某个(些)对象莫名被置空了:

二、序列化是什么

根据Unity的官方定义,序列化就是将数据结构或对象状态转换成可供Unity保存和随后重建的自动化处理过程。

“Serialization is the automatic process of transforming data structures or object states into a format that Unity can store and reconstruct later.”

很多引擎功能会自动触发序列化,比如:

  • 1 文件的保存/读取,包括Scene、Asset、AssetBundle,以及自定义的ScriptableObject等。

  • 2 Inspector窗口

  • 3 编辑器重加载脚本脚本

  • 4 Prefab

  • 5 Instantiation

三、序列化规则

既然序列化是一个自动化的过程,那我们能做什么呢,是不是只能坐在一边看系统自己表演呢?并不是,序列化确实是一个自动化过程,但引擎并不是完美人工智能,系统的功能受到序列化规则的限制。我们能做的,是通过规则告诉系统,哪些数据需要序列化,哪些数据不需要序列化。

序列化规则简单来说有两点,一是类型规则,系统据此判断能不能对对象进行序列化;二是字段规则,系统据此判断该不该对对象进行序列化。当对象同时满足类型规则和字段规则时,系统就会对该对象进行序列化。

Unity序列化系统_第1张图片
image

· 字段规则

我们通过例子1来具体讲解一下。我们定义了两个类,一个叫MyClass,另一个叫MyClassSerializable

public class MyClass {
    public string s;
}

[Serializable]
public class MyClassSerializable {
    public float f1;
    [NonSerialized]public float f2;
    private int i1;
    [SerializeField]private int i2;
}

接下来我们定义一个插件类SerializationRuleWindow

public class SerializationRuleWindow : EditorWindow {
    public MyClass m1;
    public MyClassSerializable s1;
    private MyClassSerializable s2;
}
Unity序列化系统_第2张图片
image

可以看到,s1的两个成员f1和i2保存了原来的值,其它成员都被清零了,我们来具体分析一下为什么会是这样。

编辑器退出前会对所有打开的窗口进行序列化并保存序列化数据到硬盘。在重启编辑器后,序列化系统读入序列化数据,重新生成对应的窗口对象。在对我们的插件对象SerializationRuleWindow进行序列化时,只有满足序列化规则的对象的值得以保存,不满足规则的对象则被序列化系统忽略。

我们来仔细看一下规则判定的情况。

首先看public MyClass m1,它的类型是MyClass,属于“没有标记[Serializable]属性的类”,不满足类型规则;它的字段是public,满足字段规则;系统要求两条规则同时满足的对象才能序列化,于是它被跳过了。

接下来看public MyClassSerializable s1,它的类型是MyClassSerializable,属于标记了[Serializable]属性的类,满足类型规则;它的字段是public,满足字段规则;s1同时满足类型规则和字段规则,系统需要对它进行序列化操作。

序列化是一个递归过程,对s1进行序列化意味着要对s1的所有类成员对象进行序列化判断。所以现在轮到s1中的成员进行规则判断了。

public float f1,类型float是c#原生数据类型,满足类型规则;字段是public,满足字段规则;判断通过。

[NonSerialized]public float f2,字段被标记了[NonSerialized],不满足字段规则。

private int i1,字段是private,不满足字段规则。

[SerializeField]private int i2,类型int是c#原生数据类型,满足类型规则;字段被标记了[SerializeField],满足字段规则;判断通过。

所以s1中f1和i2通过了规则判断,f2和i1没有通过。所以图中s1.f1和s1.i2保留了原来的值。

最后我们看private MyClassSerializable s2,这时相信我们都能轻易看出来,private不满足字段规则,s2被跳过。

四、跨过序列化的坑

上一节我们通过例子1了解了序列化的规则,我们发现我们好像已经掌握了序列化系统的秘密。但!是!别高兴太早,这个世界并不是我们想象的这么简单,现在是时候让我们来面对系统复杂的一面了。

1. 热重载(hot-reloading)

对脚本进行修改可以即时编译,不需要重启编辑器就看看到效果,这是Unity编辑器的一个令人称赞的机制。你有没有想过它是怎么实现的呢?答案就是热重载。

当编辑器检测到代码环境发生变化(脚本被修改、点击播放)时,会对所有现存的编辑器窗口进行热重载序列化。等待环境恢复(编译完成、转换到播放状态)时,编辑器根据之前序列化的值对编辑器窗口进行恢复。

热重载序列化与标准序列化的不同点是,在进行热重载序列化时,字段规则被忽略,只要被处理对象满足类型规则,那么就对其进行序列化。

我们可以通过运行之前讲解序列化规则时的例子1来对比热重载序列化与标准序列化的区别。

记得上一节我们是通过退出重启编辑器触发的标准序列化,现在我们通过点击播放触发热重载序列化,运行结果如下。


Unity序列化系统_第3张图片
image

可以看到,之前由于字段为private的s1.i1以及s2都进行了序列化。同时我们也注意到标记了[NonSerialized]的s1.f2和s2.f2、没有标记[Serializable]的m1依然被跳过了。

2. 引擎对象的序列化

我们把UnityEngine.Object及其派生类(比如MonoBehaviour和ScriptableObject)称为Unity引擎对象,它们属于引擎内部资源,在序列化时和其他普通类对象的处理机制上有着较大的区别。

引擎对象特有的序列化规则如下:

  • 引擎对象需要单独进行序列化。
  • 如果别的对象保存着引擎对象的引用,这个对象序列化时只会序列化引擎对象的引用,而不是引擎对象本身。
  • 引擎对象的类名必须和文件名完全一致。

对于插件开发,我们最可能接触到的引擎对象就是ScriptableObject,我们通过例子2来讲解ScriptableObject的序列化

我们新定义一个编辑器窗口ScriptableObjectWindow,和一个继承自ScriptableObject的类

public class MyScriptableObject : ScriptableObject {
    public int i1;
    public int i2;
}

public class ScriptableObjectWindow : EditorWindow {
    public MyScriptableObject m;
    void OnEnable() {
        if(m == null)
            m = CreateInstance();
    }
}

我们把m的字段设为public确保系统会对它进行序列化。我们来看运行结果:

Unity序列化系统_第4张图片
image

可以看到,m的InstanceId在热重载后发生了变化,这意味着原来m所引用的对象丢失了,ScriptableObjectWindow只能重新生成一个新的MyScripatable对象给m赋值。

回看第二条规则,我们知道ScriptableObjectWindow序列化时只会保存m对象的引用。在编辑器状态变化后,m所引用的引擎对象被gc释放掉了(序列化后ScriptableObjectWindow被销毁,引擎对象没有别的引用了)。所以编辑器在重建ScriptableObjectWindow时,发现m是个无效引用,于是将m置空。

那么,如何避免m引用失效呢?很简单,将m保存到硬盘就行了。对于引擎对象的引用,Unity不光能找到已经加载的内存对象,还能在对象未加载时找到它对应的文件进行自动加载。在例子3,我们在创建MyScriptableObject对象的同时将其保存到硬盘,确保其永久有效

public class SavedScriptableObjectWindow : EditorWindow {
    public MyScriptableObject m;
    void OnEnable() {
        if(m == null) { // 注意只在新开窗口时 m 才会为 null
            string path = "Assets/Editor/Test3-SavedScriptableObject/SaveData.asset";
            // 先尝试从硬盘中读取asset
            m = AssetDatabase.LoadAssetAtPath(path);
            if(m == null) { // 当asset不存在时创建并保存
                m = CreateInstance();
                AssetDatabase.CreateAsset(m, path);
                AssetDatabase.SaveAssets();
                AssetDatabase.Refresh();
            }
        }
    }
}

运行,我们可以看到m引用的对象再也不会丢失了。

Unity序列化系统_第5张图片
image

3. 普通类对象的序列化

由于每个ScriptableObject对象都需要单独保存,如果插件使用了多个ScriptableObject对象,保存这些对象意味着多个文件,而大量的零碎文件意味着读取速度会变慢。

如果你在考虑这个问题,不妨将目光转向普通类。和引擎对象不一样,普通类对象是按值存储的,所以我们可以将所有的普通类对象混在一起保存成单一文件。

然而按值序列化也有自己的问题,我们下面一一进行说明。

  • 不支持空引用
    在例子4里,我们定义了两个普通类:MyObject和MyNestedObject:
[Serializable]
public class MyNestedObject {
    public int data;
}

[Serializable]
public class MyObject {
    public MyNestedObject obj2;
}

public class NullReferenceWindow : EditorWindow {
    public MyObject obj;

    void OnEnable() {
        if(obj == null) {
            obj = new MyObject();
        }
    }
}

可以看到,我们让MyObject保存一个MyNestedObject的引用,但不去初始化它,初次运行的时候我们知道它是一个空引用。我们来看看经过序列化后会有什么变化:


Unity序列化系统_第6张图片
image

哈,系统帮我们生成了一个MyNestedObject对象!

通过测试我们知道,当系统对普通类对象进行序列化时,会自动给空引用生成对象。在我们的测试例子里,这个功能好像没有带来负面影响。但是在特定情况下会导致序列化失败,比如说带有同类的引用。

来看下面的链表类

[Serializable]
public class MyListNode {
    public int data;
    public MyListNode next;
}

这在我们的代码中很常见,也能正常运行,因为next最终会为空,意味着我们的链表是有尽头的。但是到了序列化系统里,回想一下,对啊序列化系统不允许有空引用,系统会帮我们无限地把这个链表链下去!当然,实际上系统检测到这种情况会主动终止序列化,但这意味着我们的类无法正常地进行序列化了。

  • 不支持多态

普通类序列化的另一个问题是不支持多态对象。在编码中我们使用一个基类引用指向一个派生类对象,这是很正常的设计。然而这种设计在序列化中却无法正常运作。

来看例子5,首先我们定义了一系列的类代表不同的动物

[Serializable]
public class Animal {
    public virtual string Species { get { return "Animal"; } }
}

[Serializable]
public class Cat : Animal {
    public override string Species { get { return "Cat"; } }
}

[Serializable]
public class Dog : Animal {
    public override string Species { get { return "Dog"; } }
}

[Serializable]
public class Giraffe : Animal {
    public override string Species { get { return "Giraffe"; } }
}

[Serializable]
public class Zoo {
    public List animals = new List();
}

在Zoo类中,我们使用List来记录动物园中的所有动物。我们来看看序列化系统会怎么对待我们的动物


Unity序列化系统_第7张图片
image

可以看到,序列化之后我们的猫狗都被放跑了,这可不是我们想要的结果。

五、自定义序列化

如之前所说,序列化功能有着各种各样的限制,而我们的项目需求千变万化,实际用到的数据结构只会比本文的例子复杂百倍。如何让这些更复杂的数据结构和序列化系统友好地合作呢?

答案是自定义序列化。Unity为我们提供了ISerializationCallbackReceiver接口,允许我们在序列化前后对数据进行操作。它并不能让系统直接处理你的复杂数据结构,但它给了你机会让你把数据"加工"成为系统能支持的形式。
1. 多态对象序列化
还记得我们例5的动物园吗,由于系统不支持多态对象造成了数据丢失,现在我们尝试通过自定义序列化来修正这个问题。 在例子6中,我们重新定义了Zoo类让它支持自定义序列化。

[Serializable]
public class Zoo : ISerializationCallbackReceiver
{
    [NonSerialized]
    public List animals = new List();

    [SerializeField]
    private List catList;
    [SerializeField]
    private List dogList;
    [SerializeField]
    private List giraffeList;
    [SerializeField]
    private List indexList;

    public void OnBeforeSerialize() {
        catList = new List();
        dogList = new List();
        giraffeList = new List();
        indexList = new List();

        for(int i = 0; i < animals.Count; i++) {
            var type = animals[i].GetType();
            if(type == typeof(Cat)) {
                indexList.Add(0);
                indexList.Add(catList.Count);
                catList.Add((Cat)animals[i]);
            }
            if(type == typeof(Dog)) {
                indexList.Add(1);
                indexList.Add(dogList.Count);
                dogList.Add((Dog)animals[i]);
            }
            if(type == typeof(Giraffe)) {
                indexList.Add(2);
                indexList.Add(giraffeList.Count);
                giraffeList.Add((Giraffe)animals[i]);
            }
        }
    }

    public void OnAfterDeserialize() {
        animals.Clear();
        for(int i = 0; i < indexList.Count; i += 2) {
            switch(indexList[i]) {
            case 0:
                animals.Add(catList[indexList[i + 1]]);
                break;
            case 1:
                animals.Add(dogList[indexList[i + 1]]);
                break;
            case 2:
                animals.Add(giraffeList[indexList[i + 1]]);
                break;
            }
        }

        indexList = null;
        catList = null;
        dogList = null;
        giraffeList = null;
    }
}

我们为Zoo添加了ISerializationCallbackReceiver接口,在序列化之前,系统会调用OnBeforeSerialize,我们在这里把List一分为三:List、List,以及List。新生成的三个链表用于序列化,避免多态的问题。在反序列化之后,系统调用OnAfterDeserialize,我们又把三个链表合为一个供用户使用。我们来看这样的处理能否解决问题.


Unity序列化系统_第8张图片
image

2. Dictionary容器序列化
在实践中,Dictionary容器也是经常使用的容器类。系统不支持Dictionary容器的序列化给我们造成了不便,我们也可以通过自定义序列化来解决,我们通过下文的例7来说明

[Serializable]
public class Info {
    public float number1;
    public int number2;
}

[Serializable]
public class InfoBook : ISerializationCallbackReceiver
{
    [NonSerialized]
    public Dictionary dict = new Dictionary();

    [SerializeField]
    private List keyList;
    [SerializeField]
    private List valueList;

    public void OnBeforeSerialize() {
        keyList = new List();
        valueList = new List();
        var e = dict.GetEnumerator();
        while(e.MoveNext()) {
            keyList.Add(e.Current.Key);
            valueList.Add(e.Current.Value);
        }
    }

    public void OnAfterDeserialize() {
        dict.Clear();

        for(int i = 0; i < keyList.Count; i++) {
            dict[keyList[i]] = valueList[i];
        }

        keyList = null;
        valueList = null;
    }
}

和之前的处理相似,我们在序列化之前,将Dictionary中的Key和Value分别保存到两个List中,然后在反序列化之后重新生成Dictionary数据,运行结果如下:

Unity序列化系统_第9张图片
image
六、参考

[1] Unity Manual - Script Serialization

[2] Unity Manual - Custom Serialization

[3] Serialization in-depth with Tim Cooper

你可能感兴趣的:(Unity序列化系统)