人工智能与音乐创作
摘要
音乐是人类天然的爱好与艺术追求之一。自古以来哲学家们对人类是怎样欣赏艺术,怎样创作有着浓厚的兴趣。而很早的时候,人类便对音乐有了诸多的理论。在音乐史上,作曲家们也没有停止过对作曲技巧的总结和归纳。随着现代化的发展,人工智能概念的提出,人们渐渐产生了可不可以让计算机利用算法进行音乐创作的想法,于是算法作曲的概念应运而生。
应用价值
计算机目前的作曲水平还是初级,乐曲中的和弦部分由人工干预实现。尽管尚处于起步阶段,尽管尚处于起步阶段,但这项技术的应用前景相当广泛,在广告、社交、娱乐、AR、VR等多个场景均有施展空间。设想一下,以后新婚夫妇只要上传结婚照,就可以让人工智能定制专属音乐。此外,这项技术还应用于游戏领域。因此利用人工智能进行音乐创作的研究是有必要的。
难点
1.知识规则表达问题
任何一个算法作曲系统都不存在一个完美的表示旋律发展的技法。
2.音乐的创新问题
由计算机自动生成的音乐作品,对于作曲家或者使用者来说是否具有实用性?这涉及到一个重要的问题,那就是我们使用算法作曲这样的方式进行音乐创作是为了模仿作曲家自身的音乐创作过程,还是为了模仿某类风格作品的题。
3.如何评估计算机生成的音乐作品的问题
由算法作曲生成出来的音乐片段是否能真正符合传统的音乐理论呢?显然,作曲系统中的质量评估机制是一个很重要的部分。它往往会引导音乐创作的方向,甚至最终决定音乐作品的成败。
4.如何对算法作曲的作品赋予人类的情感
收获
1.通过对算法作曲的相关材料的阅读,对如何进行算法的设计有了一定的认识,锻炼了自己查找资料的能力,对以后的学习很有帮助。
2.对知识规则系统,马尔可夫链,深度学习等算法有了一定了解。
3.在遇到问题的时候应该多想想为什么,多从身边的小事找出其中蕴含的知识,不应该抱怨其存在的问题,应该从这些问题中找到解决问题或优化及改进的方法。
4.遇到一个大的难的问题时,不能被吓倒,而是应该静下心来,把大的问题细化和找出最本质的问题(即最小可操作的点),然后各个击破,最后会发现慢慢的问题已变明朗。
综述
通过查阅资料,目前研究算法作曲的方法有很多:
1.知识规则系统
我们在一个作曲系统中建立一系列创作旋律的知识规则的集合,由计算机生成的每一条旋律都需要通过1个给定的知识规则的集合而产生的。基于知识规则的系统在复杂的音乐创作过程,其优点就是知识编码很清楚、能够从复杂的关系中得出结论。但是如果试图模仿基于作曲家创作音乐时所使用的所有作曲规则与技法,将其提炼出来,输入计算机中,这个趋势是很困难的。
2.马尔可夫链
马尔可夫链一直被广泛地应用于算法作曲领域中,是按照个转换表来依次选择音符。这个转换表就像一个函数,其自变量是当前的音符,而函数值则是下一个要出现音符的可能性。转换表可以按照·定的标准人为构造,其中嵌套个特定的音乐风格。针对某一特定(如某一作曲家或某一时期的)风格的音乐作品进千犷收集和统计,就可以构造出相应的转换表。而这个转换表定义了这些特定音乐风格的作品中音符导向的可能性。转换表其实所表现的是旋律的风格的量化。马尔可夫链主要用于产生一条具有一定风格的旋律。这种方法可以模拟作曲家创作音乐时的思维,来控制计算机生成相应的音乐作品。我们可以进一步通过已有的旋律作为参数的输入,或者自定义其每个音符所出现的可能性来产生出一种全新风格的音乐作为输出。
3.深度学习
从一个输入中产生一个输出所涉及的计算可以通过一个流向图(flow graph)来表示:流向图是一种能够表示计算的图,在这种图中每一个节点表示一个基本的计算并且一个计算的值(计算的结果被应用到这个节点的孩子节点的值)。考虑这样一个计算集合,它可以被允许在每一个节点和可能的图结构中,并定义了一个函数族。输入节点没有父亲,输出节点没有孩子。
最下面蓝色的部分是你输入的音乐。从上图可以看出,input是一个个的点,然后通过input来相互结合生成灰色的点,经过几层的连接之后,最后的Output就是新生成的音乐,也就是黄色的点。把黄色的点拉下来,就生成里新的音符。是根据之前的所有音乐来生成音符。
4.SOFM
自组织特征映射网络(SOFM)是自组织网络中的一种,所谓的自组织过程是指学习的结果总是使聚类区内各神经元的权重向量保持向输入向量逼近的趋势,从而使具有相近特性的输入向量聚集在一起。这种结构的网络能够从输入信息中找出规律以及关系,并且根据这些规律来相应地调整网络,使得以后的输出与之相适应。
分析
通过对这些资料的阅读,对这些方法有了一定的了解,那我自己会怎样用人工智能谱曲呢?
对于谱曲算法,我的想法是这样:
1.利用启发式信息,搜索长度为10的一段旋律的部分可能解。
说明:
(1)启发式信息:启发式信息可以是这个音和上一个或几个音、这个和弦和上一个或几个和弦的搭配程度,这个可以通过分析大量现有作品,从而获得一个概率表。例如,如果在很多乐曲中,两个和弦一起出现的概率很小,说明这两个和弦的组合是不和谐的,就不需要继续往下搜索了。
(2)长度为10:搜索长度不可以太长,否则计算量会很大。这也是这种方法的一大缺点。
(3)部分可能解。为了简化计算,可以只在中音区搜索,即便如此,全部解仍有21的10次幂之多,不过考虑到启发式信息,我们只需要搜索一小部分解就可以了。
2. 随机输入+SOFM聚类。
上面的搜索法的缺点之一是没有创造性,缺少变化,我认为很重要的一点是在最优性和可行性之间选择了可行性。那么,有没有一种方法可以提高解的最优性呢?
为了提高乐曲的长度,聚类是一种不错的方法。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性。
说明:
(1)无规则的音符可以随机产生。
(2)“相似”的定义可以是频率的接近,也可以是通过对大量乐曲的分析得到的一张相似性表。
(3)和上面提到的搜索不一样,这种方法由于输入具有随机性,所以输出也富有变化,避免了单调,而且单次计算复杂性很低,可以模拟出人类的情感。不足的是,这种方法聚类的结果不一定和人类的口味,所以同样需要大量计算,从中选择我们喜欢的解。
3. 遗传算法。
遗传算法是学习大自然中生物的进化,过程是这样的:将音符的排列组合编码成一组基因群体,从群体中选择父代,父代通过随机扰动产生随机变化,通过适应性函数选择优秀的个体,加入群体并下一次进化,直到找到可行解为止。
说明:
(1)编码:把音符的顺序映射为生物的基因。
(2)随机扰动:每一代进化以后,随机产生扰动,随机对音符进行交叉(重组)、变异(改变某一位的音符),实现解的多样化,从而尽量实现整体最优。
(3)选择:进化以后通过适应度函数选择,找出最适应环境的个体,进行下一次进化。
(4)适应性函数:评价解的优劣性,在这里就是曲子的“悦耳度”,体现在数学上可以使不同音符、和弦相连的概率,也可以是和名作片段的相似性等。
结论
通过对这些论文的阅读,算法作曲已经不是难事,索尼,谷歌等一些公司已经创作出一些音乐了,听过之后我觉得对已有音乐的模仿是容易达到的,但无论人们开始时是怎么想的,音乐表现远比句法规则所能捕捉到的东西要多得多。在很长的一段时间之内,计算机作曲程序谱出的乐曲不会产生新的美感。不仅仅是音乐,所有艺术作品,对于我们来说,都是一种表达。它所展现的内容和情感远远不止是那些规则和技法所能捕捉到的。它必须来源于一种体会,而这暂时来讲还是机器所无法达到的。但我相信,通过神经网络模型,机器学习和人工智能算法的不断发展,创作出的音乐将会越来越好。
参考文献
韩钢.基于神经网络的算法作曲系统[TP].南京大学,2014
刘涛.音乐情感认知模型与交互技术研究[TP].浙江大学,2006
刘艳梅.遗传算法在旋律创作中的应用研究.河南师范大学[D],2014
知乎作者:汉堡包