2021美赛D题

2021美赛D题 音乐的影响

废话:
自古以来,音乐就已成为人类社会的一部分,已成为文化遗产的重要组成部分。为了理解音乐在人类集体经验中所扮演的角色,我们被要求开发一种量化音乐发展的方法。在创作新音乐时,有许多因素会影响艺术家,包括其天赋的创造力,当前的社会或政治事件,使用新乐器或工具的机会或其他个人经历。我们的目标是了解和衡量先前制作的音乐对新音乐和音乐艺术家的影响。
一些艺术家可以列出十几个或更多他们认为对自己的音乐作品有影响的艺术家。还建议可以通过歌曲特征(例如结构,节奏或歌词)之间的相似程度来衡量影响力。音乐有时会发生革命性的变化,提供新的声音或节奏,例如何时出现新的流派,或者对现有流派(例如古典,流行/摇滚,爵士等)进行重新发明。这可能是由于一系列小变化,艺术家的合作努力,一系列有影响力的艺术家或社会内部的变化所致。
许多歌曲具有相似的声音,许多艺术家为音乐类型的重大转变做出了贡献。有时,这些变化是由于一位艺术家影响了另一位艺术家。有时,这是对外部事件(例如重大世界事件或技术进步)的响应而出现的变化。通过考虑歌曲的网络及其音乐特征,我们可以开始捕捉音乐艺术家之间的相互影响。而且,也许,我们还可以更好地了解音乐随着时间的流逝在整个社会中的发展。
重点:
集成集体音乐(ICM)协会确定了您的团队,以开发一种衡量音乐影响力的模型。这个问题要求您检查艺术家和流派的进化和革命趋势。为此,ICM为您的团队提供了一些数据集:
1)“influence_data”1代表艺术家自己报告的音乐影响者和追随者,以及行业专家的意见。这些数据包含过去90年中5,854位艺术家的影响者和关注者。
2)“full_music_data”2提供了16个变量项,包括音乐特征(如舞蹈性,速度,响度和调子),以及98,340首歌曲中的每一个的artist_name和artist_id。这些数据用于创建两个摘要数据集,包括:a.艺术家“data_by_artist”的平均值,b.表示跨年“data_by_year”

注意:这些文件中提供的数据是较大数据集的子集。这些文件包含您应为该问题使用的唯一数据。
为了执行这个具有挑战性的项目,ICM协会要求您的团队通过以下措施,通过音乐艺术家随时间的影响来探索音乐的发展:

  1. 使用Impact_data数据集或其中的一部分来创建音乐影响力的(多个)定向网络,将影响者连接到追随者。开发可捕获此网络中“音乐影响力”的参数。通过创建定向影响者网络的子网来探索音乐影响力的子集。描述此子网。您的“音乐影响力”措施在此子网络中体现了什么?
  2. 使用音乐特征的full_music_data和/或两个摘要数据集(包括艺术家和年份)来制定音乐相似度的度量。使用您的度量,流派的艺术家是否比流派的艺术家更相似?
  3. 比较流派之间和流派之间的相似性和影响。什么是流派的区别,流派如何随时间变化?有些类型与其他类型有关吗?
  4. 指示data_influence数据集中报告的相似性数据是否表明所标识的影响者实际上在影响相应的艺术家。“影响者”实际上会影响追随者创作的音乐吗?是某些音乐特征比其他音乐特征更具“感染力”,或者它们在影响特定艺术家的音乐方面起着相似的作用?
  5. 从这些数据中确定是否存在可能标志着音乐发展中的革命(重大飞跃)的特征?在您的网络中,哪些艺术家代表着革命者(重大变革的影响者)?
  6. 分析一种类型音乐随时间变化的影响过程。您的团队能否确定能揭示动态影响者的指标,并解释流派或艺术家随时间的变化?
  7. 您的作品如何表达有关音乐在时间或环境方面的文化影响的信息?或者,如何在网络中识别社会,政治或技术变化(例如互联网)的影响?

向ICM协会写一份一页纸的文件,说明使用您的方法通过网络理解音乐影响的价值。考虑到这两个问题数据集仅限于某些类型,然后又针对这两个数据集共有的艺术家,您的作品或解决方案将如何随着更多或更丰富的数据而发生变化?建议进一步研究音乐及其对文化的影响。来自音乐,历史,社会科学,技术和数学领域的跨学科,多元化的ICM协会期待您的最终报告。

一开始看题还以为给的是音频文件,这个就有意思了。后来仔细一看发现直接给csv了,那直接就成数据分析题了,换个背景罢了。前三问主要就是分析一个相似度,建立一个相似度的指标就可以解决问题了。相似度有很多东西可以来衡量,比如聚类之后做个样本距离等等,也可以自己整合一个综合一些的评价方法。数据分析最重要的首先就是特征工程,做好特征工程之后大问题就解决了,剩下就是语文建模与艺术建模了(重点,没错,美赛就是艺术建模,又没标准答案,比国赛简单多了)

相似度建模具体可能会用到:欧几里得距离,皮尔逊相关系数, Tanimoto系数等等,可以参考这篇文章:
https://blog.csdn.net/weixin_39050022/article/details/80732249

== 各问题具体参考思路更新:(仅供参考)==

1.此题仅需要influence数据集即可,如果有能力可以在这里建立一个知识图谱。实际此题的目的是为了确定艺术家的音乐影响力,而建立所需要的定向网络就是让influence中的影响者艺我给出的方法是首先添加数据列音乐领域始祖,也就是对所有数据进行溯源,如果追随者和影响者的领域相同,找出影响者是追随哪个影响者的,这个需要代码实现。添加数据列影响人数对于某一确定的影响者,找到被此影响者直接或间接影响的人数。做出领域人数表,计算出领域内的艺术家大师共有多少人。在相同领域,可以根据不同年份做可视化(折线图最好),观察并得出不同领域的巅峰年份(新生代人才最多的)。
这时,子网络参数就算建立好了。然后建立misic influence模型,可以建立综合评价模型(有很多,选择其一),这里选用灰色综合评价法,指标为此艺术家的影响人数,所在领域人数所在领域年份人数所在领域年份影响力排名(计算方法为:先筛选出艺术家所在领域此年份的所有人,然后根据影响人数进行排名),所在年份竞争力(这一年份的所有领域的艺术家总人数)。(对于模型的求解过程,在论文中以一个领域的一个年份进行展示即可)

2.这里选用FULL_MUSIC_DATA数据集和第一问用到的数据集进行分析。题目的要求是开发音乐相似性度量模型,并判断是否流派内的艺术家比流派间的艺术家更相似。由于指标很多,可以利用两种方法进行处理。1可以利用相关分析探究各指标与受欢迎程度之间的相关关系,将相关性低的几个指标剔除。2可以利用主成分分析对数据进行降维对于音乐相似性度量模型,需要用到FULL_MUSIC_DATA数据集,关于如何处理数据集在文未附1。音乐相似性主要指的是两个音乐之间的相似程度,再对数据集进行数据清洗之后,可以用代码计算出音乐间的相似程度,常用皮尔逊相关系数和余弦相似度,除此之外,可以对其进行可视化,画出相关关系热力图,可以直观反映音乐间的相似性。针对后一问,根据艺术家所属流派,对于艺术家进行聚类分析(DBSCAN或者kmeans)查看流派内的艺术家与流派见的艺术家的相关关系,聚类分析展示出的图(不同流派用不同颜色的点)可以直观反映流派间与流派内的关系。

3.对于流派是如何随着时间的推移而变化的,可以针对某。流派进行阐述,第一问介绍了时间推移此领域的新生代人数,除此之外也可以看这一领域此年份的发歌量,可以做折线图来看个流派的兴衰。然后根据一些重要的时间节点,比如拐点或者增长率很高或很低的节点,查看FULL_MUSIC_DATA数据集中对应的时间内,此领域或者乐坛发生了什么变化,是否有很著名的歌曲,或者由于别的领域火热,导致此领域人数,歌曲变少了。这里可以自行发挥,语文建模大家都很擅长针对有些流派与其他流派是否有关联,可以看同一艺术家是否在不同流派发表了歌曲,或者不同艺术家之间的影响关系Influence_Data数据集。

4.前半问需要大家发动自己的智慧,只要扯上关系证明真的会影响即可。对于后半问,可以针对性地做验证分析。某些音乐特征比其他特征更具“感染力”,可以参考前说的相关性分析,也就是在FULL_MUSIC_DATA数据集中利用相关分析探究各指标与受欢迎程度之间的相关关系,相关性更高,表示更有感染力。它们在影响某个特定艺术家的音乐方面都扮演着相似的角色,这个可以对一个有名的艺术家进行探讨,针对不同的指标,查看影响者与被影响者之间指标的相似程度,可以搞一个对比图、南丁格尔玫瑰图或者雷达图(后两个更好一点,在进阶思路中给出画的软件和方法),最后进行数据分析。

5.这个在前面的分析中说到了,就是观察折线图的拐点或者增长率很高或很低的节点,后针对这一节点,分析为什么会出现这样的情况,将这一时期的艺术家和作品都列出来,查看作品的各个指标有什么比较突出的特点(突出不突出,就和所有作品的平均值做对比,与平均值差距很大则代表很突出),这样的特点就是题目中描述的革命性(重大飞跃)的特征对于后半问就需要大家根据已有的结论自己寻找了,有了前面的基础(第一问的影响力不要忘了),这个很简单。对于这道题的结果可以以表格的形式呈现,可以看看突出显示表。

6.语文建模

7.语文建模

有空的话我会更新一下思路和部分代码,谢谢大家的关注!

你可能感兴趣的:(latex,2021美赛,2021美赛D题,2021美国大学生数学建模竞赛,美赛D题思路)