2021美赛建模 『D题音乐思路』

针对第一题∶

第一题需要创建音乐影响力的(多个)定向网络,确定’music influence’指标,可以利用有向图的零-非零模式矩阵(有联系就是1,画散点图)。

针对第二题∶

需要使用FULL_MUSIC_DATA和/或音乐特征的两个汇总数据集,来开发音乐相似性度量模型,对于类间相似度,也可以参考"定向性信息分析",类似对文本进行的K.Means聚类模型,也可以具体看看划分式聚类算法、层次聚类算法、基于密度的聚类算法、基与网格的聚类算法。

针对第三题∶

首先需要给出流派的区别是什么,而后比较流派之间和流派内部的相似之处和影响,分析流派是如何随着时间的推移而变化的,以及流派间的关联,可以通过类内和类问距离的主成分分析算法,改善高维数据的降维结果,提高数据低维表示的判别能力。

针对第四题∶

根据数据集分析影响的方面具体是什么,是影响艺术家的艺术作品特征还是影响艺术家的角色扮演。可以参考指标选择对聚类分析的结果影响分析

针对第五题∶

即分析网络里节点的重要性研究。

针对第六题∶

基于确定的流派,分析流派随着时间发生的音乐演变的影响过程,揭示动态影响者的指标,主要是基于第五题的跟进分析。

针对第七题∶

跨学科分析问题,基于前面几题的数据结合实际情况具体文字分析,也可以建立数学模型。

考虑的细节因素∶

音乐特点∶

  • 舞蹈性(节奏、节奏稳定性、拍子力度、整体规律性,0不适合跳舞,1适合跳舞)
  • 音乐的能量(强度和活动的量度,0.0是强度最小的值,1.0是强度最大的值)
  • 效价(描述音轨所传达的乐感的一种量度,0.0是最负的值,1.0是最正的值,高效价音轨听起来更积极)
  • 节奏(在每分钟节拍的轨道的总体估计速度,直接来源于平均拍子持续时间)
  • 响度(音轨的整体响度,单位为分贝)
  • 调式(大调用1表示,小调用0表示)
  • 关键(估计的整体关键的轨道,如0=C、1=C,如果未检测到键值,则键值为- 1)。

类型的声音

  • 音色(1.0代表音轨的高度置信度)
  • 工具性∶ 预测音轨中是否没有人声。“Ooh"和"aah"的声音在这个语境中被视为有用的。说唱或口语的音轨是明显的"声音”。工具性值越接近1.0,这首歌就越有可能不包含声乐内容。高于0.5的值表示工具性轨迹,但当值接近1.0时,置信度更高
  • 活跃度∶ 检测轨道中是否有观众。较高的活度值表示实时执行跟踪的可能性增加。如果该值高于0.8,则表明该轨道很有可能是实时的。
  • 语音∶检测语音轨迹中是否存在语音。越是专门的演讲一-比如录音(例如脱口秀、有声读物、诗歌),属性值越接近1.0。高于0.66的值表示可能完全由口语单词组成的音轨。0.33到0.66之间的值描述了既包含音乐又包含语言的音轨,可以是分段的,也可以是分层的,包括说唱音乐这样的情况。低于0.33的值很可能代表音乐和其他非语言类音轨。
  • explicit∶检测明确的歌词在一个轨道(true(1)=是的;false(0)=不存在或未知)。(布尔)

描述∶

  • 一duration_ms∶磁道持续时间,单位为毫秒。(整数)
  • 人气∶该赛道的受欢迎程度。该值将在0到100之间,其中100是最常用的。流行度是通过算法来计算的,在很大程度上是基于这首歌的总播放次数以及这些播放的最近时间。一般来说,现在播放频率更高的歌曲会比过去播放频率更高的歌曲更受欢迎
  • 重复的音轨(例如,来自一个单曲和专辑的相同的音轨)是独立评级的。艺术家和专辑的流行度是由歌曲的流行度计算出来的。(整数)
  • year∶单曲发行的年份。(1921- 2020的整数)
  • release_date∶音轨发布的日历日期,大多是yyy-mm-dd格式,但日期的精度可能会有所不同,有些只给出y。
  • -song_title(审查)∶音轨的名称。(字符串)软件运行删除任何潜在的显式文字在歌曲的标题。
  • -count∶在full_music_data.csv文件中表示某个艺术家的歌曲数量。(整数)

你可能感兴趣的:(数学建模,美赛)