太阳黑子是太阳光球上的一种现象,表现为比周围区域更暗的临时斑点。它们是由于磁通量集中而导致表面温度降低的区域,磁通量的集中抑制了对流。太阳黑子出现在活跃区域内,通常成对出现,磁极相反。它们的数量随大约 11 年的太阳周期而变化。
单个太阳黑子或太阳黑子群可能会持续几天到几个月不等,但最终会衰减。太阳黑子在太阳表面移动时会膨胀和收缩,直径从 16 千米(10 英里)[1] 到 160,000 千米(100,000 英里)不等。一些较大的太阳黑子不用望远镜也能从地球上看到[2]。它们刚出现时的相对速度(或称正动)可能为每秒几百米。
太阳周期一般持续 11 年左右,从不到 10 年到刚刚超过 12 年不等。在一个周期中,太阳黑子活动的最高点被称为太阳黑子最大点,活动的最低点被称为太阳黑子最小点。在大多数其他太阳活动中也能观察到这一周期,它与太阳磁场的变化有关,太阳磁场的极性会随这一周期而改变。
太阳黑子数量也会长期变化。例如,在1900年至1958年被称为现代太阳活动最大期的时期,太阳黑子数量的趋势是上升的;而在随后的60年中,太阳黑子数量的趋势大多是下降的[3]。总体而言,太阳最后一次像现代极大期那样活跃是在8000多年前[4]。
由于太阳黑子与其他太阳活动的相关性,太阳黑子可用于帮助预测空间天气、电离层状态以及与短波无线电传播或卫星通信相关的状况。许多基于时间序列分析、光谱分析和神经网络的模型已被用于预测太阳黑子活动,但结果往往不佳。这可能与大多数预测模型都是数据层面的现象学有关。
数据层面。虽然我们一般都知道太阳活动周期的长度,但这个周期并不完全稳定,活动的最大强度随时间而变化,峰值出现的时间和峰值持续的时间都很难准确预测。
我们需要预报太阳黑子,通常我们需要按月平均得出结果。我们要求您和您的团队建立合理的数学模型,尽可能可靠地预报太阳黑子。许多天文台和空间科学研究机构都公开提供了相关的观测数据,包括历史上的太阳黑子数量、太阳黑子面积以及可能相关的其他指标的观测数据。例如(不限于):
链接:https://www.sidc.be/SILSO/ datafiles/
链接:http://solarcyclescience.com/activeregions.html
A题为数据分析类的题目,但并未给出数据集,而是给了查找数据集可用的网站。相对来说,数据收集难度较小。且数据集已经过异常值处理,可在论文分析中省略该步骤。就解题需求来说,参赛团队至少要收集到“黑子数量”“黑子面积”和“磁场”的每月平均值这三个数据集。
题目要求预测当前和下一个太阳周期的开始和结束时间。首先要解决的是:如何定义一个周期的开始与结束,识别条件是什么?可聚焦到题干中所给信息“This period is also observed in most other solar activity and is linked to a variation in the solar magnetic field that changes polarity with this period.”,由此可知,可通过磁场的极性变换来判断太阳周期是否发生了变化。在求解方面,题目已经表明,过去基于时间序列分析、光谱分析和神经网络模型的预测效果并不理想,故在求解过程中应避免利用简单的单一模型进行求解。一个求解思路是:先对磁场的历史数据进行平滑处理,体现出数据的趋势。然后分别使用神经网络和ARIMA等时间序列算法对磁场进行预测。在这之中,对神经网络输入历史数据的原始值,对ARIMA算法输入平滑值,以分别提取非线性及线性特征。最后,可以利用贝叶斯等基于历史预测精度的自适应混合模型对两个算法的预测值进行组合,以适应历史序列值得到更高的预测精度。
题目要求预测下一个太阳活动周期中太阳活动最大值的开始时间和持续时间。在求解时可基于黑子量对最大值进行识别。为了提高预测精度,可以同时将磁场历史观测值和黑子数量历史观测值一起作为输入传入神经网络中,再对黑子数量的历史观测值进行平滑,输入到时间序列模型中进行预测。神经网络和时间序列分别预测得到结果后,延续第一问采用自适应混合模型对两个算法的预测值进行组合。
题目要求预测当前和下一个太阳周期中太阳黑子的数量和面积,并解释模型的可靠性。在这问中,需要对黑子数量和面积进行更加精细化的预测。在题干中提到:“Sunspot numbers also change over long periods”。由此可知,序列在长周期中具有一定的趋势,在预测时可以先将这部分提取出来,再分别对趋势项和波动项进行预测。具体实现步骤如下:1)首先通过一次或者二次回归得到序列的增长或衰减趋势;2)用原始数据每一期的观测值减去对应的趋势值,得到去趋势后的波动项;3)基于神经网络对波动项进行预测;4)将趋势项和波动项的预测值进行叠加,得到最终的预测值。在解释可靠性时,可以对模型在测试集上的误差进行分析,或是对模型超参数的灵敏度进行分析。
除上述基本解题思路外,在数据提取阶段还可收集更多与太阳活动相关的数据。在预测时输入到神经网络中以增加信息的提取量。此外,还可以使用启发式算法对超参数进行调参,以提高模型的预测精度。