Datawhale Al夏令营第三期 Al+物质科学task2学习笔记

AI4Science是一个较为普遍的术语,通常指的是人工智能在科学研究和技术发展中的应用。它涵盖了各种科学领域,包括物理学、化学、生物学、地球科学等。虽然没有一个特定的确切历史,但可以描述人工智能在科学研究中的一些早期里程碑和发展趋势。

早期发展

  1. 知识表示与推理

    • 20世纪70年代末和80年代初,早期的AI研究开始探索如何用机器推理来模拟人类的思维过程。这种推理方式被应用于物理学、化学等学科中,尝试解决复杂的问题和推理任务。
  2. 专家系统

    • 80年代中期,专家系统成为AI在科学研究中的一个重要应用方向。专家系统利用知识工程和推理引擎,帮助科学家解决特定领域的问题,例如化学合成规则的推断、物理系统的模拟等。
  3. 模式识别与数据挖掘

    • 90年代以来,随着数据量的增加和计算能力的提升,AI在科学领域的应用逐渐转向模式识别、数据挖掘和机器学习。这些技术被用于分析和理解大规模数据集,揭示隐藏的模式和趋势,例如在天文学中搜索星系、在生物学中分析基因组数据等。
  4. 计算科学和仿真模拟

    • 21世纪初,高性能计算的发展促进了计算科学和仿真模拟的发展。AI技术被用来优化复杂的数值模拟和仿真程序,加速科学研究和工程设计的进程。

当前趋势

  1. 深度学习在科学中的应用

    • 近年来,深度学习的兴起极大地推动了AI在科学研究中的应用。神经网络的强大表征学习能力被应用于各种科学问题的解决,包括图像分析、语言处理、分子设计等。
  2. 数据驱动的发现

    • AI技术帮助科学家从大数据中提取知识,推动了数据驱动的科学发现。这种方法不仅限于理论探索,还包括实验设计和数据解释。
  3. 自动化实验和材料发现

    • AI被应用于自动化实验设计和材料发现领域,通过智能搜索算法和机器学习来加速新材料的发现和开发。
  4. 科学领域的跨学科融合

    • AI的跨学科应用促进了不同科学领域之间的交叉合作和融合,例如物理学与计算生物学的交叉、地球科学与数据科学的结合等。

总的来说,AI4Science的发展可以看作是人工智能和科学研究相互作用的结果,推动了科学方法的进步和新知识的发现。随着技术的进步和理论的发展,AI在科学领域的应用前景仍然广阔,可能会带来更多重大的创新和发现。


SMILES —— 最流行的将分子表示为序列类型数据的方法

SMILES概念:是一种将化学分子用ASCII字符表示的方法。


分子指纹 (分子向量化):分子的指纹就像人的指纹一样,用于表示特定的分子。分子指纹是一个具有固定长度的位向量(即由0,1组成),其中,每个为1的值表示这个分子具有某些特定的化学结构。


RDkit :强大、丰富且高效的化学信息工具,是开源的。网址:http://www.rdkit.org,支持WIN\MAC\Linux,可以被python、Java、C调用。几乎所有的与化学信息学相关的内容都可以在上面找到。常用的功能包括但不限于:

  1. 读和写分子;

  2. 循环获取分子中原子、键、环的信息;

  3. 修饰分子;

  4. 获取分子指纹;

  5. 计算分子相似性;

  6. 将分子绘制为图片;

  7. 子结构匹配和搜索;

  8. 生成和优化3D结构。

机器学习

机器学习按照目标可以分为:

  1. 分类任务(classification):就是模型预测的结果是离散的值,例如类别;
  2. 回归(regression)任务:模型预测的结果就是连续的值,例如房价等等。
  • 在本次竞赛中,我们需要预测的目标是反应的产率,是0-1之间的一个连续的数值,所以是一个回归任务。(注:离散值通过一些处理可以近似认为是连续值,所以不要被连续值和离散值限制了自己的思维)。
  • 传统的机器学习需要需要经历特征工程这一步骤,即将原始数据转化为向量形式。然后通过SVM、Random Forest等算法学习数据的规律。这些方法在处理简单的任务时是比较有效的。

深度学习:归为机器学习的一个子集,主要通过神经网络学习数据的特征和分布。深度学习的一个重要进化是不再需要繁琐的特征工程,让神经网络自己从里面学习特征。

你可能感兴趣的:(学习,笔记)