《笔记——机器学习与物理模型》by鄂维南院士讲座

力学所的郭永怀力学进展讲座笔记
仅作个人笔记分享用途。如有侵权,请联系我删除。
Ref:
Machine Learning and Physics-based Modeling-Weinan E
《郭永怀力学进展》讲座-主讲人:鄂维南院士

  • ppt我进行了一个简单的翻译,下载地址

1 物理模型PDE

科学研究的两项基本主题:寻求基本原理与解决实际问题

  • 从基本原理解决实际问题的三种方法:
    1. 简化模型
    要表达物理世界的基本规律;
    不能违反基本的物理限制;
    大致普适准确;
    有物理意义

    (比如空气动力学里的欧拉方程;反例:广义的欧拉方程)
    - 如何简化模型?
    物理方法&数学方法
    2.数值方法
    根本地改变科研的方法,尤其在工程领域
    对于低维问题解决的比较好,但是对于高维问题以及多个自由度(湍流、N-S)解决得不好
    ↑原因:维数灾难CoD
    3.多尺度方法
    基本思想:借助微观模型解决宏观问题
  • 很多问题仍待解决
  • 新想法:机器学习解决维数灾难的表现不错,引入ML解决以上问题?
    借助ML来发展一些可解释、可靠的物理模型

2 机器学习介绍

  • 目标:尽量逼近目标函数。根据目标函数的函数值是离散/连续分为分类问题/回归问题
    数据集划分:训练&测试集
  • ML逼近与经典逼近的差别:
    经典逼近对于高维完全无效
  • Monto Carlo方法避免了维数灾难
  • 把机器学习根据有无维数灾难分为两类:误差表达式是否包含变量d

3

  • 目标:微观的物理模型→利用机器学习→一个简化的宏观模型
  • 本目标与常见的ML问题的区别性:
    通常的机器学习问题,数据集是给定的,比如Cifar;但是我们这里只有微观的物理模型,没有数据
  • 下个定义以便区分:
  1. sequential learning:先收集数据再进行学习
  2. concurrent learning:数据生成与学习一同进行,“on the fly”的。通过生成的数据improve学习
    这与多尺度模型里的划分概念是一致的

  • 鄂维南院士的工作:“ELT”
  1. exploration: 准备数据;先决定这个数据是否需要进行label
  2. labeling:准备数据
  3. training:
    目标——获得一个最优的、具有绝对代表性的数据集,同时数据量尽可能小(减少计算成本)
    《笔记——机器学习与物理模型》by鄂维南院士讲座_第1张图片- 下面将给出两个ML的concurrent的例子

4 分子动力学

  • 传统困境
    《笔记——机器学习与物理模型》by鄂维南院士讲座_第2张图片
  • 新的范式:
    思路就是用量子力学来产生数据,ML来建造模型
    在这里插入图片描述- 鄂院士的工作:Deep Potential
    《笔记——机器学习与物理模型》by鄂维南院士讲座_第3张图片整个神将网络是由N个尺度网络合成的,N就是分子的个数

你可能感兴趣的:(《笔记——机器学习与物理模型》by鄂维南院士讲座)