ChatGPT在环境科学领域的应用前沿
在党的二十届三中全会上,明确要求健全因地制宜的发展新质生产力体制机制。新质生产力通过创新驱动,以高科技、高效能、高质量为特征,旨在摆脱传统经济增长方式和生产力发展路径,符合新发展理念。环境科学的新质生产力主要体现在基础数据、数据管理和数据分析三方面。通过增加数据覆盖率、提升数据管理自动化水平和利用人工智能(AI)进行数据分析,实现环境质量的实时监控和管理,为环境保护和治理提供了强有力的技术支持。利用ChatGPT等大型语言模型(LLM)可以进一步提升这些方面的效率,例如,通过自然语言处理技术对大量环境数据进行实时分析和解读,利用机器学习提供污染源的精准溯源及预测分析,从而实现更加智能化的环境监测和管理。
当今,LLM正朝着通用人工智能(AGI)的方向迈进,除了可为科研场景实现更高效、更专业的辅助功能,精确处理复杂任务和跨专业领域处理多类型任务的能力也将极大提高。课程依据当前全球大语言模型的预印本和发表论文,并整理了各学科LLM的使用场景案例,从科学智能(AI for Science)角度分析LLM的优势及当前技术局限性,启发性地为学员提供与自身研究相关的应用思路。课程基于最新进展和各主流网络平台交流经验,整理了提示词工程在解决复杂问题时的多种模式,以掌握如何使用最前沿的提示词工程(Prompt Engineering)技巧,从而准确完成复杂任务。引导学员在未来将AGI应用于科研工作和生活场景中,发掘AGI助力自身发展的可能性。
学习目标
一、深入理解当前最新型大型语言模型的工作原理和技术架构。
二、熟练ChatGPT的使用技巧,并用于论文写作、数据分析、项目开发等场景中。
三、掌握利用ChatGPT润色出发表水平的学术语料技巧,并撰写高水平的综述。
四、根据使用者不同的统计学和数据分析基础,量身定制大语言模型数据分析模式。
五、零代码基础完成Python项目开发,并在学员的科研场景中实践。
六、熟悉大语言模型在新污染物数智管控、环境风险评估、环境监测领域的实际应用。
七、熟悉大语言模型在环境领域的智能体构建,本地化部署,团队私有化环境问答系统构建。
具体内容:
第一部分、通用型人工智能概述
本部分,了解科学智能(AI for Science)的基本概念及其在基础学科中的成功案例,探讨AI的发展浪潮及在通用型人工智能时代AI技术对科研的变革。
1.1 课程概述
1.2 AI 在基础学科中的成功案例
1.3 人工智能的发展浪潮
1.4 通用型人工智能对科研的变革
1.5 如何使用大型语言模型
1.6 实战操作:GPT-4/4o 和 Claude-3的使用
第二部分、ChatGPT插件使用和开发
本部分将介绍如何使用GPT插件进行数据分析、文献查询、流程图绘制等。学员将学习如何利用GPT插件进行全网引文撰写综述和自建引文综述,基于第三方GPT平台完成一篇文献综述;此外,介绍官网的MyGPT配置详情,并通过实战建立个性化功能的个人专属GPT。
2.1 使用GPT插件数据分析
2.2 文献查询和综述的GPT插件
2.3 GPT插件绘制流程图
2.4 实战操作:尝试和使用GPT商店插件
2.5 大语言模式的文献检索
2.6 全网引文撰写综述
2.7 自建引文综述
2.8 实战操作:完成一篇文献综述的撰写
2.9 简易实现私人GPT
2.10 创建和管理专业知识库
2.11 基于知识库的精准问答
2.12 实战操作:建立个性化的私人GPT
第三部分、提示词工程
本部分整合了当前所有大语言模型相关研究的著名文章,介绍提示词的高阶使用技巧,使GPT进一步提升解决复杂问题的能力。参考当前全球提示词设计大赛的金奖提示词模版,学员可设计自己专属的提示词。
3.1 提示词的基本要素与组成
3.2 OpenAI官方提示词工程内容解读
3.3 思维链的概念和应用
3.4 自动思维链的实现
3.5 元思维链:更深层次的思考
3.6 自洽思维链的构建
3.7 实战操作:用思维链创建复杂问答
3.8 思维树的构建和应用
3.9 思维图谱的设计与使用
3.10 实战操作:利用GPT解决复杂问题的综合策略
3.11 金牌提示词框架
3.12 实战操作:建立专属提示词模版
第四部分、生成式人工智能学术写作
本部分学习如何开启AGI的学术写作专家模式,以提高在写作中的专业性和具体性。内容包括中英文互译和学术论文润色,包括语言与风格优化、扩写、缩写、降重与纠错。课程结合多场景随堂练习,如撰写高水平学术文章、基金与项目书、学位论文及教案与讲义。
4.1 开启GPT的学术写作专家模式
4.2 中英文互译:日常文书与科研写作
4.3 学术论文润色:语言与风格优化
4.4 学术论文润色:扩写、缩写、降重与纠错
4.5 学术论文润色:个性化提示词应用
4.6 实战操作:撰写高水平学术文章
4.7 实战操作:基金与项目书撰写
4.8 实战操作:学位论文撰写
4.9 实战操作:教案与讲义撰写
第五部分、思维链数据分析
本部分根据在统计学和数据分析的基础,分别介绍了自然语言对话方式的数据处理模式和本地运行代码方式的数据分析。
5.1 在线Python终端数据分析
5.2 探索性数据分析策略详解
5.3 利用思维链进行个性化数据分析
5.4 零基础引导型数据分析
5.5 专家级指挥型数据分析
5.6 实战操作:基于Code Interpreter的数据分析与可视化
5.7 实战操作:本地Python和R语言的数据分析与可视化
5.8 实战操作:少样本学习思维链的分析模式
5.9 实战操作:多模态数据分析与可视化技术
第六部分、大型语言模型辅助项目开发
本部分将学习模型训练数据的预处理方法、大语言模型的代码开发逻辑、迁移学习与模型选择技巧等。课程还包括实战操作,如零代码基础完成Python项目开发。
6.1 模型训练数据的预处理方法
6.2 模型代码开发逻辑
6.3 模型选择技巧
6.4 提示词技巧在代码撰写中的应用
6.5 生成式人工智能模式的脚本工程开发
6.6 实战操作:零代码基础完成Python项目开发
第七部分、环境科学与科学智能
本部分将了解环境科学几类代表方向中对科学智能的应用现状,以最新顶级期刊发表文章为例,从技术原理角度解释AI在其中的重要作用,并基于此拓展到AGI的应用展望。
7.1 环境智能化监测
7.2 新污染物数智管控
7.3 环境污染防治和生态修复
7.4 环境过程数字模拟
7.5 区域生态风险
7.6 环境管理最优化决策
第八部分、环境数据的智能化分析
本部分将学会AGI数据分析模式,掌握各自研究领域中的数据现状,学习在如何独立完成数据分析策略构建,交互模式,并结合在线和本地Python的运行环境,获得符合研究目标的数据结果,凝练出结论。
8.1 环境数据特征
8.2 环境数据预处理策略
8.3 智能化分析概念和流程
8.4 AGI辅助的要素和人工监督
8.5 实战操作:环境污染物高通量细胞测试数据的分析和可视化
8.6 实战操作:污染物致毒通路转录组分析和表型注释
8.7 实战操作:高分辨质谱非目标分析数据挖掘
第九部分、多模态-环境问题的模型设计和优化
本部分将了解LLM的多模态学习模式,围绕环境数据中的数值、文本、图像等不同类型变量,设计模型堆栈,并形成集成解决方案。
9.1 多模态数据的概念和应用场景
9.2 机器学习模型训练概述
9.3 知识融合的模型堆叠
9.4 自然语言处理概述
9.5 知识表示和文本挖掘
9.6 计算机视觉概述
9.7 图网络分析方法
9.8 实战操作:基于知识图谱技术的环境模型设计
第十部分、环境科学问题的提出到解决
本部分聚焦于最优化策略的研究模式,通过精心设计提示词后,建立大模型智能体,设计研究方案,实现自动化多模态研究模式。
10.1 环境研究中的最优化问题
10.2 智能体大模型概述
10.3 智能体的部署和实现形式
10.4 多模态最优化模型
10.5 实战操作:环境问答系统设计和部署
详情:EST顶刊发表!普林斯顿大学任智勇教授揭示环境科学领域未来研究方式