大模型时代的科研人员的思考

根据李沐团队的分享,我觉得在大模型时代下,普通科研工作者可以做的点如下:

四个方向

1、efficient:做效率提升的(前人工作哪里慢提升哪里的速度,哪里heavy使其轻量级)
2、existing stuff(pretained model):直接基于别人的大预训练模型来作为工具,结合自己的设计完成任务new directions : 做新方向,避免撞车,竞争,刷榜
3、 plug and play: 做即插即用的模块(模型,loss,数据增广的方法等等),这样的东西可以在不同领域应用
4、dataset,evaluation,and survey: 构建数据集,做评测,综述等文章
大模型时代的科研人员的思考_第1张图片

相关大模型

计算机视觉: ViT(22B) , ViT-G(2B) from google
多模态:ViT-E(4B) from google
NLP:LLaMA(70B,130B,330B,651B) from Meta

大模型时代的科研人员的思考_第2张图片

科研人员去哪里找文献?

SCI 相关的 Web of Science,物理相关的 arXiv,生化相关的SciFinder,SciVal,医学相关的 Medline,工程相关的Engineering Village 等等(可能有遗漏)可能是平时打开最多的网站。
谷歌学术和知网也是好去处,还有一些依托于以上内容的搜索聚合站点,如 iData,科塔学术导航等等不再列举了。
大模型时代的科研人员的思考_第3张图片

你可能感兴趣的:(论文分享,语言模型,人工智能)