一个博士生接受怎样的训练是完整、全面的科研训练?

我粗算了一下对机器学习(偏理论和方法论 不偏工程)大概30个技能点吧(可能增加)

每个点我分成 高中初 三个级别 即总共90分 为了方便理解 默认本科毕业送基础分10分 凑到100分

  1. 解题力:对于一个formulated problem 能写出正确的证明/发明高效的方法
  2. 课程完成:完成了足够的课程以支撑自己的研究以及毕业
  3. 文献阅读:每天阅读arxiv 每周保持10篇粗读 包括听talk
  4. 编程:熟练掌握至少一门编程语言
  5. 英语表达:熟练完整地进行日常对话 写作 阅读
  6. Latex使用:是能美观的展示公式 图片(如使用pdf而非png) cleveref/bib管理参考文献;设计paper poster slides等
  7. 自我驱动:能主动做所有开始了的研究 主动读paper 主动与合作者update 主动推进项目 偶尔赶进度能放弃娱乐
  8. 研究力:对于一个not well formulated problem 能想出对应的解决办法
  9. 搜集力:能快速准确找到自己需要的知识点或代码 切忌浪费时间重复劳动前人做过 或者用正确但过时的工具事倍功半
  10. 创新力:能创造一个新的方法或者框架解决问题 包括followup别人成果并改进
  11. 交叉力:能发现跨领域或者不同工具或者不同流派的交集 从而完成交叉类研究
  12. 洞察力: 能快速理清文献的思路并准确判断该文献的价值 或者挑出毛病甚至加以改进
  13. 写作力:能在文法正确的基础上写出清晰 有趣 有立意高度的论文 将研究价值最大化呈现
  14. 影响力:有别于写作 专指海报 演讲 主动联系外校或企业获得合作和展示机会
  15. 研究格局:注重研究的深度 专注痛点问题而非无关紧要的交叉概念/涨点/调参/做小改进
  16. 多样性:注重研究的广度 不局限于一个细分领域/一种工具/一类发表渠道
  17. 独立性:能独立完成研究/教学/演讲/写作等
  18. 时间管理:包括对课业 研究 审稿 助教 阅读文献 演讲 实习 合作者之间时间管理 不会错过deadline
  19. 精力管理:保持体重稳定 睡眠充足 不产生心理和精神问题
  20. 情绪管理:在面对拒稿、卡壳、被抢发等外力因素时保持平常心 不被负面情绪(如嫉妒 不甘)降低效率
  21. 恋爱关系:不因工作顺逆而影响自己的感情线 独身主义者自动满级
  22. 向上管理:能主动和导师或其他教授沟通研究idea 并适当催促对方改稿子/批条子/推荐机会 以及表达自己的合理诉求(如放假和换课题)
  23. 向下管理:能主动和学弟学妹们一起研究 带领他们保持效率 合理安排工作和分配credit
  24. 平级管理:能主动和一批优秀的同龄人以平等地合作关系共同推进项目
  25. 行政管理:和秘书高效完成会议预定/财务报销/毕业要求咨询等行政任务 也包括学会写grant proposal和组织seminar
  26. 项目规划:熟悉并掌控过完整的科研流程 能提出idea 写出初步证明或跑出初步实验效果 邀请合作者 掌控研究进度 并在合理时间内中稿
  27. 攻击力:审稿时能有理有据的指出别人研究中地错误并判断错误的大小 修稿时能有底气反击审稿人无理的建议(如要求引用无关文献)
  28. 防御力:在演讲或修稿时不被莫名其妙的提问打乱阵脚 不被deadline pressure/peer pressure等影响
  29. 人脉网络:构建完善的人脉网络 覆盖研究 生活 找工作等多方面
  30. 学术服务:完成TA(助教)审稿等学术义务

以我自己为例 我入学博士的时候是英国本科 大致上7+10=17分

英语表达(高级)编程(初级)解题力(中级)课程完成(初级)

博一(21分):

上数学系博士课和机器学习的入门课 并多次参加kaggle 第一次使用tensorflow

课程完成(初级)–>课程完成(中级)
编程(初级)–>编程(中级)

但不会读paper 更不会写 找了几个做ML的老师结果都被拒了 试着了解了几个女生但没遇到合适的

获得 恋爱关系(初级)
获得 Latex使用(初级)

博二上(31分):

刚开学遇到了我现在的导师 开始了第一个线性模型项目(用的R语言) 前两个月没有任何进展 但终于读懂了第一篇文献 这个项目虽然难 但难点集中 也有对标的work 所以路径相对清晰 做了三个月后有了初步的成果

获得 文献阅读(初级)
获得 搜集力(初级)
获得 研究力(初级)

此时有两个外校的AP加进来合作 整个证明快了很多 也第一次学会了pdf和png图片的区别 5月投NIPS中了 展示poster

Latex使用(初级)–>Latex使用(中级)
获得 自我驱动(初级)
获得 洞察力(初级)
获得 时间管理(初级)
获得 防御力(初级)
获得 人脉网络(初级)
获得 写作力(初级)

博二下(38分):

导师指导了一个差分隐私和深度学习交叉的项目 在学长的carry下 我主要负责编程(包括第一次用云计算)3个月写完 这是我进入的第二和第三个领域 这个文章算是根本上解决了深度学习中隐私accountant的问题 理论深效果好 我特别满意

获得 研究格局(初级)
获得 交叉力(初级)
获得 多样性(初级)

算上NIPS这一年参加了三次会议 包含了我的第一次poster和第一次talk 还学会了怎么报销和帮老师写了点grant的文书 加上带了宾大的暑校 以及完成了五年中唯一一年的TA义务

获得 影响力(初级)
获得 行政管理(初级)
获得 向上管理(初级)
获得 学术服务(初级)

博三上(46分):

继续做第一个项目的另一个角度 没想到遇到了特别大的困难 写了一年才写完 临发表发现了错误 重新写 总共花了两年到博四末才做完 中途导师都想放弃了 期间迷茫痛苦不足为外人道

研究力(初级)–>研究力(中级)
获得 情绪管理(初级)

虽然主线任务非常不顺 但是支线任务还是没少做 最重要的就是遇到了现在的女友 都有学术心 一直互相学习到现在

恋爱关系(初级)–>恋爱关系(中级)

自己在没有导师的情况下还带了其他同学做了几篇followup和交叉工具的paper (这些work的发表要到博四开学)

获得 独立性(初级)
自我驱动(初级) -->自我驱动(中级)
获得 项目规划(初级)
获得 向下管理(初级)
获得 平级管理(初级)

博三下(60分):

和导师提出了一类模型的新结构 学习了neural tangent kernel这个新工具 也被导师和同学在另一个课题上带着中了NIPS spotlight 也就是说 这一段时间我同时在和多个合作者做至少5个项目。。。

交叉力(初级)–>交叉力(中级)
写作力(初级)–>写作力(中级)
时间管理(初级)–>时间管理(中级)
获得 精力管理(初级)
多样性(初级)–>多样性(中级)
Latex使用(中级)–>Latex使用(高级)

在博三结束的暑假 我做了第一份实习 MSR总部的算法组 继续研究深度学习和差分隐私 解决隐私算法的重要问题(以前只考虑privacy和accuracy 通过实习才关注memory和speed等现实要素) 而且偏向方法上而非理论上的创新 需要手写所有的optimizer

期间完成论文两篇 已发表ICML

研究格局(初级)–>研究格局(中级)
编程(中级)–>编程(高级)
搜集力(初级)–>搜集力(中级)
获得 创新力(初级)
人脉网络(初级)–>人脉网络(中级)

至此 我已经上完了学校所有我需要的机器学习/统计/数学课 并主动约导师把oral exam过了 不再上课

向上管理(初级)–>向上管理(中级)
课程完成(中级)–>课程完成(高级)

由于美国疫情开始 几乎断绝了传统的信息获取渠道(学术会议, reading group, lecture)我开始订阅各种校外seminar(尤其是one world系列)并且开始每天扫完当天arxiv新增文章(统计+ML大概130篇/日)

文献阅读(初级)–>文献阅读(中级)

博四上(74分):

博三耕耘的多个无导师的项目们都完成了 中了三篇AISTATS (因为统计要素较大 而ML顶会不太懂inference) 其中一篇槽点无法忍 某个小学生审稿人说我研究的问题和概念都是自创的 我气的直接在rebuttal骂他没有资格审稿 甩wikipedia链接告诉他这些概念有多基础 最后他改分让我中了

同年 我也第一次当审稿人 就是AISTATS 还第一次当了期刊审稿人

获得 攻击力(初级)
交叉力(中级)–>交叉力(高级)
防御力(初级)–>防御力(中级)
洞察力(初级)–>洞察力(中级)
学术服务(初级)–>学术服务(中级)
独立性(初级)–>独立性(中级)
时间管理(中级)–>时间管理(高级)
精力管理(初级)–>精力管理(中级)
向下管理(初级)–>向下管理(中级)
平级管理(初级)–>平级管理(中级)
项目规划(初级)–>项目规划(中级)

和女友相处一周年 感情很好

恋爱关系(中级)–>恋爱关系(高级)

迟到了一年的报销催下来了

行政管理(初级)–>行政管理(中级)

和MSR、Baidu、Huawei研究部门高管保持联络 给些talk 偶尔写技术博客

影响力(初级)–>影响力(中级)

博四下(87分):

困扰我多年的第二个项目终于做完了 在我导师和合作者们神助攻下 用崭新的要素做出了很好的结果 在投统计第一期刊 AOS;另外有一个很满意的work 我独立给出了某个重要问题的training dynamics分析 并且大幅改进收敛性质

目前我的研究范围包括:高维线性模型;隐私模型;深度学习理论(主要NTK);优化算法;可解释模型;贝叶斯模型;missing value imputation

解题力(中级)–>解题力(高级)
研究力(中级)–>研究力(高级)
写作力(中级)–>写作力(高级)
创新力(初级)–>创新力(中级)
独立性(中级)–>独立性(高级)
自我驱动(中级)–>自我驱动(高级)
多样性(中级)–>多样性(高级)
情绪管理(初级)–>情绪管理(中级)

保持着每天扫完arxiv新增文章标题以及扫完ICLR/NIPS/ICML所有文章标题(一年3000+篇)的习惯 广泛撒网 重点捞鱼

文献阅读(中级)–>文献阅读(高级)
搜集力(中级)–>搜集力(高级)
洞察力(中级)–>洞察力(高级)

当ICML和NIPS审稿人 以及宾大暑校

攻击力(初级)–>攻击力(中级)
学术服务(中级)–>学术服务(高级)

博五上(97分):

隐私模型这一块在多方面做到了SOTA 包括计算效率(一样的速度下比Facebook库省了上百倍内存 一样内存下比Google快了上百倍)隐私刻画(给出了第一批tight bound中的一个 现在是业界benchmark)隐私优化器(提出了一类截然不同的优化器设计思想而且大幅改进convergence)

大厂全都听过我的talk了 也因此又拿到了几个实习 暑假先去百度西雅图研究院 秋季学期中在Amazon AWS AI lab又做了一次实习 给了return offer

创新力(中级)–>创新力(高级)
影响力(中级)–>影响力(高级)

开学后边做实习边和同学做研究边刷代码找full time research scientist工作 拿了十几个offer

精力管理(中级)–>精力管理(高级)

尤其是现在独立带同学和学弟学妹合作非常愉快 同时做8个无导师项目也hold得住

项目规划(中级)–>项目规划(高级)
向下管理(中级)–>向下管理(高级)
平级管理(中级)–>平级管理(高级)

当更多审稿人 ICLR/AAAI/NIPS/ICML/AISTATS等等

攻击力(中级)–>攻击力(高级)

毕业论文搞得很狼狈 宾大的要求是答辩前14天就要把毕业论文准备好发给committee 我本身就是在宾大允许的答辩最后一天答辩 没注意这个时间点 差点就要延毕一个学期 幸亏老板提醒 花了两天从零开始肝完毕业论文 安排答辩时间地点和所有表格 答辩顺利通过 谢谢导师们!(其实我是超出了宾大thesis deposit deadline的。。。)

向上管理(中级)–>向上管理(高级)
行政管理(中级)–>行政管理(高级)

还有一件事在整个秋季学期也一直耗我的精力 就是我投AOS的第一个项目拿到了revision 为了求稳我们用3个月写了8页的response 再次提升了我写作能力 虽然我以顶会为主 之后我有信心可以独立投顶刊了

防御力(中级)–>防御力(高级)

解释一下为何研究格局和人脉网络我觉得做的不是很好 主要原因是我没有做过特别宏大或者爆款的文章(Nature级或者单篇citation 500+)这方面从我跟超新星导师而不是成名大牛有关系 跟我处在这一波深度学习时代末期也有关系 好在依然在做前沿研究 两三年内肯定会满足这个小小的遗憾

因为提前毕业就没有博五下了 更新一下毕业后近况:和恋爱两年的女友结婚了 以及去业界做 senior research scientist了

一个博士生接受怎样的训练是完整、全面的科研训练?_第1张图片

总的来说还是挺开心的日子 我比较工作狂吧 知足了 这已是圆满

Last but not least 我的博士生涯TM的有塞尔达荒野之息啊 呀哈哈!毕业后就等着荒野之息2哈哈!



我觉得一个合格的博士需要经历以下几个训练:

1)能够平衡上课和科研。选择足够有代表性的专业课,课程的成绩大部分为优秀。在博士第一年和第二年的时候。每个学期要至少选2门专业课(指的是海外博士,国内的话,可能是4门以上),同时做科研工作。这个过程其实是比较痛苦的。因为其实光是上课、完成作业、期中期末考试就不容易了。国外的研究生课程通还要组队做project,做presentation,一个学期3门课已经苦不堪言,4门课还能同时做TA或RA的已经是到了极限。但是这是博士头两年的必经过程,必须要训练这个同时handle多门课程+项目,且不耽误自己科研的能力。

2)训练每天花时间看文献。如果不能保证每天都看,也要保证每周有看一定数量。读文献讲究方法。了解本领域最近进展,只看文章的标题和Abstract,遇到感兴趣的和重要的留下来重点关照。几年博士生涯下来,读过的文章超过几千篇,精读文章超过几百篇。

3)尝试了解本领域全世界的著名课题组、教授或团队,各自的风格和长处是什么。尝试与这些人包括论文中的大牛见面,聊天,甚至建立更深入的联系。这是对科研人脉圈的训练,未来在博士以后去找pos-doc,教职,工业界工作甚至申请国外绿卡都会帮到大忙。

4)训练总结的能力。平时读文献,看新闻,听报告,或是自己的灵感,遇到好的点子都可以随时记录下来。这样保证自己处于本领域或本行业的最前沿。同时业保证自己在做手头项目的同时,还有新的想法和工作可以展开。

5)博士期间,多参加学术或行业会议。尝试在会议中做报告(最好是英文的国际报告)或poster。争取拿一些奖(如:XX会议最佳展示奖,海外优秀自费留学生奖。。。)

6)不断锻炼写作能力。有报道说,一个科研人员,在论文写作和期刊发表上面所花费的时间占据全部科研时间的将近60%。从我个人经历来看,我觉得这个比例是靠谱的。博士科研工作做的再好,无法用精炼的语言写出来,就无法让世界上其他人了解到你的工作,就不能体现价值,也会被顶刊所拒绝。对于学术型写作,每个人并非一出生就是专家,前期甚至要经历一个很痛苦的阶段。每写一篇新文章,新摘要,新的会议论文,都要深思熟虑,痛苦不堪。有关科学写作,可以参考我的另一个文章,也请大家关注我的“科研与英文论文写作”的专栏。

刀客特李:如何开始写英文论文2506 赞同 · 50 评论文章一个博士生接受怎样的训练是完整、全面的科研训练?_第2张图片

7)既然提到写作和期刊,那么一个必不可少的训练就是投稿、拒稿和修改稿件的训练,和与不同期刊小编or同行大牛们的斡旋训练。在这个过程中,你会逐渐把握不同期刊的风格、文书风格、发表周期、对创新性的要求。这样,当你下一个工作完成之时,基本上也就知道大概可以投到哪里了。

8)演讲训练,如做presentation的能力。作为博士,势必要在系里,学校里登台演讲;在国际会议如MRS, ACS, IEEE等大场合登台演讲;qualify, 预答辩,答辩。不利用这些机会把自己锻炼成一个合格的演说家真的不算是完整、全面的科研训练啊。

9)心态的训练。对于科研来说,我们都是在和大自然(自然科学)或者复杂的社会(社会科学)打交道,挑战自己的极限。有成功更有失败,甚至失败的概率会更高些。这样,在博士前面几年,会不断的经历失败,并对自己的工作产生怀疑。同时,也有很大可能,承受着好几年过去了还有文章的精神压力,比不了业的压力,别人都工作了我还在读书的压力。。。可以说,读博是一种人生最高层次的历练,因为是在挑战人类的认知。当经历了这些以后,每一位成功毕业的博士都是值得尊敬的战士。我相信,人生后面遇到任何苦难,一位博士都可以坦然面对了。

下面是一些我博士期间经过各种训练的例子、结果或中间产品。很多东西,回过头来看还是很有一番成就感的。

如这是我第一篇论文手稿的修改历程,全程改了20多遍,最后发表在IF=15点的顶级期刊上。

一个博士生接受怎样的训练是完整、全面的科研训练?_第3张图片

这个是画图的训练,我觉得博士下来,除了科研,还把自己训练成一个美工了,哈哈。专业画图软件,PS, AI, CAD, 3D软件等。

一个博士生接受怎样的训练是完整、全面的科研训练?_第4张图片

一个博士生接受怎样的训练是完整、全面的科研训练?_第5张图片

做实验记录的训练。做到必有实验日期、实验目的、实验过程、实验现象,还有实验结果。有产品ID,测试结果,对应的页码。实验记录本中的名字-代号-ID,和测试仪器以及个人电脑中的文件夹名字可以对应,方便随时查找。好好的打理实验记录本,有助于从数据中挖掘出有用的信息,从失败的结果中分析出可能的原因,也方便日后写文章时查找。

一个博士生接受怎样的训练是完整、全面的科研训练?_第6张图片

一个博士生接受怎样的训练是完整、全面的科研训练?_第7张图片

当然了,也少不了各种数据分析的训练。如理工科常会用到orgin,有些学科用matlab,python或者统计学绘图软件比较多。

一个博士生接受怎样的训练是完整、全面的科研训练?_第8张图片

一个博士生接受怎样的训练是完整、全面的科研训练?_第9张图片

最后,放几个不错的书籍和链接,帮助广大博士生们更高效地提升自我,尽快达到毕业标准。如下面这个知乎live和链接,讲科研选题和写作方法的,我也听了很多。这里放上我认为比较好的。

作为博士期间训练最大的部分之一,SCI论文写作绝对会虐人千百遍。因此我觉得有必要推荐几本我认为还不错的SCI论文写作的书,供大家参考。

至于说整个博士生涯的训练,每个人的经历都不同。但前人的经历都多多少少可以给后来人以指导。在我打开知乎live的潘多拉魔盒后,发现有些人的经历甚为传奇和精彩,抑或是总结的很到位,分享给大家:

最后想说的是,读博科研路漫漫其修远,与君共勉。



我2017年博士毕业开始回国工作,到现在也3年多了,其实我目前的工作内容跟我博士期间做的研究可以说已经八竿子打不着了,甚至现在我连自己用Python写个小程序都已经很困难了。但是,我目前对我未来的发展没有任何的焦虑,同时,我也很清楚自己现在的核心竞争力的根基也来自于博士期间的训练。所以也可以说,以下几点,是我个人认为博士期间最需要训练的几个方向;(1)严密的逻辑思维,可能大家觉得这不是每个能读到博士的学生必备的天赋吗?其实曾经的我也不知天高地厚的以逻辑鬼才自居,直到进了我老板的组,第一次做组会汇报的时候,逻辑被锤了个稀巴烂。。。。我们组会日常的一个训练叫做hypothesis talk, 其实就是像全组展示,你选择的研究方向是基于一个什么样的假设,然后大家围绕你的假设以及实验设计提出一系列的问题。其实这个很重要,因为基本上如果你要基于这个假设来开展你的项目,那么这个假设的好坏可以说就基本决定了你这个项目的上限,或者说的更直白一点,能发什么等级的paper。我博士四年,印象中听到老板说的最多的一句话,应该就是,只有当不管最终的实验结果是否支持你的hypothesis,你都能基于这个结果开展下一阶段的研究时,这才是一个好的hypothesis(用人话说,不管结果好坏,paper都能发)。就为了这句话,我的逻辑被摧残了四年,但现在回想起来,确实发现逻辑这东西是没有上限的,只要持续摧残,它依然能有所提高。**PS:额,有几位知友私信问hypothesis talk这个模式是啥样的?能不能举个例子。估计我描述的比较抽象吧,其实没大家想的那么复杂。。。我刚翻了下电脑,还有自己以前做hypothesis talk的PPT,我就截几个图,感兴趣的可以看看就行了,我就不对具体内容做解释了。。为了不影响其它朋友的阅读,我把图贴在最后面。一个博士生接受怎样的训练是完整、全面的科研训练?_第10张图片我记得我老板之前好像有一些相关的演讲视频,其实听听还蛮有意思的,但搜了一下都在油管上,我就不贴链接了,截个图吧,有资源的朋友自己去搜一下就能找到了。一个博士生接受怎样的训练是完整、全面的科研训练?_第11张图片(2)快速锁定关键信息的能力,没错,这事大家都干过,就是看文献。我刚看时进入科研圈的时候,看文献是巨慢的,我喜欢从abstract到result一字一字的读,什么?你说discussion,其实到现在我也最讨厌读discussion,因为太费脑**。。。我自己感觉到读文献的能力有一个明显的提升,差不多是在一次大概一个月看了100篇文献之后吧。也是被我老板逼的,现在回想起来都有点发怵。有一次跟我老板开会讨论项目进展,他问了我一个问题,有哪些因素可能引起这个变化?我说环境因素。。。 他说,好,我们现在先不聊了,我给你一个月的时间,如果下个月你还只能答出环境因素这种笼统的回答,我会让你在2周类读完目前这个方向上发表的所有文献。。。。嗯,为了不耽误我的篮球,LOL,狼人杀等娱乐活动,我决定还是用一个月的时间把这些该死的paper读完,一顿海淘之后,我发现大概下载了100多篇,那按我之前那种龟速阅读法,就算蹲坑我也看文献也不可能看完啊。所以没办法,只有逼着自己开启浪读模式,记得当时给自己规定的是,一篇paper不能超过20min,并且之后要自己闭卷用英文把这篇文章的key point写出来。当然一开始非常痛苦,但越到后面发现速度越快,当然一个月后的项目讨论也比较顺利,并且我发现从此以后看文献的技能好像进入了下一个等级。现在的工作中,其实我每天也要阅读大量的信息,行业的,专业的,投资领域的,噢对,还有写知乎文章需要看的材料。发现从这个能力中受益颇深。一个博士生接受怎样的训练是完整、全面的科研训练?_第12张图片(3)抗压能力,其实这个大家应该一个都跑不脱吧,只不过按在指压板上摩擦还是按在水泥地上摩擦的区别而已。实验失败,实验结果一拖屎,投稿被秒拒。。。。。这些无不是在锻炼我们的抗压能力。当然,我自己也曾被锤奔溃过,但自从工作以来,目前还没有觉得扛不住的时候,有几次遇到比较棘手的情况,想想之前受过的压力,锤子,这个算个球。所以,博士期间如果没被锤过,那一定是不完整的,也是很可惜的一件事。好了,最后贴几个博士期间发生的趣事吧,全当给大家解解闷了。在德国马克斯•普朗克研究所读博士是一种怎样的体验?608 赞同 · 150 评论回答一个博士生接受怎样的训练是完整、全面的科研训练?_第13张图片SCI 文章被拒是一种怎样的体验?49 赞同 · 22 评论回答一个博士生接受怎样的训练是完整、全面的科研训练?_第14张图片你的导师对你说过什么让你至今难以忘怀的话?1.1 万赞同 · 616 评论回答一个博士生接受怎样的训练是完整、全面的科研训练?_第15张图片Hypothesis talk Demo:一个博士生接受怎样的训练是完整、全面的科研训练?_第16张图片一个博士生接受怎样的训练是完整、全面的科研训练?_第17张图片一个博士生接受怎样的训练是完整、全面的科研训练?_第18张图片一个博士生接受怎样的训练是完整、全面的科研训练?_第19张图片一个博士生接受怎样的训练是完整、全面的科研训练?_第20张图片T就是test, 就是为了验证我提出的hypothesis, 我打算做的实验和分析的数据一个博士生接受怎样的训练是完整、全面的科研训练?_第21张图片



工科博士刚毕业半年多,只能是结合自身经验聊聊这个问题,相信博导教授们应该对这个问题有着更好的理解。那么我个人的经验主要是针对传统工科而言的,理科文科什么的我也不是非常了解就不一定适用了。

1 良好的数理基础

无数次的实践证明没有良好的数理基础很多时候你的研究走不深。如果你数理基础薄弱在短期内也可能做出一些好的成果,但是长远来看研究的深度和持续性高质量原创输出是很难的。这也是为什么我们经常看到很多大牛本科出身是数学系的。数学系四年的高强度训练对以后做研究是非常有益的,其实像工科领域用到的所谓“很难的”数学基本上95%的情况不会超过数学系本科范围。

我个人本科自动化专业,数学基础也很一般,在博士阶段头一年就意识到数学的重要性,于是博士阶段头三年都会刷一些数学系本科的课程。目前把数学分析,实分析,应用泛函分析,线性代数,拓扑学,常微分方程,统计推断都刷过了,像抽象代数,微分几何,数论这些自己暂时用不上就没刷。即使是仅仅刷了一部分数学系本科课程,而且自学也赶不上科班出身的那么扎实,但已经让我获益匪浅了。至少对比大多数工科生,你会发现自己看问题的深度往往比他们深,同时你掌握了基本的数学知识后和大牛们沟通起来障碍也小了很多。

2 良好的编程实践能力

我们身处在信息时代计算机的时代,编程能力毋庸置疑是非常重要的。我这里谈到的编程实践能力不单单指你能把算法写成代码就完事了。如何设计出高效的代码?如何让你的代码更加健壮?如何让你的代码更加易懂易用?大多数工科非计算机的学生在编程上还是比较浅尝辄止的,因为单就发论文而言很多时候是不需要很高超的程序设计能力,只要能把算法运行起来就行。这样做确实在短期内是完全没有问题,而且就短期来看是非常省事省力的。

但某一天你打开1年以前自己编的代码的时候,你就发现自己竟然看不太懂了。这是因为没有文档和注释,当初编程时也未考虑到程序的易读性。糟糕的设计模式也使得当你想稍微改进一下算法的时候想要复用以前的代码变得异常困难,只好把以前写过的代码又重新再返工一遍。至于想把自己的工作传承给师弟师妹们的时候也变得异常困难(你自己过1年都看不懂更不用说让别人理解你的代码),所以后面的师弟师妹们又不得不重新再来一遍。大量的时间浪费在了无意义的重复中,自然对前沿方向的探索就时间不足。

好的研究是站在巨人肩膀上的,好的研究是需要继承的。这个继承我个人理解是来自两个方面:一个是继承别人的,一个是继承曾经的自己的。

3 至少有某一个小领域,你能站在世界前沿水平

前面2条是比较一般的那种能力,作为博士你需要在一个小领域内能够非常拿得出手。在这个小领域内你是非常非常自信的,你一出手就是碾压的存在。这需要你对这个小领域内经典paper和近期前沿的paper都非常熟悉,而且自己也动手实践过。这个小领域其实基本上就是你发paper的点了。

4 讲故事的能力

前面三条就是硬功夫,从这条开始就是软功夫了。讲故事的能力包括 如何在写paper的时候把你的highlights提炼出来,让审稿人能够认可你的创新点。如何做好各式各样的presentation,在有限的时间内清晰地表达出你的工作。如何向外行,大同行,小同行来介绍你的工作,能让不同的观众对你的研究工作感兴趣。

5 一定的social能力

学术圈是一个相对封闭的圈子,你逐渐会发现这个圈子来来回回就那么些人,这一点和业界比是一个非常不一样的地方,业界你可能需要每天接触不同圈子的人。所以在学术圈里混是需要一定的混圈子的能力的。

那么怎么样去在学术圈社交呢?在学术圈社交的先决条件是你自己先得具有相当的学术能力,所以对低年级博士来说首要任务是多发高质量paper,提升自己的能力,而不是搞所谓的社交。只有你具备相当能力后别人才会来和你进行平等的学术社交,否则只能是单方面跪舔或者单方面施舍。高年级博士生在学有所成的基础上可以刻意的进行一些学术社交活动,拓展自己的人脉关系也是非常好的。

6 能及时调整自我心态

博士阶段绝大多数人都会遇到瓶颈。例如:导师完全放养不知道研究方向是什么?写了第一篇文章发给导师被骂写得是什么垃圾。投了文章被审稿人拒稿,感觉自己做的研究没什么意义,博士进入第三年或者第四年还没有发出paper整天焦虑的不行,看到和自己一起入学的同学发paper的发paper,准备毕业的准备毕业,自己什么进展也没有就更加焦虑到不行。

这些事情或多或少在读博过程中都有经历过,读博是需要坐住冷板凳的。在坐冷板凳的时候你是需要有一个调整心态的方式的,不然真的可能就是彻底的凉凉了。我的方式是每周和要好的博士同学打打羽毛球,然后一起泡澡,一起约个饭什么的。通过这个途径大家在心理上都有一个交流和释放的平台,而运动之后再洗个澡在生理上会让人进入一种比较舒服的状态。当然每个人有不同的方式,但是你一定需要一个途径去排遣你的压力。



在我博士刚入学的时候,系里给我们这些新生开过一个会,主要讲一个博士生要具备什么样的能力才算是一个合格的博士。

写在问前,全文共计5603字,覆盖了博士所需技能和能力的方方面面,建议收藏后再看,可以时不时拿出来与自己对照,有则改之无则加勉。

主要的材料是引用的这个:The Vitae Researcher Development Framework[1](vitae 研究者发展框架)

该框架分为四个领域,每个领域又分为三个子项,分别是:

一个博士生接受怎样的训练是完整、全面的科研训练?_第22张图片

领域A: 知识和智力

Domain A: Knowledge and intellectual abilities: The knowledge, intellectual abilities and techniques to do research

  • A1: Knowledge base - 知识库
  • A2: Cognitive abilities - 认知力
  • A3: Creativity - 创新能力

A1: Knowledge base

  1. subject knowledge - 领域知识
  • 至少具有核心知识和对关键概念,问题和研究思路的基本理解。
  • 了解自己研究领域和相关领域的最新进展。
  • 正在努力为知识做出原创性贡献。
  • 正在发展对国际和非学术方面的知识创造的广泛认识。

\2. Research methods - theoretical knowledge:- 研究方法之理论知识

  • 了解相关的研究方法和技术及其在自己研究领域中的适当应用。
  • 证明自己研究中使用的原理和实验技术。

\3. Research methods – practical application: - 研究方法之实际应用

  • 使用与研究领域相关的一系列研究方法并记录自己的活动。
  • 在自己的学科领域显示出不断增强的能力,并且持续加深对可替代方法和分析技术的认识。

\4. Information seeking - 信息搜集

  • 掌握搜索和查找技能。
  • 识别并访问适当的书目资源,档案和其他相关信息来源,包括网络资源,主要资源和存储库。
  • 充分利用各种当前的工具和技术。
  • 评估来源的可靠性,价值,权威性和相关性。
  • 寻求相关团体的反馈以获取其他见解。

\5. Information literacy and management - 信息素养与管理

  • 适当地设计和执行用于使用信息技术获取和整理信息的系统(例如文字处理,电子表格,模拟系统,数据库)。
  • 增强对信息/数据安全性和寿命问题的意识。
  • 知道从哪里获得专家建议,包括但不限于信息/数据经理,档案管理员和图书馆员。

\6. Language - 语言

  • 掌握适用于研究的语言(包括技术语言)。
  • 学习另外的语言。

\7. Academic literacy and numeracy - 学术素养和计算能力

  • 能够在学术环境中适当地理解,解释,创造和交流。
  • 为演示准备语法正确的内容。
  • 以适合目的和上下文的风格写给专业和非专业观众。
  • 具有数学能力。
  • 了解并应用学科/研究领域可能使用的任何统计数据。
  • 分析数据并使用适当的计算机软件包。
  • 具有IT素养并且能够使用信息和数字技术。

A2: Cognitive abilities - 认知力

  1. Analysing - 分析
  • 严格分析和评估自己的发现和其他发现。
  • 验证其他人的数据集。

\2. Synthesising - 融合

  • 发现自己的研究与以前研究的联系,从融合中得到收获。

\3. Critical thinking - 批判性思考

  • 能够理解争议,并能以口头和文字表达自己的观点和假设。
  • 具有识别和验证问题的能力
  • 认识多种认知范式和替代范式

\4. Evaluation - 评估

  • 汇总,记录,报告并反思进度。
  • 评估自己的研究活动的影响和结果。
  • 评估主要和次要研究信息/数据的质量,完整性和真实性。
  • 接纳并提出建设性批评。

\5. Problem solving - 问题解决

  • 将自己研究的基本主题独立出来;
  • 并提出基础研究问题和假设。

A3. Creativity - 创造力

  1. Inquiring mind - 好奇心
  • 表现出学习和获取知识的意愿和能力。
  • 展示出灵活性和开放性。
  • 培养一种提问技巧的风格。

2 Intellectual insight - 远见卓识

  • 吸收并运用思想。
  • 通过调查/寻求信息来创造想法和机会。

3 Innovation - 创新

  • 了解创新和创造力在研究中的作用。
  • 尝试从事跨学科研究。

\4. Argument construction - 论据构造

  • 建设性地捍卫研究成果。
  • 提供一些支持成果的证据。
  • 清晰简洁地构造论点。

\5. Intellectual risk - 智力风险(?)

  • 测试界限,愿意挑战学科/研究领域内的思想现状。
  • 向重要的受众公开想法并对其他研究进行严格评估。

领域B:个人效能 - 成为合格研究人员的个人素质和方法

Domain B: Personal effectiveness: The personal qualities and approach to be an effective researcher

  • B1: Personal Qualities - 个人素质
  • B2: Self-management - 自我管理
  • B3: Professional and career development - 专业和职业管理

B1 Personal Qualities - 个人素质

  1. Enthusiasm - 热情
  • 保持自己的研究热情和动力。
  • 认识到需要对自己的工作充满激情和自豪感。

即使是平凡的工作也有要有干劲。

\2. Perseverance - 坚持不懈

  • 表现出自律,积极性和坚定信念。
  • 在遇到障碍和挫折时坚持不懈,但可以寻求同事,主管或领导者的支持。
  • 有效地处理日常研究工作。

\3. Integrity - 正直

  • 在研究领域和所处机构了解和展示出良好研究的实践。
  • 必要时寻求指导。

\4. Self-confidence - 自信

  • 发掘一些个人能力并愿意证明它们。
  • 认识到自己知识,技能和专长的界限,并酌情利用一些外部支持。

\5. Self-reflection - 自我反思

  • 花时间反思实践和经历。
  • 扬长,补短。
  • 寻求个人反馈。
  • 从错误中学习。

\6. Responsibility - 责任

  • 逐步对自己的项目和自己的身心健康承担全部责任。
  • 进一步发展独立性。

B2: Self-management - 自我管理

  1. Preparation and prioritisation - 准备和优先级
  • 准备和规划以达到目标,并能在得到必要的支持下进行调整。

\2. Commitment to research - 致力于科研

  • 致力于并完成第一个项目,同时获得研究证书(credentials)

\3. Time management - 时间管理

  • 有效地管理自己的时间以完成研究项目。
  • 坚持清晰的计划。

\4. Responsiveness to change

  • 在需要时调整方法; 寻求指导并认识到风险。

\5. Work-life balance

  • 正在认识到工作与生活平衡问题。
  • 必要时使用支持和咨询服务,以避免过大的压力并增进个人身心健康。
  • 考虑他人的需求。

B3:Professional and career development - 专业和职业管理

  1. Career management - 职业管理
  • 管理自己的职业发展,设定现实可行的职业目标,确定并践行提高就业能力的方法。
  • 通过有效的简历,申请和面试展示自己的技能,个人特质和经验。
  • 开始建立职业网络。

\2. Continuing professional development - 持续的专业发展

  • 表现出自我意识和识别自己的发展能力。
  • 认识到自己经验的可转移性,并将其明确传达给潜在的雇主或直属负责人。
  • 简历并维护自己的成就和经验记录。

\3. Responsiveness to opportunities - 对机会的反应

  • 展示对研究技能到其他工作环境的可转移性的了解,以及对学术界内外的职业机会的了解。
  • 了解并利用学术界内外的广泛就业和专业发展机会,包括工作经验和实习机会。

\4. Networking - 社交圈

  • 与机构内以及更广泛的研究界内的主管和同事建立并维护合作网络和工作关系。
  • 有效地使用个人和/或在线网络来获得反馈和建议,对工作的严格评估以及对机会的响应。
  • 与社会和公共机构互动交流。

\5. Reputation and esteem - 声誉和自尊

  • 在自己的研究领域上发声。

  • 开始成为优秀研究者。

领域C:研究管理和组织能力 - 了解研究的专业标准和要求

Domain C: Research governance and organisation:
Knowledge of the professional standards and requirements to do research

  • Professional conduct -职业操守
  • Research Management - 研究管理
  • Finance, funding and resources - 财务,资金和资源

C1: Professional conduct -职业操守

  1. Health and safety - 健康和安全
  • 了解相关的健康和安全问题,并养成负责任的工作习惯。
  • 对自己的工作环境负责。
  • 意识到对他人和更广泛环境的影响。

\2. Ethics, principles and sustainability - 道德,原则和可持续性

  • 了解并应用有关行为规范的行为准则和准则; 积极向主管寻求建议。
  • 表现出对与其他研究人员,研究对象以及可能受到研究影响的其他人的权利有关的问题的意识。
  • 注意自身对环境的影响。
  • 了解如何以可持续的方式表现和工作。
  • 了解社会责任的概念; 积极寻求必要的指导。

\3. Legal requirements - 法律要求

  • 对研究的法律要求有基本的了解,例如 Data Protection Act(《数据保护法》),Freedom of Information Act(《信息自由法》)等。

\4. IPR and copyright - 知识产权和版权

  • 对适用于自己的研究的数据所有权规则有基本的了解。

\5. Respect and confidentiality - 尊重和保密

  • 尊重自己的研究中参与者的保密权和匿名权。
  • 尊重同事。

\6. Attribution and co-authorship - 署名和共同创作

  • 了解归因概念,并一贯的公平贯彻归因。
  • 寻求对于对于有关行为准则的建议。

\7. Appropriate practice - 适当实践

  • 在适当的情况下,了解并遵守与所在机构相关的学术不端行为的法规。

领域D:参与程度和影响力:与他人合作以确保研究产生更广泛影响的知识和技能

Domain D: Engagement, influence and impact: The knowledge and skills to work with others to ensure the wider impact of research

  • Working with others - 与他人合作
  • Communication and dissemination -交流与传播
  • Engagement and impact - 参与和影响

D1: Working with others - 与他人合作

  1. Collegiality - 合作制
  • 考虑他人
  • 倾听,给与和接受反馈,并回复对方

\2. Team working - 团队合作

  • 在正式团队和非正式团队中工作并为他们的成功做出贡献时,了解自己的行为以及对他人的影响。
  • 感谢其他团队成员(包括非学术成员)的贡献。
  • 感谢所有直接或间接参与者的贡献。

\3. People management - 人员管理

与主管商议进程和期限deadline。

\4. Supervision - 监督

  • 参与同级的帮助和评估,以及对于本科生的支持和评估。

\5. Mentoring - 指导

  • 参与教学,指导,演示或其他研究活动时,有效地支持他人的学习。
  • 认识到指导和接受指导的重要性。

\6. Influence - 影响力

  • 参与讨论并欢迎挑战。
  • 认识到自己的研究对现实生活环境的影响。
  • 认识到学术界与那些使用研究成果来取得影响和受到影响的人们进行对话的价值。

\7. Collaboration - 合作

  • 意识到协同工作的价值,并从中获得尽可能大的收益。
  • 与主管/研究负责人共同研究。
  • 认识到自己和相邻学科/研究领域内的共同/冲突利益。

\8. Equality and diversity - 平等和多样性

  • 尊重个人差异。
  • 在工作环境中培养对多样性和差异的认识。
  • 了解机构对平等和多样性的要求。

D2: Communication and dissemination -交流与传播

  1. Communication methods - 交流方式
  • 通过各种技术,正式和非正式地构造连贯的论点,并向各种受众清楚地表达思想。
  • 积极参与与同事的知识交流和辩论,不限于学科和领域
  • 注重修辞技巧。

\2. Communication media - 交流媒介

  • 发展各种沟通方式,例如使用交互式技术和/或文本和视觉媒体进行面对面的交互。
  • 拥有个人网络主页。
  • 在演示中有效使用视听辅助工具。

\3. Publication - 出版物

  • 了解出版过程和研究成果的进一步开发过程。
  • 发表一些出版物。
  • 正在提高人们对出版物发行范围和多样性的认识。

D3: Engagement and impact - 参与和影响

  1. Teaching - 教学
  • 参与本科生教学。
  • 协助对本科生项目的监督。
  • 参加研究会议(研讨会,讲习班,会议等)。

\2. Public engagement - 参与到公众活动

  • 了解并欣赏与公众互动的价值,并乐于参与。
  • 响应当地的各种机会和活动,并在公共活动中介绍自己研究的各个方面。

\3. Enterprise - 创业

  • 产生想法并确定机会。
  • 在自己的机构内部或外部以创新的方式发展思想。
  • 了解研究成果的商业开发过程。
  • 了解在业务/商业环境中建立关系对学术界的价值。

\4. Policy - 政策

  • 了解相关的决策过程,并以政策友好的形式展示成果。
  • 分析政策并了解其所处的广泛环境。

\5. Society and culture - 社会和文化

  • 使人们认识到研究对更广泛的社会的影响以及社会,环境和文化对研究的影响。
  • 了解社会责任的概念。

\6. Global citizenship - 全球公民

  • 对国家和国际层面上进行自己的研究的背景有广泛的了解。

写在文末,看到这个问题后,自己就有了写这个回答的想法,没想到东西涉及的非常多,最后写了将近5500字,这不仅对相关的同学有所启迪,也是对自己接下来的一个界定,从上述中能看到,对于一个合格的博士学位获得者,掌握的能力几乎是全方位的,进可科研,退可百搭。

希望与各位同学共勉。



我认为完整、全面的科研训练主要分为两个方面,一方面是培养具体做研究的能力,另一方面是锻炼管理学术生活的能力。这些训练有些是导师给你的,有些是要靠自己努力的。

具体做研究的能力比较直观,即解决问题的能力,可以细分为如下部分几点。

1)进行针对性学习和有效入手的能力。博士研究很多时候是新课题,不太可能从头开始学习所有知识,这个时候进行选择和平衡就非常重要了,一方面要有宽厚的整体基础,一方面要在具体的研究点上有所突破,并且要在一定的时间内完成。

2)进行问题拆解与关联的能力。这一点比第一点稍微难一些,也算是科研开始上路的标志吧。这一步的目标是掌握把未知的问题转换为能解决的方案的能力,并掌握和熟悉常用的研究范式。

3)展示和说服的能力。文本层面,学术写作(含作图)既是一种能力,也是一种思维习惯,简洁有逻辑的陈述需要长时间的训练与总结。非严格文本层面上,如何与导师、同行、合作伙伴进行基于不同目的的高效交流,也是一项重要的能力。

管理学术生活的能力的话,则主要针对想要在学术圈长久发展的博士,包含如下几点。

1)长期规划的能力,知道自己需要提升哪些方面的能力,并持续努力。

2)选题的能力,深入了解相关领域的发展脉络与未来方向,结合自己擅长的点规划出适合较长时间努力的方向,导向为研究角色的转换和写本子。

3)社交的能力,努力做到让别人了解和欣赏自己的工作,并建立关联,拓展研究的边界。影响力的构建是一项复杂的工程,我自身也还在努力学习和提高的过程中——俗称混圈子。

看了下其他答主的回答,很多事情其实大家不是不知道,而是做不到,因此最重要的一点还是有计划地去坚持提升……



另推荐我的另一篇文章,即回答如何构建符合从0到1工作特点的新型学术评价体系 ,也即基于代表研究项目制度的新型学术评价体系。这篇文章先分析了我国目前学术制度的形成背景和我国目前对于学术的实际需求,然后指出了目前国内看重“五唯”的评价体系的缺点,以及国际通用的代表作制度的缺点(如无法界定代表作的质量等级,以及代表作之间缺少体系相关性导致无法形成从0到1的工作),并指出了造成这一切的根源因素是目前所有的评价体系中缺少从0到1的工作的定义,或者说绝大部分的学者并不知道从0到1的工作是如何产生的。而在下文中我已经论证,决定从0到1工作的只跟其分析问题解决问题的过程(或者说逻辑结构)有关,基于此我设计了基于代表研究项目的新型学术评价体系,它由“成体系和卡结构的定义”、“收材料的方式”、以及“决定是否通过的方式”三个部分组成,一切的核心都是围绕着提交代表研究项目而进行。并在最后呼吁更多的学术界顶尖人物来组织发起关于“什么才是从0到1工作”的真理大讨论,并最终带来一系列的更深层次的学术改革。也欢迎大家就这篇文章的内容进行交流讨论,给予指正。

为什么国内的科研工作者做原创工作的渴望不是那么强?77 赞同 · 5 评论回答一个博士生接受怎样的训练是完整、全面的科研训练?_第23张图片


学术训练体系第一部分

——学术研究过程与思维运用

林治阳

一个完整的学术训练其实是包含了3个部分:1、学术研究过程与思维运用;2.本硕博培养方案;3.学术写作(会议期刊本硕博论文)。对一个博士来说,整个博士期间最重要的不是发了多少文章做了多少项目,而是掌握这个学术训练体系。

现在我们来介绍这个学术训练体系的第一部分——学术研究过程及思维运用。这一部分分为六章,分别是:1.学术研究过程;2.坚决打击rubbish work;3.代表作积分制;4.学术带来的一些思维习惯;5.思维运用;6.我的世界观。下面的Q表示question,也就是需要思考的问题;U表示understanding,也就是需要理解的概念。

一、学术研究过程

Step 1 Before Your Research

在正式进行研究之前,我们需要树立一个正确的学术世界观。这时候你需要问你自己:

(Q1)你觉得什么才是研究?

(Q2)你觉得什么才是研究的表现形式?

(Q3)你觉得什么才算是高水平的研究?

(Q4)你觉得什么样的学者才是真正有水平的学者?

(Q5)你目前对学术的理解从宏观角度来说会产生什么样的结果?

(Q6)你对学术和学者的理解跟那些已经改变过世界的成果和人物之间有何不同?

Step 2 Motivation Case

在你决定开始一个研究之前,不应该是自己想当然拍脑门去做事情,而是在现实中发生了一些事引起了你的注意,这些事情有一个共同的特点,让你开始对这件事产生兴趣和关注(U1)。只有兴趣和关注才能让你把事情挖掘深刻。一般来说,我们需要至少3个motivation case。在找寻motivation case的时候,应该回答出这几个问题:

(Q7)你看到的现象是什么?

(Q8)这些现象的共同之处是什么?

(Q9)这些现象有什么影响以至于我们必须要关注它解决它?

(Q10)这些现象是有明显特定的发生范围还是全球通用?

(Q11)这些现象或者其背后的活动,目的是什么?

(Q12)这个现象本身是否属于你的学科领域?

(Q13)请通过现实调查统计证明这些现象是否在Q10的回答下广泛存在。如果是可以继续做下去,如果不是请重新找。

这几个motivation case看上去比较宽泛,但其实都属于一个大类的问题范畴,也就是我们所说的research topic(U2)。

Step 3 Bound Your Research Scope

在确定motivation case广泛存在以后,这一现象就是我们需要关注并解决的现象。而这些现象本身都具有这些特点:广泛存在、可循环、会反复出现(U3)。在这个时候,我们的问题本身还很宽泛,看似是一个现象,但其实是有很多个不同的情况组成在一起,造成这个问题的原因和影响因素也各不相同,因此我们需要在这里限定我们的研究范围。一般来说,我们需要从6个角度去限定我们的研究范围(U4)。按顺序分别是:

1、一个阶段。这里要回答这些问题:

(Q14)这个现象或者活动在产生的过程中,可以涉及到哪些阶段?

这里每个阶段之间有一个明显的划分点,也就是不同阶段是由不同的行为主体各自完成的(U5)。举个例子,造成施工现场绑扎钢筋失败,涉及的阶段有钢材生产阶段(完成主体:钢厂)、钢筋设计阶段(完成主体:结构设计师)、钢筋加工阶段(完成主体:钢筋加工厂)、钢筋绑扎安装阶段(完成主体:现场工人)。所以首先要分清楚这个现象有哪些涉及的阶段,它们往往是横向的,这些阶段都有可能对这个现象或者活动产生影响(U6)。

(Q15)大概了解下,每个阶段都可能会对这个现象产生什么样的影响?

(Q16)你感兴趣的是哪个阶段?

一个现象涉及到的阶段有很多,而人的时间精力是有限的,这就需要我们找到自己明确的兴趣点,做自己喜欢的事(U7)。所以这里一定要弄清楚自己感兴趣的一个阶段,不要多。

2、一个应用场景,场景是指这个现象发生在什么样的条件和情况下,它们往往是纵向的(U8)。这里要回答的问题有:

(Q17)这个场景的定义是什么?

一个阶段下有不同的应用场景,且你关注的这个应用场景只能属于你关注的阶段之下,且这个场景具有一定的抽象概括性,也就是一类场景(U9)。举个例子,比方说在核电站的运维阶段中,这个阶段可以切分的具体场景有:单人单类型设备运维、单人多类型设备运维、多人单类型设备运维等。同一个现象,在不同的场景下发生的条件情况和原因往往并不相同,只是看起来类似(U10)。譬如单人单类型设备运维发生的操作错误,往往是伴随着设备操作步骤复杂;而多人多类型设备运维发生的操作错误,可能最主要的成因是沟通不畅带来的协调配合不佳。而看上去他们都只是操作错误而已。因此我们需要明确定义一个应用场景。而每个场景下都可能有具体的环境,比如说单人单类型设备运维,这时候场景下面临的具体环境可能有一层楼、两层楼、跑另一栋楼等环境,也可能面临一个房间、两个房间、100个房间等环境,这些就属于场景下的不同具体环境。同样一个例子就是一些数学公理定理,他们对应的问题都是一类场景,也就是我们所说的题型,但是具体到某一个数学题下就有不同的表现形式,这个表现形式就是我们这里提到的“环境”。这些环境看似不一样,其实背后的原理都是一样的,因此我只需要限定到场景即可(U11)。

(Q18)这个场景跟其他不同场景的区别在哪里?

这些场景的切分标准就是看两点(U12):一是造成该场景下各特性(下文解释)的最主要表现形式出现了本质的区别,比如说;二是不同场景下这个现象中包含的必要发生因素不同。举个例子,同样是化合反应,在超过临界温度、压强的条件下就会发生本质的变化,所以产生的同一特性(如液体的流动性)也会出现本质差别,他们包含的必要因素发生因素(如温度压强)也不同。

(Q19)你目前所关注到的场景是否真的是你感兴趣的场景?

(Q20)简单估计,这个场景是否很有挑战?

请注意,这里的挑战是指这个问题很复杂,需要考虑更多的因素,产生了很大的影响,使得这个问题很难被解决,而不是指你需要学一个很难很酷炫的技术(U13)。

3.特性,它是指造成的某一方面或正或负的影响(U14),比如说。这里需要回答的问题是:

(Q21)你首先关注到的特性是什么?

(Q22)这个特性的定义是什么?

(Q23)为什么你对这个特性定义是这样?

(Q24)这个特性是否重要到引起我们的关注?

(Q25)是否有文献总结或者现实案例支撑你对特性的定义?

(Q26)用统计数字或者观察事实来回答,这个特性造成何种程度的影响?

(Q27)这个特性是依附在你观察的现象中的哪一个行为/动作/事物/活动/……上的?

(Q28)依附在这个行为/动作/事物/活动/……上的,还有哪些特性?

(Q29)这些特性的定义又是什么?

(Q30)为什么你对这些特性定义是这样?

(Q31)这些新发现的特性是否重要到引起我们的关注?

(Q32)是否有文献总结或者现实案例支撑你对这些新发现特性的定义?

(Q33)用统计数字或者观察事实来回答,这些新发现的特性造成何种程度的影响?

之所以关注而这些特性,往往是因为这些特性表现出了与现实证据有偏差deviation的情况——或是现有解释模型不能解释最新得到的现实证据,多对应自然科学(U15);或是这个现象/活动不能很好地满足人们的需求,多对应工程学;或者说目前的这个社会不符合我们心中那个完美的理念,多对应人文艺术学科(U16)。

在发现这些依附于某个行为/动作/事物/活动/……上的一些特性之后,需要一起去解决它们,实际上你解决的就是这个行为/动作/事物/活动/……本身的问题(U17)。

4.特性的影响范围。一般来说这个影响范围至少要考虑时间、地域、数量三方面中起码一个的范围(U18),具体要考虑什么考虑多少,要取观察现象本身的特征。这里需要回答的问题有:

(Q34)这个现象的特性们在不同的时间跨度下和不同的时间节点上有什么不同的表现?

举个例子,如果是研究中国经济体制效率性的人,就应该特别关注在时间这一影响范围,因为49年之前的经济体制跟49年之后的体制肯定不一样,改革开放后的经济体制跟改革开放前的经济体制肯定也会不一样。这些都是有明确的时间跨度和时间节点来划分不同的特性影响范围的。

(Q35)你感兴趣的是哪个时间范围?

(Q36)这个现象的特性们在不同地域之间的表达有什么区别?比如说,同样是研究橘子的甜度,橘生淮南则为橘,橘生淮北则为枳,这就是地域所带来的影响。

(Q37)你感兴趣的是哪个地域范围?

(Q38)这个现象的特性们在不同的数量下的表达有什么区别?

举个例子,腾讯在招人时候让面试者冒泡算法做排序,在总数100个的时候,估计谁都能做得出来,可是如果总数是一百亿呢?这时候算法的结构将会出现本质变化。这就是量变引起质变。

(Q39)你感兴趣的是哪个数量范围?

对于范围来说,重要的不是时间地域数量本身,而是它们背后的东西(U19)。而时间跨度的长短、地域的分布、数量的多少,都是根据现象自身的特点来决定的,它可以是毫秒和六维时间的区别,可以是两个宇宙之间的区别,也可以是1与2的区别。而也可能存在其他的研究的范围,具体还是取决于现象自身的特点。而选定范围本身的结合也非常重要,就是你在做研究的时候,要尽可能把你选定的各个范围放在一起来形成一个明确的限定条件,因为不同范围的成因也绝对是不一样的(U20)。

到这里就出现了你的研究问题(research problem)的陈述,既告诉别人这个研究问题在什么情况下广泛出现了哪些重要的影响以至于我们不得不去关注解释或者解决它,也就是problem statement(U21)。请注意,此时我们尚未明确我们的research problem,只是完成了problem statement,Research problem的确定还在后面(U22)。

5.服务对象,也就是谁将直接使用你的研究成果并首先受益(U23)。这个服务对象在不同学科下是不一样的(U24),在社会科学或者工程学中,这个服务对象往往是人或者有人组成的特定集体,比如说汽车维修人员或者政府;在自然科学中,这个服务对象是现实世界中一个客观存在的某一类物体,比如说宇宙、中子星、电磁波、氢原子、熊猫、人类、红细胞等等等等,这些服务对象往往对应着自然科学中的观察对象。但不管哪一种,这些服务对象都是现实世界中真实存在的且拥有着共性的一类事物(U25)。这里需要回答的问题有:

(Q40)在你的problem statement 里面,有哪些可能的服务对象?

(Q41)简单了解,这些服务对象各自的需求/目的/行为/……分别是什么?

(Q42)你感兴趣的是哪个服务对象?

6.你准备做到什么程度才算结束。在这里需要思考的是:

(Q43)这个现象或者活动本身的目的/需求是什么?

(Q44)这个学科研究本身的目的/需求是什么?

不同学科之间的需求和目的是完全不一样。对社会科学研究来说,重要的是总结社会现象、分析成因然后指引出一个更美的好的未来;对工程学研究来说,重要的是满足使用者的需求,而不同使用者的需求并不相同;对于自然科学来说,重要的是解释这个世界真实的样子。所以在做研究的时候,要明确自己的学科特点(U26)。

(Q45)你打算做到什么程度才算停止?

是非要提高发动机30%的燃烧效率,还是非要制定出一个国家级别的法,这些都是根据实际想要来决定的,在工程学中常常就会出现一个明确的指标。请注意,这是指你要把事情做到什么程度,而不是指你的outcome(后面解释)是否必然发生(U27)。比如爱因斯坦提出了相对论,但是直到本世纪利用了全新的观测设备才被全部验证,相对论是必然发生的,爱因斯坦要做到的程度是提出相对论即可,而不是再进一步发明可以证明相对论的观测设备。所以在回答该问题的时候,要尽量只对应一个研究项目(U28)。

(Q46)这个程度在现在人类社会条件局限下能否实现/还要多久才能实现?

这点也很重要,这决定了你是否有必要做下去。这里先举工程学的例子,以人类现在的社会条件,星际穿越还不知道要到猴年马月。而一旦实现了星际穿越,这背后的物理学原理、材料、工程技术、燃料、宇宙观测设备、电子通讯设备、管理流程等大概率是被全部颠覆了的,所以星际穿越就无法在现在的条件下实现,这时候非要在现在的条件下研制出星际穿越的飞船,那就是毫无意义东西。而如果你的研究在10年之内就能实现落地并提高工程界水平,那就是有意义的。对社会科学来说也是一样,比如说当年马克思提出科学社会主义、发布共产党宣言和参加第一国际是他能做的,但是在全球实现共产主义就不是他做得到的,所以让马克思提出实现全球共产主义的具体方案步骤也是不现实的,因为那个时代的局限性在这里摆着。同样适用于布鲁诺,捍卫并发展日心说是他能做的,但是做出卫星那就不是他能做的,让布鲁诺设计卫星也是毫无意义的,因为设计出来的必然不能用,这也是时代的局限性。所以你做的研究,一定是要在整个社会已有条件下能实现(U29)。

前五个限制条件是要写进的研究课题报告(报告、大论文、小论文等),但是最后一个不用写进去,自己心里有数就好(U30)。

Step 4 表象成因与Research Problem

在完成problem statement以后,我们需要知道它为什么会发生、又为什么会以这种形式发生,因此我们需要找到导致这个问题的成因(U31)。而我们第一眼看到的成因,它其实往往比较宽泛,未必是真正引起这个问题产生的真正因素,而是这个成因背后的东西,也就是我们下一部分将介绍到的根源因素,因此这里我们称我们首先看到的成因成为表象成因(U32)。这个表象成因一定与我们之前看到的现象中的事物/活动……等等有直接联系,并且直接作用于服务对象,它往往是这个服务对象所必须的事物(U33)。在确定这个表象成因的时候,我们需要回答如下:

(Q47)你第一眼看到的表象成因是什么?

(Q48)是否存在已有的研究证明了你看到的成因确实是表象成因?

(Q49)如果没有,可否通过调研统计等方式拿出数据证明你看到的成因确实是表象成因?

(Q50)如果可以通过自己获得数据的方式来验证你看到的表象成因,那么何种方式合适?

(Q51)大致了解,是否还有其他的表象成因?

(Q52)如果你第一眼没有发现到表象成因,那么应该去了解总共或者可能有哪些表象成因,你感兴趣的是哪个表象成因?

(Q53)你看到的这个表象成因对问题的影响程度如何?

(Q54)这个影响程度是否重要到值得我们去研究?

(Q55)大致了解一下,其他表象成因对问题的影响程度如何?

(Q56)如果你目前看到的表象成因不重要,那么哪个重要的表象成因是你感兴趣的?

通过这种方式去限定找到你感兴趣的表象成因以后,那么这就是你在problem statement下要真正解决的问题,也就是一个被明确了的研究问题research problem(U34)。在表达研究问题的时候,我们把它写成“这个现象中造成我关注特性的表象成因”(35)。而研究的目的其实也就是“通过改进这个表象成因,我们可以改变(或正或负)我们所关注的现象中的我关注的特性”(36)。

为了方便大家理解,我们这里增加一个例子,拳击手的出拳力量不够大,一个重要的成因是营养不够,而营养不够是因为配餐中蛋白质的含量不够。这时候营养不够就是表象成因,他与拳击手的出拳直接相关,因为吃配餐的人是拳击手,配餐的营养直接作用于拳击手;而蛋白质含量不够就是根源因素,配餐过程本身与拳击手无关,因为配餐的人并不是拳击手。

Step 5 Mechanism与根源因素

在确定表象成因之后,我们需要再次分解这个表象成因以确定这个问题的根源因素(origin)。而为了更精准地找到这个根源因素,我们就需要知道这个表象成因是如何作用于我们的服务对象然后导致了我们的problem statement,即本章所说的mechanism,也就是这个问题发生的机制和规律。这里我们需要回答的问题是:

(Q57)这个表象成因自身是怎么产生的?

(Q58)这个表象成因的目的是什么?

(Q59)表象成因作用于服务对象的过程可以分为哪几个步骤?

(Q60)每个步骤的切分标准是什么?

(Q61)每个步骤中有哪些必要的关键要素(factor)?

(Q62)每个要素又分别对服务对象产生什么与特性相关的影响?

(Q63)每个要素是如何影响服务对象使得他产生了这些特性?

(Q64)是否有数据论证这些因素和影响是存在的?如果没有现成的请自行论证

(Q65)为什么这些因素在传递的过程中会产生自身的变化(变强变弱等等之类的)?

(Q66)这些因素在同一场景的不同环境下又有什么不同的影响?

这些对场景的切分、关键因素的确认、以及明白关键因素如何影响服务对象,就是这个问题产生的机制和规律,他可以论证这个问题为什么会发生以及为什么会以这种形式发生,也可以帮我预测下一次还是会这样发生,这就是我们所说的mechanism(U37)。

请注意这些步骤和因素可能有很多,让人眼花缭乱,但如果你仔细总结这些因素的话,就能发现很多因素其实都属于同一类。譬如工程管理专业常用的因子分析以及其他相关的数学工具,这时候就很有用了(U38)。

当你拿到统计数据去确定这些机制规律以后,采用数学方法就可以确定几类关键的因素(注意此时已经有几个变成了几类)以及他们的重要程度,这些就是我们所说的根源因素(origin)(U39)。这里一定要问自己:(Q67)你感兴趣的根源因素是哪个?请注意,你选择的根源因素一定要是重要的因素,但是它未必得是影响最大的因素(U40)。回到上文那个拳击手的例子,根源因素可能有好多个:蛋白质不够、水不够、油多了等等,而影响最大的可能反而是油多了,重要程度80%;然后水不够,重要程度74%;最后才是蛋白质不够,重要程度74%。但是你完全可以选择蛋白质,因为你的兴趣点就在这儿,所以蛋白质才是你这个研究里的根源因素。但是不管是哪个根源因素,它必须在你研究的学科领域之内,不能偏(U41)。

Step 6 Hypothesis与Research Question

当你拿到统计数据去确定问题的mechanism和你研究中的origin之后,你需要再深化你的研究并提出solution来解决你的问题,这时候就需要提出你的假设(hypothesis)和科学问题(research question)。

假设(hypothesis),它是指“使用某某方法可以解决这个research problem”(U42)。Hypothesis在整个研究层面先后有3个,第一个是初步假设,第二是方法假设,第三个是最终假设(U43)。

初步假设与上一章提出的origin有关,当确定你的origin以后,由于它本来就是一类原因,因此可以通过改变(或正或负等)这一类原因的某一类方式可以解决这个问题,它是我们最直观最先想到的解决方案,这就是研究的初步假设(U44)。初步假设就是“通过解决这个根源因素可以很好地解决这个问题”。

在完成初步假设以后,我们就需要发觉能解决这个根源因素的一类方法,这一类方法一定要抽象概括,而不是具体的某一个特定的技术,这就是方法假设(U45)。这里有个小技巧,这一类解决问题的方法往往可以取代原有产生问题根源的事物(U46)。举个例子,工业生产中检测产品生产速度的监控出现了不稳定性,然后一个重要的根源因素是限定时间内人工计数时的位置安排不合理,这是你发现使用自动化检测的方法可以有效解决人工计数时的位置安排不合理的情况,因此这时候的初步假设就是“通过使用自动化检测的方式可以 解决/提高 工业生产中检测产品生产速度的监控出现的不稳定性”,而被取代的产生问题根源的事务就是人工。这时候不需要在乎是自动化当中的哪个具体的技术方案,因为很多自动化的技术方案,如机器人、计算机视觉、人工智能、传感器等具体技术方案,其实都能解决这个问题,而且这一类方案本身也并不唯一(U47)。

在完成初步假设和方法假设以后,目前假设还太宽泛,还不能解决实际问题,因此我们需要再深化它,也就是找到具体什么技术才能有效解决我这个问题。在方法假设中我们提到了一类解决问题的方法,这时候你需要更深入地了解它,去分析哪种技术才是你想要的,这些具体的技术很可能不在你的学科领域内(U48)。这时候我们需要回答这几个问题:

(Q68)在这一类方法中,有几种合适的具体技术?

(Q69)针对研究问题本身的特点,这几种技术各自的优缺点又分别是什么?

(Q70)你首先感兴趣的技术是那种?

(Q71)为了更好地解决这个问题,你感兴趣的这种技术是否需要结合其他技术?

(Q72)如果可以结合,那么应该以何种方式结合?

(Q73)结合以后每种技术的作用各是什么?

一种技术是指一类具体技术,比方说我们选择了可视化这一类的方法,可视化这一类方法又有很多种技术方案,比方说AR、VR等等,到这一步我们就应该明确选择VR或者AR这一种技术,而不在说可视化这一类方法。同样的,上面的自动化属于一类方法,实现自动化就有AI、机器人等好几种技术。

在回答了这些问题以后,大部分情况下我们会选择1-2种技术方案,至于到底多少种是取决于这个问题本身的需要。这时候就产生了最终假设(U49),也就是“使用我们选定的这几种技术方案可以解决根源因素来带的问题”。在做报告和写进大论文时候,一般只写最终假设,不写其他两个。

在提出hypothesis以后,我们已经有了想解决这个问题的决心,不然你也不看到这儿。这里要养成一个习惯去不停问自己,不管你在哪里在干什么,你都要观察到这个真实的世界(U50)。

(Q74)可是这个常见的世界真的就应该是现在这个样子的吗?(Q75)目前这个习以为常的世界就真的不值得我们去质疑吗?(Q76)不然我们观察到的现象中又为何出出现这么多问题?(Q77)如果这个真实的世界不应该是现在这样子的话,那它到底应该是什么样子的呢?到这就引出了学术研究中一个重要的部分,即research problem中所包含的科学问题,也就是我们常说的research question。

Research question是指“当我们开始质疑现实中一个常见事物并发现它与理想的偏差时,为了解决这个问题并探究它到底是什么的时候,不管采用什么方法,这个问题本身有哪些东西是值得我们去思考的”(U51)。Research question只跟问题本身有关,而与具体解决技术无关,这也是为什么它被称之为科学问题而不是技术问题(U52)。它也与后面的解决方案中各个部分一一对应,它可以有好几个,但是不管有多少,这三个research question是少不了的(U53):

(Q78)到底什么才应该是表象成因的内容?

之所以选择表象成因而不是根源因素,是因为表象成因直接与服务对象有关,是整个现象中必不可少的一部分,是直接传递给服务对象的东西,而根源因素是伴随着现在的表象成因而产生的,只要表象成因被更改了,那么原本的机制和根源因素必然会发生变化,甚至会产生新的机制和新的根源因素,所以这里必须要改变表象成因(U54)。请注意,改变这个根源因素的方法必须其实是与你在方法假设中的一类方法和最终假设中的技术是一致的,因为这些技术本来就是为了改变根源因素而选择的(U55)。也就是说,表象成因是我们要解决的研究问题,根源因素是引出我们解决这个问题的技术手段(U56)。

至于表象成因的内容则是指它到底应该由什么事物组成,比方说上文拳击手的案例,对营养师来说表象成因是配餐那么它的内容就是配餐配出来的各个饮食的比例,因此这里的关键词是“content”(U57)。

请注意,对表象成因的内容划分也一定是在你的学科领域内(U58),所以我上文说的是对营养师来说,因为营养师只需要考虑什么才是最合理的配比,不考虑价格,哪怕贵一点都不要紧;而对经费有限的拳击俱乐部来说,要考虑的应该是如何在经费固定的情况下实现局部最优的餐饮配比。

(Q79)到底该采用何种方式才能使得服务对象感知/吸收/得到/实现/使用/执行/……等等这个被改变的表现成因?/或者说这个被改变的表象成因到底该采取何种方式来传递给服务对象?

简称为传递方式(U59)。请注意,这里的方式也必须是基于你选择的技术方案和方法假设,只是看怎么具体实现而已(U60)。这里的关键词是“get”(U61)。但是同样的,这里传递方式的划分也必须是在你的学科范围之内(U62)。

(Q80)到底采取什么样的方式才可以使得服务对象正确地 保持使用/始终执行/维持理解/……等等这个被改变的表象成因?

简称为保持方式(U63)。同上,这里的方式一样需要基于你选择的技术方案和方法假设,只是看怎么具体实现而已(U64)。而一次性实现和每次都能实现其实是不一样的,因此这里的关键词是“keep”(U65)。别忘了这里保持方式的划分也必须是在你的学科范围之内(U)。

这三个问题是必不可少的,实际上,这三个问题对应的也是服务对象完成一个活动/行为/……等等的一个完整过程(U67)。实际上绝大部分的研究都是在回答这三个问题(U68)。举上文拳击手营养不够的例子,那什么才是营养?也就是回答拳击手每天到底需要哪些营养、又需要多少,根据mechanism中的各个要素,还要考虑拳击手应该在何时吸收什么类型的营养又要吸收多少。接下来,什么才是营养传递给拳击手的方式?这也就是回答配餐怎么配,是一块煮牛肉加一杯牛奶,还是水果加鸡蛋?由于拳击手在训练不同项目所消耗的能量不同、效率不同,因此就需要早中晚的配餐各不相同互为补充,这就是机制对传递方式的影响。可是每天应该何时吃怎么吃才能使得运动员效果最佳呢?是一个小时一次每天都这么来,还是一周配餐各不相同这样才达到最好的吸收效果?这就是根据机制所制定的保持方式。

如果大家不能理解上面的research question到底是什么,这里有个小技巧可以帮助大家更好地实现它们。只不过我个人不太喜欢这种技巧,因为这会阻碍我们对问题本身的思考,但是对于初学者来说,思考过后再加上这个小技巧会有助于其找到这个问题本身的research question。这个小技巧就是把research question变成下面的问题(U69):

(Q81)如果现在的展示的表象成因内容不对,那么什么才应该是最终hypothesis中的技术方法真正应该表达的内容?

(Q82)如何使用最终hypothesis中的技术方法才能真正 表达/实施/执行/得到/……等等 所需的内容?

(Q83)如何使用最终hypothesis中的技术方法才能保持问题不再发生?

很多人是分不清假设和科学问题的,因此他们经常会把科学问题写成假设,也就是“是否这个方法可以去解决这个问题?”。为什么这么认为呢?因为简单,来得快,不用再花时间精力去分析它。这就是学艺不精还不主动思考的结果。

Step 7 State of the Art

确定hypothesis和research question之后,我们明白了要回答和思考的问题,这时候我们就需要了解最新的现状,也就是state of the art,国内常说成大论文的文献综述。其实说成文献综述并不合适,因为在这时候不应该只是查阅文献,还要查找现实中已经存在的软件、制度、研究项目等等已经被应用的新方法新技术新理念,有时候文献并不能代表现实中所有的成果,因此要查询所有一切可能的成果(U70)。实际上,欧美很多老师,包括我导师在内,压根就不care发文章,他们在乎你到底做了什么,他们展示科研成果的方式也并不是发文章,而是更倾向于通过视频展示的方式来告诉别人自己做了什么,即使没发文章他们的研究项目和成果也是确确实实存在的(U71)。所以我们在进行现状分析总结的时候,不能局限在文章上,而要看到整个世界。

当我们开始去总结最新现状以后,首先需要限定我们的总结范围,这个范围其实是与Step 2 Bound Your Research Scope相呼应的(U72)。很多成果看上去跟你现在做研究的都有相同的topic,使用了相同的技术手段,但其实他们背后的研究范围都不一样,如果你受到的学术训练足够,你一眼就能看出这些成果对应的阶段和服务对象与你的研究其实并不相同,其他3个研究范围往往也会不同(U73)。

在进行现状总结的时候,它应该与我们之前的research question一一对应,也就是根据research question来总结现状(U74)。因此state of the art 应该最起码是分为五部分(U75):第一部分是介绍mechanism,也就是说目前的practice是什么样;第二部分就是介绍你现状总结的范围(scope of solution review);第三部分是对应research question的第一个问题,也就是总结别人做的关于什么才是表象成因的内容;第四部分是对应research question的第二个问题,也就是总结别人做的关于什么才是表象成因的传递方式的内容;第五部分是对应research question的第三个问题,也就是总结别人做的关于如何保持服务对象正确使用的内容。具体怎么分析下文介绍。

在书写后三个部分的时候,应尽可能以技术本身来进行分类,即每个小节分别对应一个技术方案,然后先整体介绍这项技术本身被证明了可以如何解决这个问题,再挨个研究介绍每一项研究及成果(U76)。

Step 8 Developed Concept

处理完现状总结以后,我们需要对他们进行分析,看他们对这个研究问题解决到了什么程度。首先需要分析的是各个部分的concept。Concept,也就是概念认知,它是指:“当我们提到现实中一个真实存在的事物时,它到底应该是什么”,也就是人们对一件真实存在事物的认知(U77)。这个concept一定要是真是存在的事物,不能是凭空想象出来的东西(U78)。

当我们在分析state of the art的第三、四、五部分的时候,看上去这里有很多文献和成果,但如果大家仔细观察总结,这些文献和成果基本都有一个共同的默认前提,即大家认为这个东西到底应该什么,也就是整个文章背后的concept,包括目前实践中也是这样,他们做的所有东西几乎都是为了实现这个concept(U79)。举个例子,经济危机的时候奶农倒牛奶,用资本主义社会和西方经济学的理论,这属于经济规律,不倒就会奶农就会亏钱,他们就认为牛奶是商品,牛奶的价值是用来给奶农赚钱的,实现的是牛奶的商品属性,对资本主义和西方经济学来说,对牛奶concept就是“拿来赚钱的商品”。可是,为什么牛奶就一定非要成为赚取利润的商品呢?它为什么就不能以它的价值属性而存在,发给有需要的人让他们过得更加健康呢?也许对奶农来说这是亏钱的,可是对于社会整体来说这是有益的,这就是共产主义对牛奶的concept“让需要者健康的物品”。同样是牛奶,不同的认知就会有不同的处理方式,所以说,研究的首要任务是拓宽人们的认知(U80)。

当然我这么说大家还是会觉得很模糊不知道这个concept到底是什么,因此这里我们需要再次深入分析目前实践和前人研究,以得到我们这个concept。首先我们要根据research question来切分三个部分的concept,也就是说 表象成因的内容、传递被改变的表象成因的方法、服务对象保持使用被改变的服务对象的方法 这三个部分都要逐一切分,然后再合并起来(U81)。这些被切分的concept,我个人称之为sub-concept,也就是子概念,而三个子概念合并到一起才算是这个表象成因的真正concept(U82)。

我们一步步来解释,首先要先问表象内容的sub-concept组成:

(Q84)目前实践中的这个表象成因内容的sub-concept包含了什么信息/要素/组成……等等?

(Q85)目前实践中的这个表象成因内容的sub-concept是何时被产生?

(Q86)目前实践中的这个表象成因内容的sub-concept是由谁产生的?

(Q87)目前实践中的这个表象成因内容的sub-concept是在哪里产生的?

(Q88)为了实现目前实践中表象成因内容的sub-concept,有哪些预设的前提?

一个concept,是针对一个研究问题的,但是这个问题和现象还会有一个更大的从属范围,因此就需要对这个更大的从属范围进行假设,不然就会出现外部因素干扰concept的情况,毕竟外部因素是属于另一个research topic(U83)。举个例子,牛顿的经典力学,其concept的预设前提就是绝对的时空观,而这个预设前提后来被爱因斯坦打破了,因此我们需要抓这个预设前提。前四个问题是属于concept,而第五个问题不属于concept,是自己要挖掘的(U84)。在举一个例子,什么才是社会主义?先后经历了巴黎公社、苏联和中国三次实验,对社会主义产生了不同的解释。还有一个例子是黑天鹅的案例,一开始人们认为天鹅是“一种有着什么特征的白色禽类一般何时在哪做什么事”,后来出现了黑天鹅就发现原来天鹅并不全是白色的。这时候得到的目前实践中的表象成因内容的sub-concept是,目前实践认为这个 表象成因内容 应该是“在何时被谁在哪里做出来了什么东西”(U85)。

接下来是总结前人研究中表象成因内容的sub-concept,这里我们需要回答:

(Q89)前人研究中的这个表象成因内容的sub-concept包含了什么信息/要素/组成……等等?

(Q90)前人研究中的这个表象成因内容的sub-concept是何时被产生?

(Q91)前人研究中的这个表象成因内容的sub-concept是由谁产生的?

(Q92)前人研究中的这个表象成因内容的sub-concept是在哪里产生的?

(Q93)为了实现前人研究中表象成因内容的sub-concept,有哪些预设的前提?

(Q94)前人研究中的sub-concept是否实现了这个现象活动本身的目的?

这四个可能每个比之前的都是新的,当然也可能不是每个都是新的(U86)。我们现在假定它们都是新的,所以总结起来就是,前人研究中认为这个 表象成因内容 应该是“在另一个时间被另一个谁在另一个地方做出来了另一个什么东西”(U87)。

目前实践和前人研究的sub-concept未必就是真好,因此我们需要对他们进行分析:

(Q95)从特性角度说明,目前这个sub-concept在解决这个问题时有哪些局限缺点?

(Q96)除此之外还有哪些局限缺点?

(Q97)目前这个sub-concept的预设前提在解决特性上有哪些缺点局限?

(Q98)目前这个sub-concept在解决根源因素上有哪些缺点局限?

(Q99)目前这个sub-concept不能很好地解决机制中的哪些要素?

(Q100)关于这个sub-concept,你期待的未来是什么样?

(Q101)为什么非要这么期待?

(Q102)大致说明,你的期待会对目前这个研究问题带来怎样的积极影响?

(Q103)大致说明,你的期待会对将会怎样重塑这个行业?

(Q104)结合你之前选择的技术方法的发展情况,你的期待可否在现有技术条件下实现?

请注意,这时候就出现了一个很重要的东西,叫做vision,中文可以称之为“远见”。这个vision是指“未来这个事物的形态就是如你现在的研究成果”(U88)。它只与问题和现象本身有关,与你对行业的重塑有关,与使用什么酷炫的技术无关(U89)。比方说你使用了人工智能,这是个很酷炫很强大的工具,但是如果你只是简单地使用了某个AI算法去分析数据,但是却回答不出为什么非要以这种方式去分析数据,这说明你使用AI的方式不对,那么你做的就必然与现实脱节,也不能解决实际的问题、不能解释这个真实的世界,自然就不可能去塑造这个行业未来的形态。

我们真正需要发展的,是一个带有vision的sub-concept,它一样可以有效解决我们的research question,并且比目前实践和前人研究的sub-concept还要新,也就是一个发展了的sub-concept(developed sub-concept)。为了得到这个带有vision的sub-concept,的这里我们一样要回答这些问题:

(Q105)我研究中的这个带vision的sub-concept包含了什么信息/要素/组成……等等?

(Q106)我研究中的这个带vision的sub-concept是何时被产生?

(Q107)我研究中的这个带vision的sub-concept是由谁产生的?

(Q108)我研究中的这个带vision的sub-concept是在哪里产生的?

(Q109)我研究中的这个带vision的sub-concept是怎样解决根源因素的?

(Q110)我研究中的这个带vision的sub-concept是怎样解决机制中的各个要素的?

(Q111)我研究中的这个sub-concept有哪些预设前提?

(Q112)我研究中的这个sub-concept的这些预设前提是否会产生特性上的问题?

(Q113)我研究中的这个sub-concept是否实现了这个活动现象本身的目的?

(Q114)我研究中的这个sub-concept是否实满足了服务对象自身的需求?

同上,这四个可能每个比之前的都是新的,当然也可能不是每个都是新的(U90)。我们现在假定它们都是新的,所以改变后的sub-concept就是,我的研究认为这个 表象成因内容 应该是“在一个更新的时候被一个更新的谁在一个更新的地方做出来了什么更新的东西”(U91),而且这个新的concept可以很好地解决根源因素和机制中的要素。

这样我们就得到了表象成因内容的sub-concept,但是还有两个部分的sub-concept需要我们去发展。这两个部分在目前实践、前人研究和本人研究中要问的问题几乎一致,但是要多问几个问题。当分析传递方式的时候,算上重复问的问题62个,我们在分析自己研究中的三个sub-concept时每一个分析都还要多问的问题是(U92):

(Q177)这个sub-concept能否准确传递表象成因内容的全部信息?

(Q178)如果不能,为什么?

(Q179)这个sub-concept不能有效解决机制中的哪些因素从而使得根源因素依旧存在?

当我们分析保持方式的时候,在分析三个sub-concept的过程中每一个分析都还要多问的问题是(U93):

(Q180)这个sub-concept是否有效地与传递方式结合起来了?

(Q181)如果没有,为什么?

(Q182)这个sub-concept是否能稳定准确地传递表象成因内容的全部信息?

(Q183)如果不能,为什么?

(Q184)这个sub-concept不能有效解决机制中的哪些因素从而使得根源因素依旧存在?

到这里我们就得到了3个sub-concept,分别是,一个带vision的表象成因内容的sub-concept,一个带vision的传递方式的sub-concept,一个带vision的保持方式的sub-concept。这时候我们需要明确他们之间的关系,算上重复的问题16个,需要回答:

(Q201)这些sub-concept之间彼此的关系应该是什么样?

(Q202)这些sub-concept与服务对象之间的关系又应该分别是什么样?

这四者之间的关系就是概念框架,也就是concept framework(U94)。理清了这些sub-concept之间的关系以及与服务对象之间的关系,我们就需要把这三个sub-concept给拼起来形成这个发展了的表象成因的concept,也就是developed concept(U95),它的作用是拓宽人们对一件真实存在的事物的认知,对目前实践和前人研究都要这样拼。一般来说,拼成的形式是:“何时谁在哪里做出了一个什么东西,通过什么样的方式传递给服务对象并且怎么样去保持正确使用”(U96)。

Concept发展的整个过程我们称之为concept fluidity,翻译过来就是概念认知变化,也就是讲concept是如何以及为什么变化发展到你提出来的这个(U97)。

为了方便大家理解,这里我多举几个例子。地心说到日心说的革命过程,在长久的世纪里,欧洲主流的concept就是地心说,直到伽利略发现了支持日心说的观测证据从事实上证明了地心说的模型是不准确的;此时支持日心说的人的concept是地球围着太阳转并且轨道是圆的,但是这个concept又与现实证据产生了偏差,也就是现有解释模型的准确性出现了问题,之后开普勒算出椭圆轨道以后才带来了日心说的胜利,这时候日心说的concept就是地球围着太阳转并且轨道是椭圆的。这个日心说发展的过程就是concept fluidity,也就是人们认为自己的宇宙到底是什么。

另一个例子是氧气的发现过程。一开始人们认为物体能燃烧是因为存在“火微粒”,也就是存在几百年的燃素说,它曾经统治化学界长达百年之久。普利斯特里是第一个发现氧气的人,可是由于他本人没有脱离燃烧素的concept,所以他将氧气命名为“脱燃素空气”,还是没有脱离燃素说的concept范畴。直到拉瓦锡的出现,论证了燃烧作用的氧化学说,清楚解释了燃烧前后质量的平衡性,才彻底推翻了燃素说,建立了氧化说,对应的也是一个concept的发展,也就是concept fluidity。

说到这里大家发现了吧,当你研究中的concept被论证是正确的以后,人们普遍接受了你的论说,这时候你提出的concept就成了目前实践,你做的研究就成为了前人研究(U98)。随着人类社会的发展,每一个目前实践的concept都可能被推翻,每一次推翻都带来了人类认知的进步(U99)。然而到这里只介绍了一个concept而已,还远没有到科学革命的时刻,路还很长,为了更接近科学革命,就需要发展一个通用性的methodology。

Step 9 Developed Methodology

Methodology,不是方法,而是方法论,是指“当我们处理一类问题的时候所使用的一类具有抽象性概括性并存在步骤的通用方法”(U100)。它需要抽象概括,而不涉及到具体技术、设备、方法等等(U101)。

在你的研究范围下,这些前人研究的文章可能有成百上千,但是如果你仔细看,就会发现他们其实都是基于同一个concept和同一个methodology,而这个前人研究里的methodology其实就是为了实现前人研究中的concept的(U102)。Methodology在最初产生的时候一定是伴随着一个concept,也就是为了实现一个concept而产生了最初的methodology(U103)。到后面methodology是会再次得到发展、发生变化的(U104),具体后面说。

在分析methodology的时候,我们也需要像分析concept一样来对三个部分一一分析,也就是先来子方法sub-methodology(U105)。这里需要回答的问题是:

(Q203)为了实现目前实践中的这个表象成因内容的concept,需要包含哪些事物?

(Q204)为了实现目前实践中的这个表象成因内容的concept,形成这些事物的对应技术方法是什么?

(Q205)为了实现目前实践中的这个表象成因内容的concept,这些对应的技术方法又分别属于哪一类方法?

(Q206)为了实现目前实践中的这个表象成因内容的concept,这些事物之间应该是什么关系?

(Q207)为了实现目前实践中的这个表象成因内容的concept,事物应该按什么样的顺序来?

在书写的时候只写那一类事物和方法(U106)。这时候我们就得到了我们的sub-methodology,也就是“每一步用哪一类的方法得到了一个什么事物,并且按顺序经过这些步骤最终实现了我们的sub-concept”(U107)。对于传递方式和保持方式也是同样的做法,前人研究和你的研究也都是要这么去问,而在分析目前实践和前人研究的时候,算上重复的问题数10个,还需要多问的一些问题是:

(Q213)这两个部分(内容和传递/传递和保持/保持和内容)之间是通过什么事物/哪些类别的方法去联系起来的呢?

(Q214)当事物全部联系起来以后,完整的顺序又是什么样?

我们上文说了,我们关注的现象本身都具有广泛存在、可循环、会反复出现的特点,而表象成因本身也就是这个现象中必不可少的一个部分,因此这里的完整顺序也几乎都有一个循环(U108)。

(Q215)为了实现目前实践中的这个表象成因内容的concept,前面几个问题的答案在我们关注的特性上又有什么缺点局限?

(Q216)除此之外还有什么缺点?

(Q217)为了实现目前实践中的这个表象成因内容的concept,前面的几个问题的分析能不能很好地解决这个问题的根源因素?

(Q218)为了实现目前实践中的这个表象成因内容的concept,前面的几个问题的分析能否很好地解决这个问题的机制中的重要要素?

分析完了目前实践和前人研究在sub-methodology上的limitation之后,我们需要提出自己的sub-methodology,对应的也是三个部分分别提问然后拼起来(U109),算上之前重复的问题11个,以表象成因为例,因此这里要问的问题是:

(Q230)为了实现我提出的这个表象成因内容的concept,需要包含哪些事物?

(Q231)为了实现我提出的这个表象成因内容的concept,形成这些事物的对应技术方法是什么?

(Q232)为了实现我提出的这个表象成因内容的concept,这些对应的技术方法又分别属于哪一类方法?

(Q233)为了实现我提出的这个表象成因内容的concept,这些事物之间应该是什么关系?

(Q234)为了实现我提出的这个表象成因内容的concept,事物应该按什么样的顺序来?

(Q235)为了实现我提出的这个表象成因内容的concept,事物应该按什么样的顺序来?

(Q236)这一个sub-methodology可否解决我的根源因素?

(Q237)这一个sub-methodology可否解决机制中的重要要素?

(Q238)这一个sub-methodology可否在现有人类社会发展条件下实现?

按同样的方式得到了自己研究中的三个sub-methodology,然后将三个部分拼在一起就形成了一个完整的过程/循环,这个过程/循环并不是methodology,而是工作流程work flow(U110)。上文有说过的,methodology是方法论,是“当我们处理一类问题的时候所使用的一类具有抽象性概括性并存在步骤的通用方法”,而这时候我们三个sub-methodology拼在一起还太具体太复杂,还不够抽象概括,因此我们需要用两个半加半的步骤(U111)来抽象概括出真正的methodology。

第一个步骤(U112)是得到你这项研究本身的methodology,这个其实很简单,就是把上面那么多的步骤简化成三步,每步说实现哪个concept就行了……没错就是这么简单粗暴又高效……就是第一步实现表象成因的内容,然后再实现表象成因内容的传递方式,最后实现表象成因内容的保持方式,这也就是解决你目前这个research problem的方法论。

第二个步骤就有点难度了,这需要很强的归纳总结抽象能力,是从一个问题抽象概括到一类事物当中,并且还要再次抽象概括到一类解决问题的通用性方法(U113)。首先是对问题本身的抽象概括,这个过程与表象成因和根源因素有关,这时候要问:

(Q239)这个表象成因的目的/作用/价值/意义……等等是什么?

(Q240)除了你现在的研究之外,不管什么学科,在各自的现象中是否都存在着同样目的/作用/价值/意义……等等的表象成因?

(Q241)除了你现在的研究之外,不管什么学科,在各自的现象中是否都存在着与你根源因素同属一类的根源因素?

如果各位仔细观察,就能发现其实很多学科的不同现象,其实都有一个同类的表象成因和根源因素,所以这些表象成因的内容和根源因素其实都是都有一个可以提炼出的共同点,这两个个被提炼出的共同点就是这一类现象所面临的共同问题和共同根源(U114)。所以这时候你需要再抽象概括你解决你目前这个research problem的方法论,将他们的内容从你提出的一些适应你学科的具体表达变成一个适应形容解决这个被提炼的共同问题的表达,要能覆盖到更多的范围(U115)。

因此我们首先需要解释这个从很多学科不同现象中提炼出来的共同问题到底是什么,接下来就还是按那三个部分来阐述一个被再次抽象概括的方法论,也就是“针对这一类问题,我们首先需要实现那个被抽象概括的表象成因内容,然后实现那个被抽象概括的表象成因传递方式,再实现那个被抽象概括的保持方式”(U116)。

接下来就是那半个步骤,之所以说是半个,是因为这个步骤不是在任何情况下都会成立,实际上大部分情况下可能都是不成立的(U117)。刚刚说了要抽象到一类问题,但实际上,这个表象成因也有可能是存在于或者几乎存在于所有问题中的(U118),如果它存在,那就针对所有现象再提出抽象概括,这往往就是我们所说的某某哲学的雏形,毕竟它现在还只有壳而没有内容(U119)。这里举马克思主义哲学的例子,这套哲学的理念是通用于所有问题或者几乎所有问题——面对所有问题时,被分析的内容到底应该是什么?辩证唯物论和认识论;使用者该如何才能使用这些被分析的内容呢?唯物辩证法;使用者如何保持去理解这些被分析的内容呢?唯物史观。大部分的研究都只能抽象概括到第二步,而一个优质的研究必须抽象概括出第二步,至于最后那半步则是视情况而定(U120)。这半个步骤的产生,跟选题有很大关系,如果选的题目本来就具有通用性,那么就容易得到这半个步骤(U121)。对methodology的分析和concept一样都要写进state of the art里面(U122)。

(Q242)但是methodology就只能是methodology吗?

其实未必,methodology的出现最早是为了解决一类问题,可是随着随着人们对这个methodology的深入使用,就渐渐发现了这个methodology自身的一些模糊之处,使得人们不得不去发展这个methodology自身的内涵,这时候methodology就从变成了一个concept(U123)。

为了方便大家理解,这里举一个例子。土木建筑领域的热门领域Building Information Modeling(BIM),它最早提出的时候是一个methodology,也就是用包含数据库对象库的三维设计方法。提出者针对信息源不统一带来的信息偏差问题,先统一了需要的信息并建立了数据库(content),为了get而建立了可以表达信息的三维设计工具building description system,而keep则是从数据库里面选取绑定信息的对象组成建筑物并可以交给施工团队。所以当时这个研究抽象到第二层的methodology就是“碰到建筑设计信息源不统一的时候,先建立数据库,然后使用附带信息的三维图形设计工具,最后通过选定对象而设计建筑”。可是在人们使用的过程就发现,使用这个methodology去进行建筑设计倒是挺不错,但是这个统一的数据库到底应该是什么呢?这就有了 BIM 4D(进度) 5D(成本)等概念的出现,也就是说人们拓宽了关于BIM数据库的认知。至于说使用附带信息的三维图形设计工具,那什么才应该是三维图形的设计工具呢?这时候就有了IFC(工业基础类,跟数据格式有关)的出现,使得BIM模型中展示的数字模型更加精准更能满足各方的需求,也就是人们拓宽了关于BIM模型表达的认知。通过选定对象而设计建筑,那么什么才是设计中选定的对象呢?这时候就有了BIM元件(最基本的设计组成单位,如门窗柱等)和族库(一类相同的元件)的概念,也就是说人们扩宽了关于BIM设计的认知。当然具体被拓宽的认知有很多的,这里我只是随便举几个细节而已,目的是说明从methodology到concept的转变过程。

(Q243)除了concept之外,methodology还能变成什么?

它还可以变成mechanism(U124)。前文说了,发展concept的目的是扩宽人们的认知,如果别人已经接受了你的concept,那么也必然会接受你的methodology,这时候你的concept和methodology就变成了目前实践从而取代了原来人们认知的concept和methodology(U125)。即使你的研究形成了目前实践,随着人类科学知识的进步与发展,methodology也一定会变成mechanism,从而引出新的研究问题(U126)。

举个例子,笛卡尔的《方法论》相信很多人都看过,里面的methodology就是四步:1. 不接受任何我自己不清楚的真理,即怀疑一切;2. 要研究的复杂问题,尽量分解为多个比较简单的小问题,一个一个地分开解决;3. 小问题从简单到复杂排列,先从容易解决的问题着手;4. 问题解决后,再综合起来检验,看是否完全,是否将问题彻底解决了。第一点是讲态度或者学术世界观,这个不属于我们所说的三个部分。第二点好说,对应的concept是什么才是问题(content);第三点对应的concept是如何解决问题(get);第四点对应的concept是如何保持/确保自己对问题的解决是完全的(keep)。这个methodology在很长的一段时间里都帮助了人们分析问题解决问题,极大地促进了西方科学的发展,成为了目前实践。但是随着阿波罗登月计划的出现,出现了航天航空工程的复杂项目问题,人们发现这些复杂问题是无法按笛卡尔的方法论去解决的,这时候笛卡尔的方法论就成了mechanism,根源因素就是遇到什么都问题拆解。所以人们首先就回答了什么才应该是问题——它可以很复杂有很多相互影响(content);接下来回答了使用者如何分析问题(get)——系统工程分析问题的方法;使用者如何顺利地保持解决每个被改进的问题(keep)——系统工程的管理制度。这三个在一起被发展的就是后来的系统工程学。

讲完了methodology可以发生的变化,终于可以讲那两个半加半的最后半个步骤了,因为这一步与methodology的变化息息相关(U127)。之所以说是半个,是因为它是与上半个步骤绑在一起的(U128),如果上半个步骤不出现,那么这半个步骤也必然不会出现;即使上半个步骤实现了,这半个步骤也不是每个人都有能力做出来的(U129)。那这半个步骤到底是什么呢?当methodology提炼到上半个步骤的时候,其实就已经可以成为concept了,因为一个适用于所有问题且只有三个步骤methodology实在是太宽泛了,形成的只是一个哲学的壳子而已,别人压根就不知道怎么用,这时候就应该给出一个抽象性概括性的workflow,也就是别人拿到你这套哲学的雏形具体应该怎样一步步地去使用(U130)。回到上面马克思主义哲学的例子, 如果只跟别人讲辩证唯物论和认识论、唯物辩证法和唯物史观,那么别人是无法知道这些名词的具体内容的,也不知道该如何实现它,因此我们需要再次按上文sub-methodology的处理方式去形成这个workflow(U131),这时候别人就知道如何具体地去使用你发展这最后半个methodology,譬如马克思哲学的具体内容。这时候哲学的壳子就有了内容,哲学的壳子就变成了真正的哲学(U132)。

另一个例子直观的就是本人的学术训练体系,如果我光说:第一步明白什么才是研究,第二步用来训练学生,第三步教学生写作,你一定还是不明白我到底说的啥,这时候就需要像本文一样有一个详细的workflow,这时候读者们就可以顺着我这个workflow去做研究,也很清楚每一个名词的概念是什么。

Step 10 Prototype ,Validation与Outcome

Concept和Methodology发展完了以后,就应该去把它们落地而且还要验证看它们对不对,这时候我们就需要做出一个实现concept和完成methodology的prototype,也就是原型,或者说结果原型(U133)。

当你做出workflow的时候其实心里就已经有了一个大概的想法,集这个东西做出来了以后应该是个什么东西或者什么样子,下一步需要得到的是系统框架system architecture,也就是为了实现你的workflow,你需要哪些具体的一类工具(U134)。这时候需要回答:

(Q244)workflow中的每个部分应该使用哪一类的工具去实现?

软件硬件什么的工具都可以,但是请注意这里千万不要出现具体的工具名称(U135),而是找到可以实现这个部分的一类工具名称,比方说TensorFlow可以实现,那就不能写一个TensorFlow,而是写AI工具或者AI软件,因为TensorFlow本身就属于这一类工具。

(Q245)除了工具之外是否还包括了其他必不可少的事物?

比如说环境、人、现象、活动等等等等,他们是整个环节中必不可少的事物,但是又不属于工具。

(Q246)这些工具事物彼此之间的关系和顺序又是什么样?

请注意,这点必须与workflow高度一致。

(Q247)他们又分别属于concept中的那一部分?

在回答这些问题之后,prototype每个部分怎么实现就已经非常清楚了,整个prototype就几乎已经呼之欲出了。但其实此刻还少了一部分:

(Q248)整个prototype中的三个部分都是集中在哪里显示出来的?

问到这里,就出现了这个研究课题的研究目标research objective,它是指“为了实现我的研究,有哪些具体的事是需要我去做的”,对应实现完成prototype的三个部分(U136)。而这个集中的东西,往往就是实现prototype的关键所在,是人们直接使用prototype且最直观感受到concept的关键所在,它也将会成为你outcome的一部分(U137)。

当弄清楚prototype做出来应该是什么样以后,也清楚该使用哪几种技术去实现解决这个问题以后,就面临了一个重要的问题:

(Q249)这几种技术到底应该怎么使用才能更好地在你研究问题里落地去实现prototype呢?

这个问题很重要,因为有时候这一种技术可以解决这个研究问题,但这并不意味着这种技术中的每个技术手段都能解决这个问题。举一个例子,我们确定了AI这一种方法可以解决这个问题以后,就需要明确到底哪种AI技术手段可以解决这个问题,到底是CNN还是RNN?如果是RNN,那到底怎么做才能使得它适合我这个问题的情况?有了这种启发式的思考,我们就可以寻找这些问题的答案:

(Q250)这几种技术本身有哪些实现的过程和步骤?

比如RNN的实现过程有哪几步。

(Q251)每个实现的过程和步骤都有哪些可能的实现方式?

比如RNN的实现方式可以有Bi-RNN或者LSTM。

(Q252)根据我的mechanism,哪种实现方式更合适?

比如你的mechanism中出现了明显的间隔和延迟,那LSTM应该才是最合适的。

(Q253)如果这个方式更合适,为什么?

(Q254)当我们确定了一个最合适的方式后,那么如何修改它才使得这个方式可以解决mechanism中的重要因素?

这里人们往往会产生一个误区,也就是solution水平的好坏是取决于使用的技术水平的高低,就是使用的具体技术或者prototype越高级越酷炫就越说明solution和prototype好,这是完完全全错误的想法,solution的好坏是以对research problem的解决程度来评价的,越能从根源上解决我的research problem就说明这个方法越好,哪怕落地的技术实际上很简单都行(U138)。这点很重要,使用技术的时候不能生搬硬套,而是根据这个问题本身的特性去修改这项技术,使得这项技术可以真正与你的问题特点匹配。比如说同样使用LSTM,在不同学科里,要遗忘和记住的东西并不相同,遗忘的节点和顺序也并不相同,这时候就需要调整修改LSTM最初的结构,使它更适应这个research problem的特点。而workflow每一部分的实现方式和连接方式,就被称作方法/方式method(U139)。

(Q255)确定了一个被修改的方式,workflow中的其他部分又该怎么修改?

(Q256)当确定了全部被修改的方式以后,他们之间的具体连接方式是什么?

(Q257)这些连接方式是否会造成信息或者要素的丢失?

(Q258)如果会,为什么?

(Q259)如果会该怎么修改才能使得mechanism里的全部信息全部存在?

通过对三个部分进行这样的提问,就可以确定采用什么样具体的技术方式可以解决这个问题,这时候一个完整的prototype就产生了。

为了方便大家理解,这里举几个例子。

一个是LSTM的产生过程。LSTM的发现过程是因为最初的RNN在识别包含时序的内容中出现了很大的错误性,这个现象就产生了一个偏差,没有满足人们需求,因此这个问题就值得我们研究。表象成因是学习内容的方式有误,通过RNN目前实践中的学习内容机制就发现了根源因素是时序分辨有误。因此什么才是学习内容的方式?增加时序机制和保存机制。什么才是学习内容方式的执行方式?计算模型。什么才是保持时序分析总是正确的方式?将长期记忆的重点放到工作记忆中去。至于LSTM的prototype完成的过程,与本文介绍的内容一致,分别是输入门、遗忘门和输出门,分别对应三个concept。Prototype就是整个算法,而这里面的集中就是LSTM区块(Blocks)。

另一个例子是冷冻电镜。含有水的生物样品无法在透射电镜高真空的环境下保存,而且生物样品会受到电子束强大的辐射作用变质,这就是产生了一个偏差,没有满足人们的需要,因此需要研究它。然后人们发现低温状态下可以不破坏样品,表象成因就是电子辐射,根源因素是真空中的温度,这时候“低温可以解决电子辐射这个问题”就成了方法假设,并一步步地引出了冷冻电镜的发展。2017年诺贝尔化学界授予了三位对冷冻电镜做出了巨大贡献的学者,按产生的时间顺序,冷冻电镜concept的三个部分分别为:1.“什么才是保持电子辐射可以一直正确执行的方式?”1980s,雅克·杜波谢;2. “什么才是服务对象(这里是电镜使用者)获得电子辐射内容的方式?”1975-1986阿希姆·弗兰克;3.“什么才应该是电子辐射?” 1990,理查德·亨德森。Prototype就是冷冻电镜的设备,还挺大的,集中的就成了那个大箱子一般设备。当然,如果本人学的是化学并且成为了化学专家,那么这三个部分会由本人团队独立完成。

所以讲到这里,各位发现了没?那个集中的东西,几乎都是属于传递方式的一部分(U140)。

当你做出一个符合developed concept和developed methodology的prototype之后,还需要验证这个prototype是否能解决你的问题。这时候就一定要经过验证validation,测试是需要数据来支撑的,对任何学科都一样(U141)。只不过不同学科获得数据的方式大不相同而已(U142):对于工程学,这个好说,进行现场实测就好;对于自然科学,则是先采集到现实世界的证据,然后看提出的理论模型或者技术方案是否与真实世界的数据对得上;人文社会科学就麻烦了一点,要看这个理论对社会本身的解释状态和影响结果,这个过程会非常漫长,几十年甚至几百年都可能,譬如马克思提出科学社会主义后,先是巴黎公社,接下来是强大却失败了苏联,然后是社会主义阵营,到现在社会主义的顶梁柱是一个坚韧而强大的中国,这中间再出现了周期性的资本主义危机,这个validation的过程就很漫长,先后经历了百来年,但整体上确实验证了马克思的基本理论。但不管是什么学科的验证,都需要回答这几个问题:

(Q260)验证的结果是否解决了这个问题的特性?

(Q261)验证的结果是否解决了机制中的重要要素?

(Q262)验证的结果是否解决了根源因素?

(Q263)验证的结果是否验证了你的假设?

(Q264)验证的结果是否证明了prototype实现了developed concept?

(Q265)验证的结果是否证明了prototype实现了developed methodology?

(Q266)别人是否认同你的developed concept?

(Q267)如果大多数都不认同,那么哪里有问题?

(Q268)别人是否认同你的developed methodology?

(Q269)如果大多数都不认同,那么哪里有问题?

(Q270)你这个prototype又有什么不足之处?

一般来说这个不足之处跟你的预设前提有关系,但是并不是绝对的,也可能与其他因素有关系。

这里之所以不问别人是否认同你的mechanism,是因为大部分的使用者是不会也没必要去看到这个mechanism,即使是在学界,以大部分学者的学术水平也不会想到去揭示这个mechanism。而做到这一步,就实现了一个研究的聚焦focus,也就是这个研究到底要在你的学科领域内解决什么样的一个问题(U143)。

研究过程的最后是总结这个研究的成果outcome,也就是可以被他人所借鉴的学术实体(U144)。outcome里最重要的是三个(U145),那就是揭示一个规律机制(mechanism),扩宽一个概念认知(concept),发展一个通用性的方法论(methodology)。这三个部分也被成为研究的理论部分,到这一步,你才真正实现了创新,达到了必要的学术深度academic depth(U146)。而contribution,则是指你的工作能改变什么,一般上面说的三个outcome,如果次一点只发展了methodology或者method也可以接受,但是一定要能改变什么才叫有contribution(U147)。当然,outcome也可以包含更多的内容,多是加上一个可以让人借鉴发展的prototype,以及这类问题在解决的时候一些注意事项(比方说这个技术手段在这一类问题上要怎么选等等)(U148)。

看到这里,我们就做完了一个完整的研究课题research project,一般对应的就是一个博士论文或者面上基金的量(U149)。

如果你这个research project做得好,那么你的outcome就可以形成一个范式paradigm(U150)。范式这个词,大家在《科学革命的结构》一书中经常见,它对范式的形容其实没有错,解释得比较晦涩,如果这本书的读者受到的学术训练不够,那其实对书里面说的“默认前提”的概念是很模糊的。

(Q271)那范式到底应该是由什么组成呢?

一个范式其实是包含这些东西(U151):1、一个被验证且被人们广泛接受认同的concept,也就是教科书里直接告诉你的东西;2、一个被验证且被人们普遍接受认同的methodology,使得这个methodology最终变成了目前实践,产生了新的表象成因和mechanism,这个过程很可能是漫长的;3、一个被验证且被人们广泛接受认同的mechanism;4、广泛的支持者;5、变化成concept的methodology,这点也很重要,被发展才说明methodology是有潜力的;6、一个可以被人借鉴并且发展的prototype;7、人们把以上六点当成是进行研究、讨论事情的默认前提,也就是可以被写进教科书里的东西。

这里大家要请注意一点,什么citation 什么ESI,这些都不叫范式(U152),因为这些都可以通过操作给弄出来,比如某人citation很高还拿了ESI,但实际引用的都是他那个大团队的人,或者是双龙戏珠几个团队之间互相引用,这时候你查ESI来源的时候就发现引用者都非常固定,而且都跟作者有各种关系。还有的citation高是因为做这个领域的人多(U153),因此这个领域的citation普遍高。真正的默认前提是你这个领域的所有研究者都认同你的mechanism、concept和methodology,他们一定是来自不同国家不同学校的,很多都与你毫无联系。而有些重大的科研成果,其实压根就没什么引用,因为很快就被写进教科书里去了(U154),因此不要看citation和ESI。真正评价学者学术水平的,是看他的工作可以改变什么(U155)。

范式的替代过程是很漫长的,一个重要的原因是范式是与当时的现实匹配的,除非采集数据的方式发生了变化从而用采集到的最新证据验证了范式的错误,否则范式还是会保持(U156)。譬如亚里士多德的力学理论认为力是物体产生运动的原因;后被牛顿的理论所否定,认为力是改变物体运动状态的原因;再后来就是爱因斯坦的相对论力学取代了牛顿的经典力学并形成了范式;这中间的变革时间是非常漫长的。

而那些形成范式的成果被分析出来的过程其实跟本文介绍的过程是一样的。接下来本人就以那些已经形成范式并且深刻改变过世界的优质研究作为例子来比较,也当是对本文介绍的研究过程进行验证。

先举马克思主义的例子。大家应该也发现了,我在这里多次列举了马克思主义的例子,本人是信仰共产主义的,因为它所描绘的美好生活即是本人所期待的世界。至于共产主义怎么样、各位信不信共产主义这里先不讨论,但是就事论事来评价马克思的学术能力,绝对世界上最顶尖的那一批,如果各位看完本文对学术研究的过程还是有些迷茫,建议拿着本文去跟马克思主义中分析问题解决问题的过程去对应,然后看着看着你就能看懂了。言归正传,马克思主义分为三大部分:马克思主义哲学、马克思主义政治经济学和科学社会主义。一开始马克思观察到的是社会中出现了人与人不平等的现象,表象成因是人们拥有的财产不同,根源因素是生产资料私有制。Mechanism就是马克思主义政治经济学,concept就是科学社会主义,methodology实现了两个半加半的抽象形成了马克思主义哲学。而concept中三个部分是这样划分的——什么才应该是人们拥有的财产的内容?生产资料公有制,也就是共产主义;什么才应该是实现生产资料公有制的方式?暴力革命。什么才应该是保持生产资料公有制的方式?无产阶级专政。所以马克思主义的产生过程是符合本文介绍的这个研究过程的。而这个比较的过程,包括全文中出现的比较过程,称为abduction,也就是溯因推理,就是先根据事实归纳出一套解释,然后再演绎到更大更抽象的范围来验证这套解释是否通用性符合,如果符合则验证了我们的解释是正确的,对应的假说就是学术研究的过程如本文所示,然后去在各个学科各种类型研究的经验中去比较验证,如果符合则是正确的。而马克思主义的产生过程也是abduction,先提出阶级假说然后对应到人类社会的各个阶段,结果发现假说成立,这就是abduction。

黎曼积分,也就是我们所说的定积分,也是符合这样的研究过程。最早积分是牛顿和莱布尼茨提出来的,但是他们提出的积分方式是没有考虑级数是否收敛的,导致计算出现了严重的不准确性,也就是我们所说的偏差。表象成因是积分定义错误,根源因素是dx的划分有问题。而黎曼就解决了这个问题。那什么才是积分定义的内容呢?黎曼和。什么才是积分定义的实现方式呢?区间切割。什么才是保持新的积分定义的方式呢?黎曼积分公式。

还有一个就是现代遗传学之父孟德尔的例子,也就是孟德尔杂交。当初孟德尔在修道院里面种了很多花,每年都会开出五颜六色的花朵。这时候孟德尔就开始好奇,为什么这个现象会这样?对于遗传,目前实践认为遗传是混合过程,前人研究则包括了对孟德尔影响很大的达尔文写的《物种起源》,也就是自然进化成这样,但是这个学说却没有解释为什么每年都这样,而且还会有花色比例,因此这里就产生了一个偏差,也就是现实证据揭示了目前实践和前人研究的局限性。豌豆花的生长过程就是整个遗传活动的mechanism,造成偏差的表象成因是遗传的内容,根源因素是遗传的方式,假设是“使用自授粉的方式可以解释花色遗传的现象”。那什么才是遗传的内容?孟德尔第一定律,基因分离定律。什么才是遗传执行的方式?孟德尔第二定律,也就是自由组合定律。只可惜受制于时代的局限性,孟德尔没有找到第三部分,也就是保持遗传稳定的方式,而这一部分后来是被摩尔根通过果蝇实验发现,也就是遗传学三大定理的第三部分——连锁与互换定律。孟德尔使用豌豆花确定遗传原理的概括性方式就是它的methodology,然后孟德尔也证明了豌豆花的情况也适用于其他植物,摩尔根也发现了果蝇的情况行业适用于其他动物。这个研究的类别,属于induction,也就是归纳研究。

既然上一段我们提到了《物种起源》,那这里我们就说下达尔文吧,他也是个顶尖的学者。在这个理论发现之前,人们认为物种一直都是这样的,可是这与达尔文看到的生物种类的变化产生了偏差。表象成因是生物的变化,根源因素是达尔文提出的进化。所以什么才是生物的变化的内涵?稳定遗传、偶尔变异。什么才是生物保持变化的原因?用进废退。什么才是生物保持变化的方式?物竞天择,适者生存。所以达尔文进行《物种起源》的研究过程也是如本文介绍一样。而达尔文分析这个问题的通用性方法就是他的methodology。

除了abduction和induction之外,还有一类研究叫做演绎研究,deduction。一个经典的案例就是建筑阻尼器的发明。阻尼作用很早就被人们发现了,后来土木师在研究结构抗风抗震的时候,就发现阻尼作用对解决结构抗风抗震这类问题很有帮助。因此人们在建筑中增加了阻尼器。只不过他们这时候回答的是——“什么才是土木阻尼的内容?”也就是针对建筑的震动形式来计算在哪里设置多少N的反力才可以抵消或者减少振动作用的负面影响。“如何使用土木领域的阻尼?”各种阻尼器的就应运而生。“如何保持使用土木领域的阻尼?”阻尼器的链接形式。一个著名的案例就是台北101大厦的风阻尼器。

接下来我们讲一个比较高级的例子,量子计算机。传统的计算机在进行类似于天气模拟预测这类事情上表现除了计算力不足的特性。表象成因是处理器计算能力,mechanism就是目前硅晶片处理器进行计算的过程,这时候发现了量子力学有关的知识可以实现更强大的计算力,因此concept就是:“什么才是处理器计算能力的内容?”量子计算的原理。“什么才是使用处理器计算能力内容的方式?”量子计算机的硬件。“什么才是保持使用处理器计算能力内容的方式?”量子计算机的软件部分。整个methodology就是量子计算机的组装过程。

还有香农定理。当电话电报等通讯工具一一问世时,关于通讯内容里的信息量也开始被人们所关注。表象成因是信息量计算有误,根源因素是编码的计算,然后香农提出了“信息熵”,也即是最终假设是“熵用在信息领域可以解决信息量的计算问题”。那对应的三部分分别是:“什么才是信息量计算的内容?”香农第一定理。“什么才是信息量计算内容的传递方式?”香农第二定理。“什么才是保持信息量计算内容不变化失真的方式?”香农第三定理。对应的methodology就是如何实现concept的过程。这就是信息论的产生过程,香农也因此被称为信息论之父。

另一个有意思的成果是化学元素周期表的发明。在门捷列夫之前,拉瓦锡发明了世界上第一个元素周期表,他把已知的33种元素分成了气体元素、非金属、金属、能成盐之土质等四类,而一些物如光、石灰、镁土等也都被列入元素里。随着元素发现得越来越多,尚古多发现了66种元素的周期性变化并制作了“螺旋图”。然后门捷列夫就发现他们发现的规律不能很好解释这个真实世界中的一些化学反应和测定中的质量问题,因此他改进了元素周期表并发明了短式表,后来被纳维尔改成如今我们教科书上的长周期表。所以服务对象是化学学习研究者,表象成因就是元素自身的变化规律,根源因素是元素的原子结构。所以它发展的concept就是“什么才是元素自身变化规律的变化规律?”也就是元素性质的递变规律。“什么才是新的元素变化规律的展示方式?”门捷列夫所做的元素周期短式表。“什么才是保持使用这个规律的方式?”以这个规律预测寻找新的元素。后来对原子的精确测定和对镓、钪、锗三个原子的发现验证了门捷列夫的科研成果。

此外计量经济学的产生也是如此。美国经历了大萧条,表明市场机制不足以调节经济,因此这里就产生了一个偏差,值得我们去关注。表象成因是经济要素变化的预测,根源因素是经济结构计量的方式有问题,当时只有定性没有定量。因此mechanism就是计算经济结构的量的整个过程。发展的concept分别是“什么才是经济要素变化预测的内容?”也就是计量经济学的研究对象。“什么才是预测经济要素变化的方法?”数理统计方法。“什么才是保持预测经济要素变化的方法”形成模型。它的methodology就是那四步:建造模型、估算参数数值、验证理论、使用模型。这四步其实是属于三个部分,也就是验证理论本身就属于执行的一部分。计量经济学的两位突出贡献者也获得了1969年的第一届诺贝尔经济学奖。

即使在艺术领域,研究也是同样的过程。举我大爱的印象派为例。在印象派之前的绘画是新古典主义主导的,选择古今严峻的重大事件题材, 在艺术形式上,强调理性而非感性的表现;在构图上强调完整性;在造型上重视素 描和轮廓,注重雕塑般的人物形象,而对色彩不够重视。这点就造成了人们对绘画的固定认知,就产生了一个与印象派画家期望的美好世界产生了冲突。服务对象是看画的所有人,表象成因是展示给人们的画,根源因素是绘画理念固执单一。因此就产生了印象派和印象主义。什么才是应该是展示给人们的画的内容?以瞬间的印象作画;什么才是展示这个新内容的方式?注重色彩。如何保持人们接受这个新的内容?连续搞印象派画展。感谢那些印象派大师们的坚持,不然那些画儿也太单调乏味了。

对管理学又何尝不是如此?管理学领域一个经典的研究案例就是科学管理的出现。在此之前的企业管理都是凭资本家的个人经验,这样就肯定会导致管理粗放资源浪费效率低下等情况。于是泰勒的科学管理就出现了,表象成因是管理方式粗放,根源因素是全凭经验不管科学。那“什么才该是管理方式的内容呢?”作业管理。“什么才该是执行作业管理的方式呢?”组织管理。“什么才该是保持新的管理方式保持实行的方式呢?”管理哲学。

最后举相对论的经典案例。在相对论出现之前,目前实践是牛顿的经典力学。然后迈克尔逊-莫雷实验论证了时空不是绝对静止的,这就形成了一个偏差,目前实践不能解释这个现象。表象成因就是时空关系,根源因素就是速度与空间的关系。于是爱因斯坦就对此进行了研究。“什么才是时空关系的内容呢?”狭义相对论。“什么才是时空关系的产生方式呢?”广义相对论中时间与质量的关系。“时空关系会采取何种方式保持影响?”爱因斯坦场方程。后两个都属于广义相对论的内容。至于爱因斯坦是什么level的人,这个应该不用我再介绍了。

我说了这么多例子,好像全部都是那些改变世界的大佬们发展了别人做过的工作,那现在有无可能是自己做了或者发现了一个别人从来没做过的东西然后自己成为第一人,这样就不会去发展别人的东西了?我的答案是,99.999%不可能(U157),留个十万分之一是因为做学术的要严谨,不能把话说死。不可能的原因也很简单,因为各个领域的学科都已经研究发展几千年了,不可能完全没人做过,当然如果你要是有能力穿越到几千年前成为先知就另当别论,可以当时的科技水平,人们大概率还是会用鬼神来解释这些现象。

看到这里,细心的读者也应该发现了,我每次举例子举的都是不同学科领域的例子,自然科学、工程学、人文社会学都举了例子,理论、设备、技术、制度等也都举了例子,而且induction、deduction、abduction也一并介绍了。为什么要这么介绍呢?为什么这些不同领域、不同类型、不同方式的研究都符合本文介绍的这个过程呢?因为各个学科的研究过程本来就是一致的(U158),这也是为什么每个学科的博士都会被授予PhD,这个学术研究的过程就是属于上文说的两个半加半步骤里的最后一步(U159)。而我上文说了很多遍的偏差,正是引发这些研究的第一步,这叫做“问题先验”(U160),就是先发现真实世界中存在的一个偏差产生的或正或负的影响,然后再一步步顺着这个过程做下去。所有改变世界的研究,都是问题先验(U161)。

Step 11 多象共因与多表共象

言归正传,到step 10我们只是做完了一个research project,它似乎跟其他事物毫无关联,可是在这个真实的世界中,事物总是相互影响的(U162),这就引出了这一节要介绍的内容:多象共因与多表共象。

多象共因,跟大象没有关系,是指同一领域内不同现象的各自表象成因都集中在同一个根源因素上,因为首先看到的是现象因此称之为多象共因(U163)。这些现象往往有个特点,也就是互相需要得到彼此的重要事物才能继续下一步,甚至相互决定相互影响(U164)。为了方便大家理解,举一个健康码的例子,这个创新还挺好的。疫情期间需要知道每个人的健康情况,一个个上门统计不方便,就干脆来个健康码。对于政府来说,它需要的是知道本地以及外地整体的疫情情况从而决定这个地方是否可以解除封禁或者允许这个地方的人过来;而对于个人来说,他需要知道的是自己持续打卡后能否出去、以及能去哪里。这时候二者就互相影响了,政府需要知道个人的健康状况才能决定是否允许个人出去,而个人需要上传自己的健康状况才有可能让自己出去。对政府来说数据完整度就成了它分析决策的表象成因,而对个人来说,上传数据的真实程度才是个人可以出去的表象成因。而这二者之间的共同根源因素是信息的采集方式,因为以前派人一个个去统计实在是又耗时又低效又麻烦,这样就这个信息的采集方式给双方都带来了问题,但是二者之间需要的信息不一样、二者收集信息的目的也不一样。碰到这种情况,就需要根据服务对象的不同先分开研究再拼到一起,prototype拼到一起就是关键在我们上文所说的集中之处(U165),反映到上面的案例就是健康码。请注意,这是两个research project,但是必须要拼到一起(U166)。就算是百因共象,也需要按同样的方式拼到一起。多象共因对应到基金申请上,就是项目群的研究(U167)。而根据本人的经验,多象共因在解决的时候往往就把这个根源因素当成表象成因去解决发展,当然这仅仅只是经验,未必全部都是这样(U168)。

还有一种研究的方式就是多表共象,这个有问题的现象可能有很多个表象成因,如果我直接每个表象成因都一起解决呢?这就叫多表共象(U169)。这样的研究也可以,对于一个现象的塑造力比较强,只不过需要持续性地去分析,而且还需要团队或者多个团队合作,不建议个人去做。对应到基金上,多表共象也是项目群的研究,而且多对应跨学科项目群(U170)。

到这里这个学术研究过程就已经全部介绍完了,那些改变世界的研究也是这样产生的。说了这么多,大家一定要认识到一点,真正评价一个学者能力的,不是看他发了多少文章、拿到了多少经费、是否在一个世界名校、是否评到教授副教授、是否有什么帽子,这些都是表面工作不值一提,内核是看他的工作可以改变什么(U171)。什么都不能改变的人,就根本谈不上优秀二字(U172)。

而为了让自己能做出改变世界的成果,就不应该浪费时间在表面工作上,比如发文章、申funding,这些都不叫踏实做事。而是首先掌握一个完整的学术训练体系(U173)。当你真正掌握这个学术训练体系以后,你就会一跃成为世界第一梯队的顶尖学者,成为有资格改变行业的人物,从这一刻起你做的工作将会与世界上绝大多数人做的工作形成一个极其鲜明的对比,这差距将会是天壤之别(U174)。这个差别,就在于这个研究能否真正解决问题,改变什么才叫真正的踏实做事(U175)。

真正的博士毕业,不是以拿到博士学位为准则,也不是以你是否发了很多高IF的文章来算,而是看你是否真地熟练掌握了这套学术训练体系、是否有足够的能力去分析问题解决问题(U176)。从这个意义上来说,这个世界上绝大部分的学者都没有博士毕业(U177)。我从2015年开始正式去研究学术,先后经历了四位半恩师(四位有名有实,半位有实无名),他们全都已经对所在的行业领域产生了重大的影响,深刻地改变了一个国家地区的行业,并且诸多成果在全球都形成了范式。在我无数次有机会水文章的时候,他们都及时把我按了下来,要我别急着发文章,而是仔细思考那些对人类社会产生深远的科研成果是如何产生的,并且言传身教地告诉我如何一步步地做出足以形成范式甚至改变世界的工作。我继承并吸收了这四位半恩师的学术训练体系,并且包容兼济,不仅发展了他们的学术训练体系,并且还形成了自己的风格,而这一切的根基就是我的恩师们的教导,是他们让我掌握了这整个学术训练体系并且学会如何应用它,是他们让我保持了对品质的追求,是他们让我保持了很高的学术节操。作为代价,我整整六年(2014年10月开始正式接受学术训练一直到写这个知乎回答的2020年9月,六年)都没有出期刊,一方面是因为这六年我很多的时间精力都放在了对这个学术训练体系的总结上,我不停地学习思考总结,并且经常同我的恩师们开会讨论,他们也很乐意跟我讨论这些,而非不停催促我去水文章;另一方面是我们老师更倾向于做好大论文,他认为大论文做好了小论文自然而然就出来了,而且还很优质,我认同他的观念,因此没有选择paper-based的毕业论文的方式,而是主攻monograph。实际上我选择对了,因为正是monograph的方式让我看问题更加系统全面。所以这六年也并非全无收获,譬如我的这套完整的学术训练体系以及我博士课题的工作绝对可以形成范式,这就是一个强势学术训练体系所带来的底气。

二、坚决打击Rubbish Work

讲完了那些改变世界的研究是如何产生的以后,就应该去讲讲什么才应该是避免的研究,也就是辨别避免什么是rubbish work。那么(Q272)什么才是rubbish work呢?(Q273)反应到论文里又是什么样的结构呢?(Q274)为什么这些文章是rubbish work呢?接下来我们一个个介绍,先回答前两个问题。

Type 1 结果先验

所谓结果先验,也就是俗称的拍脑门,就是你脑子里有了一个idea,它是一个包含问题和解决方案的结果,你很清楚它对应的是哪个topic,然后这个solution有什么功能和模块,要实现这个solution又要经历哪几个步骤,总之一切看起来很美好一切看起来很完整,做出来也非常酷炫非常高级(U178)。然而殊不知问题就恰恰在这里,因为这个idea对应的问题与现实世界的偏差严重不符,根本回答不出来为什么solution非得采用这些方案并做成这个样子。它只是你的主观臆断,很可能问题根本不是这样产生的。如果连问题是什么和问题如何产生的都不知道,哪又如何去解决它?

结果先验反应到文章里就是内容连接上的逻辑漏洞(U179)。这类文章一般(U180)开篇就说一个现象中的问题,说这个问题很重要因此要解决它。然后在文献综述部分把research topic相同但是research scope完全不同的诸多文章放在一起,或者是将除特性外其他研究范围都不同的文章放到一起,却没有任何总结分析讲针对问题本身的特点和mechanism来讲前人研究的不足,也不会介绍自己发展了什么,紧接着就开始花大量的篇幅去描述自己的solution,而且每部分组成和实现步骤都特别清晰,validation也就是简单测试了一下再放了个数据,有的甚至连validation都没有。最后总结的时候也就说自己做了一个什么实现了什么功能并且测试结果如何,但是根本讲不出自己对这个问题的解决有什么作用,也讲不出自己的研究跟别人有什么不同。

结果先验是每个学术训练不到位的人都会犯的错误,包括曾经的本人也不例外,对于一些有title但是没受到及格的学术训练的人来说也一样,而读博的意义就是让人从结果先验变成问题先验(U181)。如果你经常有一个什么idea的话,congratulations!你100%想出了一个rubbish work(U182)。如果你的老师每次都问你最近有什么random ideas,congratulations!你碰到了一个不会培养学生的老师(U183)。真正会培养学生的老师,都是问学生的random observations,也都是问学生最近发现了什么真实世界中存在的偏差,这就是培养学生的选题能力和观察能力;下一步就是让学生选择一个自己感兴趣的问题按本文介绍的方式做下去,然后等他做到一段时间之后再问他过去和现在有哪些random observations,简单思考下如果按照目前的研究过程该如何去分析这些random observations的问题,这就是培养学生的联想能力;然后等学生课题做的差不多的时候,再次问他的random observations,简单思考下如果按照这个完整的研究过程又该如何去解决这些random observations中的问题,这就是让学生加强巩固掌握这个学术训练体系,培养学生的融会贯通能力。这样看上去是只做了一个research project,实际上已经对几十个问题产生了基本思路,这样一个课题结束以后马上就能开始下一个课题。这个过程就是一个“E字型的思想实验”(U184),也是本人发展的学术训练体系中“本硕博培养方案”中的内容,亲测有效。

实际上结果先验也是研究容易撞车的根本原因。每次你做研究做的好好的然后突然发现别人已经做了而且做的跟你几乎一样,那就是因为结果先验,因为你能想得到的结果很多人也都能想得到。而我们从学术研究过程那里知道了,要想真正做出一个优质的研究需要回答271个问题,每一个问题都至少有2个可能性,最少也就是2的271次方,比全球人口多,比人类有史以来说过的话多,比地球上所有的原子加起来还要多。而跟你同领域的学者又有多少呢?这种情况下你还会跟别人的研究撞车吗?真正优质的研究,一定是问题先验,从问题本身入手,而不是结果先验(U185)。而全文下来,你总共需要回答283个问题,理解290个概念,这就更容易同别人的工作产生巨大差异。

Type 2 不做少做

不做少做,这个也很好理解,就是因为没有人做或者很少有人做才去研究它(U186)。不是因为别人没做或者很少做所以才去研究它,而是因为发现了一个现实世界中的真实偏差所以才去研究它(U187)。这样的学者突然发现一个topic没有人做或者很少有人做这个之后,就会变得异常欣喜,以为自己发现了新大陆,觉得自己将会成为一个领域的创始人。Congratulations!你又想出了一个rubbish work。不做少做的最大问题是在于回答这几个最基本问题(U188):为什么非要做它?不做少做又会造成什么问题?哪个服务对象需要你去做它?为什么这个服务对象需要你去做它?你做的这个在解决mechanism和根源因素上跟前人研究中的concept和methodology又有何不同?

当你做研究的出发点就是不做少做的时候,你实际上根本就回答不出来这些问题。反应到文章里面去所对应的结构内容就是(U189):上来先说某某问题或者某某领域很重要,紧接着话锋一转说但是别人在某块没有做或者很少有人做什么,因此我做了一个啥啥啥去填补这个别人没做或者很少做的东西,然后接下来的部分跟结果先验类似,文献综述部分就开始扯很宽泛的研究,要么没总结要么就直接说他们没做这个,但是完全讲不出来我上一段问的问题。接下来就是一个实现不做少做的prototype,总结就讲一下我做了一个别人不做少做的东西。不做少做常常伴随着结果先验,这样的研究也必然与现实严重脱节,不解决实际问题(U190)。实际上,往往人们不做少做一样东西,是因为它不重要(U191)。

Type 3 范围缺失

这个也好回答,就是你的research scope没有限定,导致你的research problem过于宽泛,到最后就连你自己都不知道该怎么处理这个研究(U192)。

我们现在来看看,如果范围缺失会出现什么样的结果(U193)。我们第一个限定的范围是阶段,如果阶段没有了会怎么样?那就会出现特性和服务对象绝对变化,到时候写在一起的看似是一个research problem,但其实是很多个research problem,这样就导致你看不清某个问题本身。应用场景缺失也会造成服务对象和特性的不明确,更容易受到外部因素的影响。特性丢失很好理解,如果没特性你基本看不到这个现象,也不清楚解决的是什么。特性的影响范围如果丢失了,那么就无法分辨这个问题在不同情况下出现的不同问题,就无法真正让这个问题变得清晰可见。服务对象就很好理解了,不同的服务对象需要的东西和自身的特点是不一样的。如果不知道自己要做到什么程度要发展的到底是什么,那最后做研究的时候也肯定很迷茫。这六个范围每一个都不能丢失,否则就会不清楚这个问题到底是什么,你连问题到底是什么都不知道,又如何解决它?

范围丢失反应到文章里去(U194),就是上来先说一个很宏大的问题,然后指出一个别人提出来的表象成因,没错这个表象成因是别人提出来的,因为范围缺失的话连问题都不清楚更别说找到表象成因了。接下来就跟结果先验类似,文献综述是类似topic但是范围不同,然后接下来就是解决这个问题的solution,但是这个solution范围却很宽泛,别人看了以后会很迷糊不知道这个solution到底是要适用于哪个范围的,也不知道谁需要这个研究,而且有时候这个solution中的各个部分还会有冲突。

这类研究的出发点是想问题先验,而非结果先验,只不过表现起来跟结果先验很像而已,因此这里需要将其同结果先验区分开,称为范围缺失。

Type 4 数据先行

这个好理解,就是在做研究之前你拿到了一个数据,这个数据可能专门跟你的研究领域相关,而且很全面很复杂很高级,让你以为自己抓住了最后的救命稻草,看了就忍不住就想去分析它,想办法利用起这个数据,想办法基于这个数据进行研究来写文章,但是却根本不管这个数据是否真的可以解决问题(U195)。

这个情况反映到文章中就是,上来就说某某问题很重要,然后我们得到了什么什么有关的数据去分析它,然后再扯一下类似topic的文献综述,也基本没有什么分析总结。紧接着就开始大刀阔斧地分析这个数据,结论就是这个数据证明了什么或者分析出来有什么用,但是却根本讲不出问题本身是什么、为什么非要用这些数据、为什么非要用这个分析方法以及分析出来的数据又能改变什么?这样的文章也一定是与现实严重脱节的。

Type 5 简单实现

简单实现是指这个问题是存在的,某个方法存在一些缺陷,然后某个别人提出来的那个方法已经被证明了可以解决这个缺陷,然后你就简单实现了那个方法;或者更直白点,这个问题是存在的,然后某某方法可以解决这个问题,然后就简单实现了这个方法(U196)。对应的文章结构也是这样,上来就说某某问题重要,然后某某方法已经被证明了可以解决这个问题,但是有哪些不足,另一个人提出的另一种方法可以解决这个问题,然后就花了大量的篇幅讲实现另一种方法的过程;或者就是某某问题很重要,然后那个方法可以解决这个问题,因此我就简单实现了这个方法。这压根就不叫研究,这叫应用。我时不时就审到这种稿子,简直不敢相信还会有人会浪费自己的时间生命去写几十页这样的稿子。

Type 6 聚焦错误

所谓聚焦错误,就是指现象是在你的学科领域内,但是表象成因和根源因素全都是在其他学科领域里面,这样就聚焦到其他学科领域去了(U197)。它与简单实现很接近,只不过表象成因和根源因素跑到所使用的方法那个学科领域去了(U198)。聚焦错误必然伴随着范围限定错误(U199)。

反映到文章里去就是上来就先说一个问题重要,然后其他学科领域的某某技术可以解决这个问题,但是这个其他学科领域的技术自身有一些什么样的缺点,而另一个也是这个其他学科领域的技术可以解决之前提到的这个其他领域的技术,因此我们就来把那个另一个其他领域的技术给简单实现一遍。这个很明显是歪到其他领域去了。之所以在其他领域仅仅是简单实现,是因为一个领域的学者往往没有足够的知识储备在另一个学科领域实现创新的(U200)。

Type 7 简单替换

简单替换是指在解决一个research problem的时候,我直接使用另一种方法来简单替换前人研究的方法,这种方法往往属于热门技术方向看上去很酷炫很高级,比如说AI,然后绞尽脑汁让这个技术可以用在这个问题上(U201)。这类研究丢失的是mechanism和根源因素(U202),就是这些作者其实并不清楚这个问题为什么会发生,又为什么会以这种形式发生,实际上有时候简单替换可能会带来更糟糕的情况(U203)。举个例子,如果只是简单地找人操控无人机来替换塔吊操作,那么目前实践中塔吊吊运过程中出现的问题无人机一样会出现,甚至在某些情况下会更糟糕,比如说风稍微大一点无人机就会失稳,很可能造成安全问题;而且现在无人机的承重量并不大,为了吊起重量不轻的工程材料就需要使用更多的无人机,对应的也就是更多的无人机操作者,成本可能更高;此外更多的无人机操作者就意味着更多的操作协同配合,实际操作起来比想象的还要麻烦,这还会造成一个额外的表象成因。那你说无人机酷不酷选高不高级,跟AI机器人CV一样都是工程学中的热门技术,但是你说这个简单替换又能否解决问题呢?其实比现在使用塔吊麻烦多了。这就是简单替换丢失mechanism和根源因素的后果(U204)。

反映到文章里,就是这个问题是什么,然后就开始review解决这个问题的相关文章,但是这里往往会丢失对这些前人研究的分析总结,接下来就说自己提出了一个什么基于某个热门技术的solution来解决这个方案,然后也花了大量的篇幅去描述自己这个新的solution,结论里就是讲它实现了什么功能,但是讲不出为什么非要这么用。

这和结果先验是不同的。结果先验是你脑子里已经有了一个结果了,技术怎么用也已经想好了。而简单替换,另一个合适的解释是技术先验,也就是你在做研究前就先铁了心要使用一个热门技术,然后不管抓到什么问题都想着法子去使用这个热门技术来替换现有的方法,这时候你的每一个步骤都被这个热门技术自身的优缺点给限制住,整个过程就是简单替换(U205)。

Type 8 一稿多投

这个好理解,就是做了一个不怎样的研究,然后把里面的内容从不同角度和方式去阐述,最后看似发了很多篇,实际上都是同一篇(U206)。而写文章改数据改图投稿也是要花费很多时间的,如果自己受到的学术训练不够还把很多时间花在这些事情上,那做出来的东西必然是质量非常差的(U207)。这也是一种学术不端,在推行代表作制度的时期应当坚决严厉打击。

Type 9 根源错误

根源错误是指对根源因素的总结出了问题,一般是把根源因素再次切分找到根源因素的一个错误的根源因素,这一步没必要而且容易错,这个错误的根源因素的根源因素往往并不是现象中任何一个服务对象所需要的,切分根源因素的mechanism总结出来的根源因素也不包括这个。出现这种情况是因为同时丢失了服务对象、mechanism和根源因素(U208)。

这类研究反映到文章里面是这样的结构:上来先说一个问题,然后直接提一个错误的根源因素,不说服务对象也不说mechanism,然后提出一个方法去解决这个错误的根源因素,最后的prototype往往没法使用。举制作手工艺品卖给商家的例子,商家需要找手工艺品制作者按期按量收货,对商家来说制作者用什么方式做根本不重要,只要能按期按量交货就行了。如果手工艺品制作者不能按时交货,那么如果服务对象是商家的话,那么表象成因可能是下单量不合理、惩罚措施不够强,根源元素是经济学计算的问题,商家需要的是对手工艺制作者采取惩罚措施,或者重新评估下单量多少合适。而对于手工艺品制作者来说,表象成因是缺少对制作者有效的进度监控,实际的根源因素可能是进度监控时计数不准,制作者需要的是更准确的计数方法。可是如果这时候错误地把根源因素归成是缺少对制作工具使了多少力的的计算,那就是错误的根源因素。按错误根源因素的做法,研究人员往往会在制作工具上增加传感器,然后记录每个工具敲了多少下有没有做够足够的功,最后得到了一大堆传感器记录做功的数据,那实际上这个传感器的数据在整个现象中是没有任何一个服务对象需要的。之所以会找到错误的根源因素是因为缺少了对mechanism的观察分析,大多数是因为那些学者不知道有个mechanism(U209)。

Type 10 物为核心

物为核心是指,把不同服务对象所使用的同一个物体当做整个研究的核心,以这个物体在几个不同阶段的使用过程来进行研究(U210)。这种类型的rubbish work在期刊会议论文中一般看不出来,但是会经常出现在博士毕业论文中(U211)。

一个典型的例子是土木领域里的建筑工业化一体化的研究,我已经见过太多这个主题的博士毕业论文了,他们一般选择模块化构件的下单、运输和吊装这几个部分作为一个整体。这是完完全全的错误,一是因为他们选择的几个部分分别面对着不同的research problem和mechanism,没法形成一个整体。二是物为核心就会导致一个致命的问题,跟这个物有关的所有现象是否都应该装进去?如果其他的不装,凭什么啊?你这三个都选个为什么不选那几个?如果全部装,那得装多少?你这个课题又得撑得多大?你又要解决到什么时候?所以这种方式做出来的毕业论文必然是问题很严重的,经不起推敲。

Type 11 生造概念

这个好理解,我们之前说了concept一定是这个现实世界中真实存在的事物,而且在目前的情况下它需要经过发展,生造概念就是提出一个所谓的“concept”,但是这个concept与现实严重脱节,提到这个concept也只有一些很宽泛的特性和很一个很广阔的应用场景,但是却讲不出来“一个现实世界中真实存在的事物到底是什么”,这就叫生造名词(U212)。如果一个concept只有一个很宽泛特性和很广阔的场景,那么这个concept必然与现实严重脱节,也不能解决任何实际问题(U213)。这类在期刊和大论文上都会出现,他们的concept framework基本都会写成workflow或者system architecture,解释的时候也只会写很宽泛的特性和很广阔的应用场景,但是你看完了以后想了半天就是不知道它到底是个什么东西(U214),这种生造概念提出来的名词自然而然不会改变什么(U215)。

以上就是常见的rubbish work类型,rubbish work之所以是rubbish work,是因为它们与现实严重脱节,不解决任何现实中的问题(U216)。而每种rubbish work的类型,要么跟结果先验有直接的关系,要么或多或少受了结果先验的影响(U217)。这个结果先验,其实就是人们对事物的主观臆断,而学术训练体系的价值就是让人们从“对事物主观臆断”到“接受一个真实的世界”(U218)。大家在做研究的时候,应当避免这些类型的rubbish work。

(Q275)那为什么编辑们会录取这些rubbish work呢?那是因为编辑的真实诉求跟很多人想的不一样(U219)。很多人会觉得编辑录取文章是根据质量,但实际上编辑的真实诉求是扩大期刊的影响力(U220)。编辑们尤其是顶刊的编辑们其实大多知道什么是优质的研究什么是rubbish work,也很清楚这个世界上并没有那么多优秀的学者和优质的研究,大部分学者不过都是靠学术混口饭吃而已。如果他们全部放优质的研究而拒绝一切rubbish work,那么这个期刊一年都没几篇稿子了,更别谈什么期刊影响力。因此编辑们在办期刊的时候会考虑这个一个期刊一年中的文章是否是来自不同国家地区不同单位,是否各个主题的稿子均衡,是否有新人的稿子,是否不同类型的研究比例合理,期刊的IF够不够高要是不够高的话再多录点review多发些期刊多推荐一些自引,期刊录取的稿子数是否足够多,是否有足够的人知道这本期刊并且觉得它好。编辑要考虑的事物远比很多人想象的多,但可能恰恰就不是完全以质量作为标准。这也不怪编辑们,他们也没办法,这是他们的责任。

(Q276)为什么人们会写出这种rubbish work呢?因为大部分人都没有受到过一个及格的学术训练,自己也不善于思考不愿意与他人讨论,所以以他们的真实水平只能做出rubbish work,也教不了学生(U221)。一个人的学术能力并不是完全靠老师教的,而是由诸多方面组成,几个核心的方面是老师的教导+自己的思考+跟他人的讨论(U222)。老师的教导分为两种情况(U223),一是很多人的老师自己就未必有多少水平,更别说教学生了;二是是老师自己很强,能做出足以改变世界的研究,但是不善于表达或者是表达的方式不适合自己的学生们,这种情况下老师只需要改一下自己的表发方式就好了。再是自己的思考,这个太好回答了,很多人都没有思考本源的意识,只会拙劣地模仿自己的老师和看到的期刊,只会顺从老师的指导埋头苦干,根本不会去想这个问题为什么会产生、又为什么会以这种形式存在,也不会想那些改变世界的研究是如何产生的、与同时期诸多被人遗忘的文章又有什么区别,更别说本人所说的学术训练体系了。至于跟他人的讨论,如果一个人连思考都全部思考,还能跟别人讨论什么,再加上碰到不会指导学生的老师,那就更是一团糟,讨论都没用,压根不会成长。

而培养学生看的是实际指导人,而不是挂名的导师(U224),因为很多人挂名的都是大佬的名字,那个大佬很可能是真正的强者,但是自己可能是因为当了领导太忙所以没时间管学生,就找了一个小老板管学生,如果这时候出现了上面的三种情况,那问题就出在小老板身上。

(Q277)不会培养学生的老师在培养学生的时候有哪些特征呢?一般来说这个老师所带的组里会出现五种情况(U225):第一种情况是整个组里的学生没一个知道怎么做研究,每天花了很多时间但是却什么都搞不出来,过得无比痛苦放弃了对学术的热爱追求和自信,这种情况不用想了,老师既不懂做优质研究也不懂怎么培养学生。第二种情况是组里两级分化,一些人能发很多文章,但是全部属于本文所说的rubbish work,而剩下的人就属于第一种类型,这也说明老师既不懂做优质研究也不懂怎么培养学生,那些学生并不是真的懂了怎么做研究,不过是找到了水文章的套路而已,其实他们什么都不能改变。第三种情况是组里每个人都能出很文章,甚至很多文章,但是每篇文章都属于上述的rubbish work,这种情况也是一样,这不是因为这些人真的知道怎么做研究,而是因为他们的老师善于social,跟编辑圈关系很好,然后又找到了水文章的方式,有时候审稿都是熟人互相审互相放水,因此顶刊文章就会不停发出,但是这并没有什么意义,即使发了无数顶刊他们的工作依旧什么都不能改变,这种老师也是一个既不懂做优质研究也不懂怎么培养学生的人。还有两种情况比较简单,分别是老师指望通过投稿学习做研究和老师经常问你random ideas而不是random observations,前一种是老师自己不知道怎么做研究因此文章里逻辑错误很多,因此就指望审稿人来修改文章,这就是研究水平不行的表现;后一种也好理解,老师自己做事都是结果先验,因此就觉得做研究都应该结果先验。

这个世界上80%的文章都是rubbish work,80%的学者都是既不知道怎么做优质研究也不知道培养学生,CNS这些之所以是顶刊也只是因为他们的rubbish work只占了60%而已,这一切的根源是因为他们没有受到一个完整且及格的学术训练(U226)。而这个80%,也不过是开朗的本人所做的乐观估计,真实情况可能远比这个糟糕,这也是为什么改变世界的总是极少数学者,因为只有极少数的学者经历了一个完整又优质的学术训练体系(U227)。某个人在一个世界名校评到了教授副教授甚至评到了一个帽子,发了很多篇文章,拉到了很多经费,桃李满天下,也当了一个什么领导,但是这并不意味着他的工作就一定不是或者一定没有rubbish work了(U228)。实际上,名校菜鸡才是世间常态(U229),他们表面风光包装精致,但其实他们既不知道怎么做优质的研究也不知道怎么培养学生,这个世界根本就不可能因为他们而改变,是一群实打实的菜鸡。同样的,即使是世界顶级学校,也存在着菜鸡老师和菜鸡博士,只不过好学校拥有的强者老师学生多,差学校拥有的强者老师学生少甚至没有而已(U230)。

(Q278)那为什么大部分人会崇拜这些发了rubbish work的人呢?因为大部人都没有接触过一个完整及格的学术训练体系,因此他们没有能力去分辨谁是菜鸡谁是强者,看不出文章质量之间的差别,只能从表面工作去判断,比如说发了很多顶刊拉了很多经费有没有评到院士。这些人往往在一个不知道培养学生的老师下面,觉得搞学术就是整天刻苦拼时长,只要能出文章就证明有学术能力,哪怕写得跟坨屎一样都不要紧。大家一定要明白一点,学术不是拼时长,而是做功(U231),如果效率不及格甚至为0,那么花再多时间做出来的也都是rubbish work。在我总结这个学术训练体系的时候,我每天最多都只能思考五个小事就头昏脑涨不能再工作了,而这个学术训练体系的很多部分,其实都不是我在办公室想出来的,而是在外出旅游时候突然想到的,但是不管怎么样我六年时间就完成了这个学术训练体系,我相信很多人即使每天思考12个小时都不会总结出来,这就是效率的价值。

说到这里我就想到了两个例子,真是不吐不快。前几年诸多学术公众号到处转发某top 2博士的怎么做研究文章,我看了那篇文章都觉得好笑,这种程度的东西也配拿出来讲还到处宣扬?而且阅读量和转发量还挺大。不知道的人还以为那所高手如云改变中国的top2就这点水平,简直是辱没那所学校的名声。真正的高手们忙着改变世界没时间告诉别人怎么做研究,结果就成了“时无英雄,使竖子成名” (U232),真是可笑至极。另一个例子是近日朋友圈和各大学术公众号疯狂转发的某些大佬宣扬搞学术需要每天12个小时或者更多,我看了也只能呵呵一声,敢情大佬们就这种认知?搞学术不提高研究能力不提高效率就拼时长(U233)?就这还被无数人转发叫好?从这个两个例子就可以看出,国内大多数人对学术的理解程度到底如何了(U234),归根到底还是他们没有受到过及格的学术训练,因此不知道什么才是真正的研究。即使是闲云野鹤的隐士,闻此也会怅然长叹,叹一次两次还好,如果过一两个月就长叹一次,那么即使终南山下也会挤满了愤而出世的隐士(U235)。但是如果完成这个学术训练体系的话,就不可能再做出rubbish work,也会持续性做出优质的足以改变世界的工作,成为真正的一等一高手,即使面对大佬也依旧毫不逊色(U236)。想当年三国周郎赤壁,33岁的周瑜和27岁的诸葛亮大败53岁的曹操,虽然岁数不同,这三人又何尝不算是一代英豪?

(Q279)为什么人们明知道自己在灌水发rubbish work为什么还会投呢?因为这个世界上大部分人考虑问题的角度都是“个人”(U237),这么做对我个人有什么好处?怎么做才能实现我个人利益的最大化?他那么做会一定是因为对他个人带来的好处是什么?就是因为秉持了“个人”的角度,他们做什么都在想自己是否得利,就会努力去做对个人有利的事,因此他们才会崇拜一些文章很多经费量大善于social的菜鸡大佬,因为变成他们那样就足以让自己获利,因此他们自己也会努力这么做,却全然不管自己的工作到底可以改变什么有什么价值。正是这种私利为重的态度,催生了世界三大灌水宝地,他们其实有优秀的老师也有优秀的学生,只不过由于制度和风气的关系,最后绝大部分人都在做表面工作,他们是发了很多顶刊拉了很多经费也进入了social圈,他们所在的学校也因此在那几个野鸡排行榜上占据了很高的位置。但是这毫无意义,因为他们的工作却什么都不能改变,纯粹就是走量不走质,这也是为什么对人类社会产生重大影响的科研成果和人物几乎从来没有或者压根就没有从那些地方产生过(U238)。

在这些私利为重的人眼里,所有人都应该做自己私利有益的事,别人做什么都一定是为了个人的私利,如果别人没做就一定是能力不行做不到,可是他们全然不知这世界上还有一些人考虑问题的角度从来都不是个人,而是“组织”(U29)。这个“组织”可大可小(U240),它可以是一个学院、一所大学、一个省份、一个国家的某个行业、一个国家、甚至全人类,如果各位有志于成为心怀天下的人,那么你考虑的组织最起码应该是“一国的一个行业”(U241),考虑问题的时候也应该是国事为重(U242)。而当你考虑问题的角度是“组织”的时候,你就会做出很对有利于组织的事,而你在带领“组织”前进的时候,个人也会与组织共同成长共同受益。

而在私利为重的人眼中,他们根本就不理解你为什要做这种事,因为这种事情看上去对“个人”的利益毫无帮助,他们潜意识里就认定你也同他们一样是私利为重的人,因此他们就会对你所做的有益于“组织”的事当成是你想为自己获利的事。国事为重的人若是看到国家的这个行业还很落后时会心忧国家,会努力团结一切有志于改变行业的人,会组织大家进行学习交流以期提高国内行业的水平,而这些在私利为重的人眼里看来,他也不过是一个social king而已;国事为重的人如果选择沉心静气去总结一个完善的学术训练体系,在私利为重的人看来也只不过是一只发不出文章的菜鸡而已。

殊不知,国事为重的人早就看出了实现中华民族伟大复兴即将到达最关键的时刻(U243),因此他会将个人的命运与国家的命运结合起来,去选择国家产业升级(U244)最需要的地方学习,并且平心静气去总结真正使国家进行科技创新的方法;殊不知,国事为重的人会在每每听恩师们讲他们是如何改变这个国家行业并且正在如何引领未来时都羞愧难当无地自容,因为自己不管是格局和能力都还与恩师们相差甚远;殊不知,国事为重的人会在无数个漫漫长夜辗转反侧彻夜难眠,害怕自己事情做的不好无法真正做一些于国于民有利的实事,害怕自己无法达到恩师们的高度也无法超越自己的恩师;殊不知,国事为重的人会在异国他乡与老友知己把酒言欢的时候潸然落泪,因为意识到自己成长得太晚了。这两种不同的态度和认识,必然会造成二者今后成就的巨大差异,私利为重的人最后都无一例外成为了名校菜鸡。一个鲜明的对比就是疫情期间立刻逃到国外的公务员和疫情爆发之初已经84岁高龄让大家别去湖北,自己却仍毅然决然前往疫情中心武汉的钟南山;另一个著名的案例就是疫情期间专心医治患者的医生和抢发文章的学者。

(Q280)可是名校菜鸡永远都只能是名校菜鸡吗?其实并不是。很多人其实是被动地成为了名校菜鸡(U245),这个人本身是很有追求很有节操很有能力,只不过由于受到的学术训练不够,因此就被动地成为了名校菜鸡,他们其实什么都好,只是单纯地水平不高而已……但是如果给他们一个完整的学术训练体系,那么他们绝对会成为真正的强者,即使胜本人十倍也不足为奇(U246)。这也是闲云野鹤惯了的本人在这里写几万字的原因,我相信这个世界上还有很多国事为重的人,他们成为名校菜鸡并不是有什么错,从概率学上来说这只是正常现象。本人这种情况其实完全是特例,不是普遍现象,也完全不具有代表性。因此我理解他们,也愿意与他们分享本人的平生所学,帮助他们成长为真正的强者,让他们有能力去改变这个世界,最终于国于民有利。

三、代表作积分制

知道什么才是优质的研究以及什么是rubbish work以后,就应该建立一个评估研究质量等级的标准。国内一直以来都有科技上被人卡脖子的情况,很多核心领域还缺乏自主产权,大部分领域都缺少绝对原创的工作,这一切的根源是因为我国目前的学术训练体系太差,所以大部分人都不知道怎么做研究。今年疫情期间明明是该全力医治患者防控疫情,结果竟然有人不做实事趁机抢发文章,真是其心可诛。科技部和教育部也不满这种恶劣行为,导致了疫情倒逼改革破除五唯,对研究成果展示形式的评价标准不再是单纯看发了多少SCI,而是看重一个更全面的研究成果展示形式,比如说报告会议等,而且在推代表作;同时对老师的评价体系也开始变得更全面,不再是只以SCI数目来评价一个人的学术能力,甚至很多学校也不再盲目崇拜IF出了自己的journal list。这些都是好事情,说明风气在变好。只是我看到现在,科技部教育部财政部出了很多文件,很多学术公众号也只是说外国怎么评价科研成果和科研水平,但是都大半年了还没有一个具体的标准,比如说什么才叫形成范式、如何去评价研究的质量程度、什么才是代表作等等等等,这也是促使本人写这个稿子的原因。有些问题在上文中已经回答了,比如说什么才叫形成范式。因此本节重点回答“(Q281)代表作的质量等级如何评定?”“(Q282)代表作该怎么交呢?”“(Q283)招人的时候如何选出真正强者?”这三个问题,也算是对目前政策的补充。

下面第一第二个问题放到一起来回答。

我们上文已经说过了,研究的最高等级就是形成范式被写进及教科书里(U247),因此范式就是最高等级的研究成果。一个范式很难是只有一个部分,因此必然是三个部分一起写。因此有关范式的研究更适合是一个基金的成果,如果反应到代表作,最合适的方法是一个基金交3篇代表作(U248),分别是concept的三个部分;交第四篇也可以,这一篇就是把mechanism和prototype放到一起去介绍(U249)。这四篇代表作应该按一个基金的周期来算(U250),一般也都是三年,也就是说一个项目三年只需要出四篇代表作就行,但是一定要对应本文的内容才行。我们组paper-based的大论文也是这么来的。当然形成范式需要足够的时间(U251),也需要经历很多的曲折,譬如本人所发展出来的学术训练体系也必然会形成范式,可是当我刚整理完这个学术训练体系到现在,我跟不下于50位的学者提及了这个体系,然而信我的人只不过六七人而已,大部分人都以为我是在为自己发不出文章而找借口,因为在他们的认识中只有发文章才是正途,压根就没有质量的概念。因此这里我们不能只看它是否已经形成了范式,更要看这个研究做出来有无形成范式的可能(U252),实际上只要是按本文所说的去分析问题解决问题,可能性还是不小的的(U253)。因此这里只要是做出了形成范式或者有可能形成范式的研究,就可以算到最高的档次(U254)。

接下来次一档的就是仅仅只是揭示了一个规律机制(U255),因为有了规律机制就可以发展出concept和methodology,是研究的基础,就算自己不做也可以让别人借鉴使用,从而发展出一个新的concept和methodology,因此这是第二档。这样的研究其实只够一篇文章,不是一个完整的项目,但是也可以算不错的代表作,毕竟有的人做研究也不是全部看基金项目,也有突然发现的(U256)。

第三档次就是单纯发展一个workflow,但是不改变concept和mechanism。这个跨度看上去有点大但其实这才是正常情况。之前就已经说了,methodology是为了实现concept的一类方法论。如果作者的concept还是目前实践或者前人研究的concept的话,那不管怎么发展,methodology是在目前实践中的concept下进行的,它其实并没有发展新的concept和methodology(U257)。但是可以通过更改methodology下的workflow方式来更好的解决这个mechanism。这点也要看你所使用的技术有没有实现突破。这个也可以发期刊(U258),只是同样的,只能是一篇文章,不能是一个研究课题。

第四个档次是提高一个method(U259)。这个也好解释,就是基于别人的mechanism、concept、methodology和workflow,然后去提高实现workflow各部分和连接方式的具体方法/方式。这种一般就会涉及到具体的技术替换,但是一定要带上mechanism、concept、methodology和workflow去分析,如果不带的话就会变成简单替换(U260)。这种其实可以发期刊,只不过价值低了点而已,在我们这种要求比较高的组提高method只能发会议不给发期刊(U261)。

有价值的文章一般都是这四种类型,这才是代表作应该体现的东西。在对学者进行考核时,我个人建议以三年为一期去考核,如果有接到基金就每个基金都按上述的3-4篇进行考核,不需要很多,当然不交第一档次的文章也可以接受,但是一定要符合这四个优质(U262)。至于是不是发的顶刊其实并不重要,重要的是这篇文章能改变什么(U263)。

这时候会根据代表作的质量等级来算平均积分,如果是第四档的优质文章,那么就算0分,毕竟这是一个学者最基本的责任;第三档文章算1分;第二档文章算2分;第一档文章就算4分;如果交的文章有rubbish work的话,那就增加惩罚措施,如果交了1篇rubbish work就算-1分,如果交了2篇rubbish work就每篇算-2分,如果交了3篇rubbish work的话,那么每篇就算-3分,以此类推。然后算完这个人的总分后再除以他的基金数,平均分为正就说明还不错,为负就是实打实的菜鸡,这个事情也应当由学术委员会去执行。这就是本人提出的代表作积分制,权当参考(U264)。

至于没有基金,好像有点说不过去……如果是评定基金的话,那就是看本文从开头到research question的部分,到这里就已经是proposal怎么写了(U265),很多人申请不到基金其实也是因为学术训练不够,都不知道怎么分析问题又怎么去写proposal(U266)?同样的期刊审稿也是如此(U267),水平高又公证的审稿人不管是否审到了熟人的稿子,都会根据前两章的分析来看这个研究到底做的怎么样,看这个人的水平到底如何。

讲到这里会有一种情况发生(U268),就是我上文提到了名校菜鸡才是世间常态,我相信绝对有人不认同这点,他们觉得名校菜鸡只是少数而已。实际上,名校菜鸡之所以是常态是因为大部分的人没有收到过严格的学术训练,因此他们在分析问题的时候都会出现结果先验或者受结果先验的影响,连mechanism都看不到,这样做出来的东西必然是rubbish work。如果给研究的优质程度打分,那些已经形成范式的研究是100分,90分是有可能形成范式但也属于第一档,80分是第二档揭示了一个mechanism,70分就是第三档发展workflow,及格60分就是第四档,那么没有受到及格完整学术训练的人做出来的工作就是不及格,最高也就59分而已。可是当你经历了一个严格的学术训练体系之后,你做出来的工作基本都会揭示一个规律机制、发展一个概念认知、形成以通用性的方法论。而只有掌握这点的人才会想到去实现代表作的四个档次,正常情况下做出来的工作都是三个部分一起出来,也就是最起码90分。所以学术训练不及格者中的上限和学术训练良好者中的正常情况,二者之间的差距压根就不是59和60分之间只差1分,而是59对90分,整整相差了31分(U269)。这就是残酷的现实(U270)。

到了这里我们就可以回答本节的第三个问题。现在国内收人基本都是看一区数目或者顶刊,如果发的多那就是强者可以直接录取。但是这样的收人方式是有误区的,因为这纯粹就是在录取paper machine,数目完全不能反映出研究的质量。为了选出真正的强者,一个必要的环节就是defence,也就是对投简历者的答辩(U271)。收人的学院应当是从学术委员会抽取几个人包括领导一起,集中或者单个让投简历的人去报告自己的研究,如果是博士毕业就讲自己的博士课题(U272),如果是博后毕业就讲自己的博士毕业论文和目前的课题(U273),如果是已经当老师的了就让他讲自己的2-3个研究课题(U274),然后学术委员会像博士毕业答辩那样不停提问(U275),从这个过程中完全可以看出他分析问题解决问题的能力到底如何,毕竟很多人的研究压根就经不起推敲和询问(U276)。到这里又有一个值得深思的问题,如果进行defense比单纯当一区数目更容易知道这个人的真实水平,那么他发不发文章这件事还重要吗(U277)?如果不重要的话那么收人时候还需要管他发了多少篇文章吗(U278)?

现在在推代表作制,这不仅是在考学者,更是在考领导的水平和态度(U279),如果领导认为一区数目才是代表一个人的学术水平的话,那么收进来的必然是只会水文章的paper machine名校菜鸡,他们根本就不能解决任何实际问题。但反过来,如果领导觉得能改变什么才比较重要的话,那么就会用心分辨谁是菜鸡谁是高手,最后收进来的也必然是可以改变世界的人。而不同的选择也必然会面临不同的结局,到时候就会出现两极分化的情况(U280)。当然我也接触过很多学校学院的领导,其实我相信他们的心都是好的(U281),都是希望可以让自己学校变得更好,让自己的学生可以成为一等一的任务,只不过由于受到之前国内看重SCI风气的影响,因此产生了一些误区,也正是由于这种误区才会让某冲冲这种水平的货色评到了教授。但是这种误区并非是不能改变的(U282),本文就是一个很好的建议不是么?至于之前国内看重SCI这件事,其实这个政策在当时的国内环境下是起了推动作用的(U283),那时候整个中国都没什么文章,对外的学术交流也不够多,因此鼓励大家发SCI是有助于提高国内的学术发展的。只不过到了今时今日,中国已经不缺SCI数目了甚至还排到了全球第一,我们真正需要的是质量,这个科研成果的质量就是可以让我国完成产业升级、掌握核心科技的关键部分(U284)。而为了知道什么才是可以改变世界的优质成果,就不应该从期刊中去学习怎么做研究,就不应该把自己目前的小圈子当成是世界的全部,而是应该从那些已经深刻改变过世界的成果中去总结他们发现问题解决问题的过程,然后就可以发现他们的过程几乎是一致的(U285),也就是本文所说的学术研究过程。

学界制度的改革势在必行,找到了正确的评价体系和方向,再给与5年时间去净化环境(U286),我想未来的情况一定会比现在好得多,这些都是于国于民有利的事情,应当坚持到底(U287)。如果5年以后私利为重的人依旧不知悔改,继续水文章不去提高自己,那么国事为重的人就一定会毅然决然地站在这些人的对立面,同他们斗争到底(U288)。我希望大家都明白一点——侠之大者,为国为民,不问私利(U289)。

四、学术带来的一些思维习惯

从六年前决定搞学术之时,本人就坚信读博的最大价值不是一个title和工作机会,而是一种思维训练(U290),有了这种思维训练就可以融会贯通帮助自己处理好诸多事物。这几年研究学术的过程中,我也确实受到了这个训练体系的正面影响,并养成了一些思维习惯。下面就简单地跟大家分享几个习惯,权当交流,也希望有助于各位的思考。

接受一个真实的世界

上文我们讲了很多遍,做研究不能跟真实的世界脱节,不然就不能解决现实世界中的问题。那么对于我们呢?我们就真的有接受这个真实的世界吗?当我们思考问题推测事情的时候,又有多少是主观臆断的结果先验呢?你真的就有了解那个真实的情况是什么吗?孔子误会颜回都会说眼见未必实,那我们看到的东西就真的如我们想象的那样吗?学术的一个重要价值就是改变结果先验,使得人们对人对事的时候变成问题先验,以事实为依据,从主观臆断到接受真实世界。这个事物它是什么就是什么,不要自己去想象一些事,这也就是科学精神中包含的一种重要品质,也就是实事求是。同理,你做决策的过程也应当为事实为依据,而不是凭自己的感觉臆测去做事情。

学会解构

上文提到了mechanism、concept和methodology,也就是一件事为什么会发生、它到底应该是什么又该采取什么样的方法去实现它,那么对于你自己的人生呢?我每次带学弟学妹做事或者回答来咨询是否要读博的他人时,都会问他们两个问题,“你想要成为一个什么样的人?”、“你以后想过上什么样的生活?”。这两个就基本决定了你该怎样进行人生规划。那么人生目标大方向应该有哪些呢?当你确定了你的人生目标以后,到底该如何实现呢?为了实现你的人生目标,又有哪些必须要培养的能力呢?目前实践中我选择这个方向在各个细分领域的活动过程又是什么?我改如何去更改它才能使得自己的发展与组织的发展统一起来?关键的几个节点又是什么?该采取哪些具体的步骤去实现它了?

不仅针对于个人,对国家又何尝不是一样?这个国家目前最需要的是什么?目前产业与世界顶尖之间的差距到底在哪里?如何去一步步实现国家最需要的事物?个人的命运又将如何与国家大势联系起来?这些都是值得大家深思的问题,而且都是与本文所说的内容有关,而这些问题的不同回答也将带来不同的人生。

质疑前提

上文说了,每一个事物都会有一个目前实践的concept,而这个concept中也会包含一些前提假设,因此在分析事物的时候应该学会抓这个事物的默认前提假设,然后看这个前提假设对不对。实际上本人是先抓前提假设然后才突然明白了什么是concept。

一个简单的例子就是大部分人的学术世界观:你觉得什么才是研究?能发出文章的就是研究。你觉得什么才是研究的表现形式?多发期刊。你觉得什么才算是高水平的研究?发顶刊。你觉得什么样的学者才是真正有水平的学者?发了很多顶刊的学者。你目前对学术的理解从宏观角度来说会产生什么样的结果?挺好的啊发文章多不就是代表中国学术变强了么。你对学术和学者的理解跟那些已经改变过世界的成果和人物之间有何不同?有什么不同吗你看改变世界的人不也是发文章么。

同样的例子还有期刊好坏和大学好坏,为什么那个期刊好呢?因为它IF高。为什么那所大学好呢?因为它在大学排名榜单上高。可是如果这个默认前提本身就是错的呢?IF高的期刊就一定比IF低的好?大学排名排高的就一定比排名低的好?习惯于默认前提的人,又如何能真正去改变什么?首先要抓到目前事物的提前,然后思考他对不对,这就是科学精神的第一步,质疑精神,我们需要敢于质疑我们所见到的一切,包括大佬们的说法,要思考真正的未来到底是什么。

五、思维运用

学术给我带来的思维习惯其实挺多,我这里就简单分享几个例子,再深一步是如何去运用这种思维去解决生活中的问题,服务于自己的人生目标。我们上面说到了解构,我简单提一点,人生目标的方向,大体上来说无非就三个,从政从商从学,这是对人生目标的解构。那么这三个方向又有哪些能力是必要的呢?这就是再次细分解构,也与学术思维有关。我们的学术思维该如何在这三个方面运用呢?下面我们通过每个部分举两个例子的方式来介绍,权当抛砖引玉。

如果你想从政的话,那么至少需要考虑的有这两点能力:机构改革和公私合营。

机构改革,以这次的军改为例,确实很精彩,这也是一个经典的多象共因案例,大家可以好好学习一下。大致的problem statement有三个:一是总部制不便于军委领导,二是大军区制容易形成帮派团体,三是不利于跨军种联合作战。这三个的问题范围其实并不相同,服务对象也不相同,每一个单独改都是会牵动其他,但是他们的根源因素都是一样的,那就是军队的权责利划分有缺陷,这就是典型的多象共因。那么合并处理后的prototype就是现在的军委管总、战区主战和军种主建。这中间的具体分析过程我反而建议有兴趣的读者自己去匹配总结,这样有助于你理解这个过程。

还有公私合营,一个经典的案例是港铁模式,也就是国内目前在推的TOD。以前的地铁开发模式是政府直接出钱建设,这样导致了建设效率低和财政负担大,这就是产生了一个偏差,即以前的政府融资模式不能很好解决地铁修建的资金不足性,表象成因是政府出资紧张,根源因素是土地拍卖方式来带的财政收益不够多,服务对象是香港政府。而此时地铁站周边的地价物业都随之增长让开发商都赚的叮当响,这时候就产生了最终假设——通过在修建前卖高周边地的方式来进行融资。接下来“什么才该是政府出资的内容?”所有权的公私比例。“如何执行公私合营?”按目前地价拍得土地后再给与沿线物业开发权。“如何保持这个公私合营得以一直进行下去?”地铁建成后生意红火客流不息,物业升值涨价后按比例交税去支持新地铁的建设。这就是学术思想运用的一个经典案例。

如果你想从商的话,那么至少需要考虑的有这两点能力:产品设计和商业模式。

产品设计经典的案例就是iPhone的诞生。iPhone诞生之前的手机市场是被塞班垄断的,但是塞班系统确实臃肿缓慢,运行起来迟钝,操作麻烦,不能满足人们的需求导致人们迫切希望新类型的手机出现,于是塞班系统的运行过程就成为了mechanism,表象成因是用户体验差,根源因素是系统设计有缺陷。那么“什么才应该是用户体验的内容呢?”iPhone背后支持的理念。“如何使得用户感受这个新的用户体验呢?”iPhone软硬件。“如何使得用户保持去使用这个行的用户体验呢?”线上线下的app store。大家看出来了么,这就是一个典型的多表共象的研究。

而说到市场分析,绕不开的一个经典案例就是拼多多的崛起。不要小瞧黄峥,此人绝对是一等一的商业高手。之前淘宝京东天猫这些电商平台主要针对的是城市市场,通过平台收费和平台广告的方式将价格抬高了不少,因此很多对价格敏感的人都不会从上面买东西,这些人就是总理口中的月收入仅有1000元的那6亿人。因此表象成因是价格高了,根源因素是价格组成不合理,成本中的成本之外平台费和广告费都很高导致了售卖价格高。那么“什么才应该是价格的内容?”减少平台费和广告费,薄利多销。“什么才应该是购买者获得新价格的方式?”互相分享互助砍价等等,以降低了广告费。“什么才是保持购买者不停使用这个新价格的方式?”大卡会员,游戏赚折扣。这一场战打得太漂亮了,也是学术思维运用的精彩案例。

如果你想从学的话,除了刚刚上文所说的学术研究过程和代表作积分制之外,至少还需要考虑的有这两点能力:学校评价体系改革和横向课题改革。

学校评价体系改革,就是从原来的985 211变成如今的双一流建设。双一流其实是在学习德国的大学卓越计划,也就是精英大学计划了,不过这里我们还是讲双一流,毕竟大家更熟悉一些。 在双一流之前大学的建设情况整体来说出现了一些问题,比方说各个学校的发展模式相同都在做大而全的大学,同时各个学校之间等级固定导致缺乏竞争没有活力等等等等,这就是我们所说的一个偏差,原来的制度并不能很好地满足人们对大学健康发展的需求,因此我们需要解决它。表象成因是大学发展方式有问题,根源因素是因为大学评价体系有缺陷。那么“什么才应该是大学发展方式的内容?”特色发展,一流学科与一流大学。“什么才应该是执行新的大学发展方式内容的方法?”评估标准。“什么才应该是保持执行这个新的大学发展方式内容的方法?”动态评估。

横向课题改革。国内现在对横向课题卡得很死,这点说对也对说不对也不对。说对是因为很多人拿横向课题完全就是想中饱私囊让自己赚钱,因此需要限制;说不对是因为还有一些横向课题其实是有很高研究价值的,只不过是看怎么去做。如果是企业出钱让学者去做业界普遍实践的事,把学生当成是企业廉价劳动力,那就毫无价值。但是如果是企业让学者从这个公司的个性发展到所有公司的共性,在此基础上提出一个解决方案,最后在企业进行实测,效果好的话就变成企业专利行业标准呢?这样的横向课题也一样很有价值很有意义,在德国这就是第三方资助,最后也是要出原创性科研成果的。它对应的学术问题就是“什么才是校企合作的内容?”权责利。“什么才是校企合作的执行方式?”具体解决方案和测试。“什么才应该是保持校企合作稳定进行的方式?”专利和标准。

当然实际上思维运用的地方远比我说的这些多,只不过这里意在抛砖引玉,因此只举了很少的例子,感兴趣的读者可以自行思考运用。

六、我的学术世界观

讲完了以上的内容,回到第一部分,回答一下我的学术世界观:

你觉得什么才是研究?探究本源。

你觉得什么才是研究的表现形式?答辩视频文章报告会议等。

你觉得什么才算是高水平的研究?改变世界。

你觉得什么样的学者才是真正有水平的学者?影响他人,改变世界,折而不挠,为此而生。

你目前对学术的理解从宏观角度来说会产生什么样的结果?创造出一个更美好的世界。

你对学术和学者的理解跟那些已经改变过世界的成果和人物之间有何不同?他们即是我追求的榜样,从他们身上总结学术的品质和过程。

也正是秉持着这样的学术世界观,因此我才会跟我的老师一起花费很多时间精力去学习去思考去讨论并最终得到我的学术训练体系。刚好这里有空,就顺便跟大家分享分享这个学术训练体系的来源吧。

在我得到我这个学术训练体系之前,我进行了大量的阅读、讨论和思考分析,总结起来,本人学术训练体系的来源主要有七个方面

一是对研究方法的学习,具体包括两种方式。1.对经典著作的学习和思辨,这里是我的一位恩师强烈要求我学习的,所以我阅读了至少十几本教人怎么做研究或者学术(英语)写作的书籍,中外作者写的都有,中英文书写的也都有,包括大家耳熟能详的《研究是一门艺术》、《芝加哥大学论文写作指南》等等,通过对这些书籍的学习,我其实能发现它们每本书之间不同的研究范式和研究过程中看重的东西,最后能比较能出它们各自的优缺点,实际上对我启发更大的著作是布莱恩·格雷特姆的《思考是一门艺术》以及Desmond Thomas的《The PhD writing handbook》,而卖得特别好的像《研究是一门艺术》,我反而认为它跟我大部分介绍研究方法的书一样都是写得不好,因为这些书都是明显的围绕单篇journal paper/essay书写的“结果先验”,即你写这篇文章的范围就是一篇journal paper或者essay,你做所有事情都是想证明你的论点是正确的,可是却无法得出一个完整的研究课题那样存在关联的工作量,也无法给出证明为什么要有这个论点,当然造成这个结果的一个重要原因是因为这些作者大多是搞文学专业的出身,因此对于社会科学、工程学、自然科学等领域的知识和了解是欠缺的,最后导致所提出的研究方法也是有缺陷的,当然对我来说我需要的就是取其精华、去其糟粕、为我所用。2.听著名学者讲他们的研究方法,并对他们介绍的研究过程进行总结和思辨,请注意他们并不是在说如何做一个具体的研究课题或者某某具体解决问题的技术(method),而是一个抽象且通用性的教人怎么分析问题并提出解决方案的研究方法和过程,就跟我这篇文章有点像,只不过有的是单纯讲自己所在学科类别的研究方法和过程,有的讲得更通用所有学科一些,这样的讲座我大概也听了十几二十场,包括诺贝尔奖获得者、院士、某某学科建立者、世界知名大学的院长等等,总之最起码都是各自领域的知名大教授,而且相对均匀地分布在了工程学、自然科学和社会科学三个不同的学科类别。这其中也能看出来,这些学者之间虽然水平参差不齐(毕竟有些只是各自领域的知名大教授,而这个知名的来源有很多种,你懂得),但是却可以发现和感受到一点,即水平真正顶尖的那些学者之间,他们做研究的过程,或者说分析问题、解决问题的逻辑结构是有高度一致性的,比如说我听林毅夫老师讲他是为什么又如何建立起新结构经济学的时候,我发现这个过程跟我另一位院士恩师给我介绍的BIM的产生发展过程和逻辑其实很接近,也即我文章里说的,学科之间的差异不影响他们分析问题解决问题的逻辑结构是一致的;而同时也能看出来,我觉得讲得有问题的那些知名大教授,他们容易被argue的地方在哪里,这里我可以说,光是对于研究方法的学习,我至少经历了30种不同关于如何做研究的方法内容的学习和思辨,而且这些报告者和作者要么就是成果经过现实检验很有效的那种大咖要么就是成名的人物,也就是说他们教人怎么做研究的内容本来就是经过实践检验的、至少一定程度上是有效的。

二是大量的不同领域的期刊会议文章学习和思辨。这里之所以要特别强调是会议和期刊,是为了跟下一点进行比较,不过这里先不说。我从14年10月开始正式进行我一位恩师的学术训练(是的就是这么晚,因为我之前没想过走学术路线hhh),当年阅读量还不是很大,因为在打基础培养阅读速度什么的,但是从15年开始一直到18年,我每年的期刊会议文章阅读量是400+,并且由于我个人的兴趣点以及学科交叉的原因,这400+里面大约有100是来自于社会科学领域,剩下300左右都是工程学领域。19年开始我每年的期刊会议阅读量降低到了100+样子(理由后面解释),但是工程学领域和社会科学领域差不多各一半。也就是说,我从15年开始至今差不多阅读了近2000篇期刊和会议,其中大约四分之三是工程学,但是也有四分之一是社会科学。而我自己看也会比较这些文章的好坏,去思考好是因为什么、坏又是因为什么,这些都有助于我总结出那11种常见的rubbish work类型。

三是大量的不同领域的博士论文的学习和思辨。这里也是上一点那位恩师要求我做的,18年之前都是精读了几篇他推荐的优秀学者的博士毕业论文,但是18年开始,我开始大量精读博士毕业论文,中文英文的都有,但是基本都是大佬自己或者大佬学生的博士论文,算下量到我20年9月写这个知乎文章的时候,我已经差不多精读了100出头的博士论文,其中工程学占据了三分之二,社会科学占据了三分之一,当然我现在也在保证每个月至少精读一篇博士毕业论文,这是我降低期刊会议文章学习的一个重要原因。通过对博士论文的学习和思辨,其实能看出来这些博士之间、以及他们导师之间的水平差距(毕竟成为大佬的原因有很多,但未必代表水平顶尖,你们懂得),因为有些写得确实很差,差就在差在逻辑上,而不是用了什么酷炫的技术手段,而优秀的博士论文其实在分析问题解决问题的逻辑结构上有着高度的一致性,能看出来他们创新的地方,而且文章内容几乎是成体系的,也就是解决方案中不同章节之间是有明显逻辑关系的。而且一个顶尖的导师,他的博士们水平几乎也都是一致顶尖的;对于水平不顶尖(这是个很大的范围你们懂得)的大佬来说也一样,他的博士们水平几乎一致地跟他一样程度的不顶尖。所以这里就能逐渐看出一个很模糊的端倪,那就是质量等级也是有层次的。

四是跟我四位半恩师们的学习、交流和讨论。我那四位半恩师,都是各自领域响当当的顶级学者,不仅有着极大的知名度和影响力,更重要的是他们的科研成果对整个行业都产生了很大的影响,也都十分擅长培养学生。所以我这里也总结一下,恩师们是从哪几个方面帮我建立起这个学术训练体系的。1.对前人研究的讨论和思辨。比如,前几年我在读文献的,我按恩师的要求每篇文章都做了50-70英文单词的笔记,也就是自己发现了什么或者想到了什么,但是那位要求我读文献的恩师,会每周或者每两周给我回复批注,也会跟我讨论这里面的过程,但是最后都是要求我看到我整个研究的分析问题解决问题的逻辑过程并跟我讨论这篇文章逻辑过程的优劣,而不是囿于具体的技术方法。实际上,我那四位半恩师都会跟我讨论某个前人研究的好坏,并且重点都是从逻辑上去抓,而不是从具体技术手段高不高级去判断它好不好。而我跟恩师们交流的频率也很高,想到什么可以直接去找任何一位老师聊,我的博导则是那种,只要没事就每天必然来办公室找我或者其他同事讨论,跟我们聊课题或者逻辑结构等,一来就是半个小时到一个小时的那种,有问题有疑惑就给我当场解决,以至于我跟我博导的正式meeting都很久才会一次,因为可能我们连续一个月每个工作日都会讨论半个小时以上,这还要啥正式meeting……2.自身学术训练体系的直接继承与发展。我的学术训练体系,其实最初是来源于他们传授的学术训练体系,也就是他们自己各自有一套做研究的过程和逻辑(对应我上文的Q部分),也有各自一套培养学生、书写论文的方式,比如每个节点应该做出一个什么逻辑过程并且要做成什么样子,又该如何通过写作的方式表达出来,也就说学术训练体系之所以被我感受到是体系,是因为他们一开始就从这三个方面来培养我训练我,这让我对“事物的体系”到底应该是什么开始有了更深入的思考。但是这里我没有完全采用他们某一个人的学术研究过程,因为实际上,这四位半恩师的研究过程各有各的风格,也各有各的优缺点,但是神奇的事,他们各自的研究过程刚好可以互补。于是我就总结、继承并发展了他们原本的学术训练体系,吸收了它们各自的优点并改进了它们的一些不足,最终形成了自己的风格。3.对现实活动现象的了解。我的四位半恩师们都特别强调研究要解决现实问题,因此他们经常要我去调研去证实去了解现实活动和现实现象到底是什么,不允许我自己拍脑门,这让我看问题更加客观,也更能发现很多文章的问题其实都是因为跟现实脱节,而这种脱节来自于他们的研究过程和逻辑中的某个连接处出了重大纰漏。同时这里我也开始有了mechanism的意识。4.本源意识的树立。我的恩师们很早就跟我强调ontology是什么,以及学术应该是解决问题、寻找本源,而不是发文章和搞钱,因此我在他们的引导下我逐步了解有关内容,并且写了很多心得体会发给他们审阅,他们都会给回复、建议和批注,包括但不限于我这篇知乎文章,他们也都给了极其正面的回复和批注。5.研究方法的推荐和学习。上面也说了,其实最早开始看研究方法的书就是我恩师强烈要求的,并且他们中间会随时给我发来一些关于如何做研究的学习资料要我学习,不过大多是期刊、网页等内容而不是书,毕竟欧洲书这么贵所以书都是只给我发书名的……包括我最早知道induction、deduction和abduction也是因为我那半位恩师。我的博导则更倾向于引导我自己去找书,但是他会根据我的情况告诉我这个点我应该重点看什么书,比方说他会叫我不要多看期刊会议,而是找能帮助我理解并完善什么是方法论的书,并且发来一些电子书(终于不再是书名了!)和一些有关资料,然后我就发现了笛卡尔的《方法论》并开始学习,也知道了后来笛卡尔的方法论是如何被系统工程所取代的。这个学习笛卡尔方法论的过程就引出了下一大点。

五是对不同领域的学科发展史和技术发展史的学习和思辨。上面说了,我看了笛卡尔的《方法论》,并且知道他提出的方法论最终被系统工程所取代,也就是系统工程产生的背景、原因以及产生的结果,这个演变过程很有意思,再加上老师们之前跟我讲过的以及我自己看书的一些技术的发展史,于是我就开始从18年开始加大力气去理解不同领域的学科发展史和技术发展史,这也是我后来期刊会议读少了的原因。这里还是要分为2个部分来说:1.对学科发展史的学习和思辨。这里我的涉猎不仅包括了工程学领域,也包括了社会科学、自然科学、人文艺术学科的领域。比方说大家所熟知的《科学革命的结构》,这本书讲了很多自然科学领域的学科发展史,讲述了那些旧的科研成果是因为什么而被否定推翻,那些新的科研成果又是如何产生的。当然我看的不仅是这本书,自然科学领域我还看了量子力学的学科发展史、生物学的学科发展史、宇宙学的学科发展史等等,这里让我认识到一个很重要的东西,那就是偏差的重要性。而社会科学领域,我则是马克思主义有关的学科发展史开始看的,马克思主义为什么会产生?它是如何进入苏联并最终发展成为苏联模式的?苏联模式又为什么失败?毛选邓选江选之间的发展演变过程又是什么?他们又为什么演变成这种理论体系而不是其他理论体系?决定他们最终变化成为这种理论内容而不是其他理论内容的原因又到底是什么?这里我开始更加理解mechanism,也开始逐步发现了根源因素的存在,并且开始思考concept的组成到底应该是什么。不过这里要说明一点,关于马克思主义的有关专著我其实已经看了十几年,只不过从这时候开始我开始有目的地梳理这个学科发展史的演变过程,当然我看的也不只是政治学有关的学科发展史,我也梳理了很多其他社会科学的发展史,比方说经济学、管理学等社会科学的发展史。工程学也一样,说起来好笑,很早之前因为我研究方法搞偏了结果就开始看香农提出的信息论,然后这个时候再回头去梳理为什么香农会提出信息论,然后再梳理到我自己的学科领域,再梳理到跟我目前方向交叉的计算机领域,结果都能发现一个明显发展逻辑,而且这个逻辑跟自然科学和社会科学学科发展变化的逻辑是高度一致。再谈到人文艺术学科,先说哲学,从马克思主义和中国的诸子百家开始感兴趣,然后回头看其他不同的哲学流派,然后都会发现,每一个哲学流派都不是突然从石头缝里蹦出来的,而是因为前面的哲学思想有问题,所以才导致了新的哲学思想被提出。而艺术学科,我自己比较喜欢印象派,于是这时候也会开始有意识去看为什么印象派会产生,以及变化成这种理念和方式;艺术领域还有中国流行音乐的发展简史,其实每一次新流行音乐的产生往往也是不满足于上一个时代的音乐方式,所以才被创作出了新的音乐形式,比方说我的男神偶像周杰伦就是这么成为了开辟新时代并站在巅峰顶点二十年的男人。这里又可以看出,即使在认为艺术学科领域,学科发展的逻辑其实也是跟其他学科之间发展逻辑高度一致的。2.对技术发展史的学习和思辨。这里就要涉及到一个更微观的技术层面,我自己的恩师曾经给我讲过BIM的发展史,然后我也看过AR的技术发展史,梳理之后就发现即使是在某个技术层面,突破发展的逻辑过程也是跟宏观层面的学科发展史之间有着天然高度的一致性联系的,然后再回过头去看其他学科领域,发现也存在同样的情况,比方说社会科学领域常用的扎根理论的提出,或者自然科学领域牛顿力学的提出,但是这时候就有一些很有意思的事情值得我们思考了,比方说,为什么是牛顿三大定律而不是牛顿五大定律?这三个之间的关系又是什么?为什么遗传定律也是三大而不是八大?孟德尔一个人提出了两大,但是最后一大是很多年之后别人提出来的,那么为什么非要选这个人提出来的作为最后一大?这遗传三大定律之间的关系又是什么?热力学本来好好的三大定律,怎么突然就来了第零定律,他们之间的关系又到底是什么?诺贝尔化学奖授予冷冻电镜,但是为什么是这三个人而不是其他做冷冻电镜的学者?他们之间研究又有什么关系?然后再回过头去看,这些被写进教科书的科研成果,跟我之前看到的文章又有什么不同?跟我之前看到的博士论文又有什么不同?跟我之前学习的研究过程又有什么不同?总结起来就是在思考,它们为什么产生?又为什么非得变成这样?它们跟别人提出的答案又有什么不同?这里就慢慢让我看到了整个研究的过程到底应该是什么,也明白了学科的宏观层面与技术的微观层面是统一的,而一项技术本身也会得到发展的,因此对于“从0到1的工作”的定义,就不能认为是非要像图灵一样建立一个学科才算,因为在计算机学科之前,人们就已经有计算这个学科领域了,而是要建立一个新的标准才行。

六是对经典学术著作的学习和思辨。我的课外书阅读量一直都不低,18年开始我才开始养成记录字数的习惯,也就是读过一本书后就记录我阅读了多少字,这里只计算课外书,不算读文献看公众号知乎什么的,之前都是只看书不记录字数结果自己都不知道自己到底看了多少。所有目前有记录的结果就是,我每年阅读量都是超过1000万字的,这其中都有不少经典的学术著作,包括自然科学、工程学、社会科学、人文艺术学科。18年之前我没记录,但是根据我的习惯去倒推和回忆,我从上大学以来,这十几年里读书最少的一年应该也有300万字。而这些经典学术著作,他们研究内容的产生过程其实是很符合我介绍的学术研究过程的,比方说《棉花帝国》的三个部分就完全符合我提出的三个sub-concept,类似的例子还有很多。当然我看过的经典学术著作有很多,在我还没得到我现在的整个学术训练体系的时候,这些经典学术著作也启发了我很多并最终让我得到了这个学术训练体系。当然到这里也许你会问,我哪来那么多时间阅读思考讨论,这就是我之前所说的代价,也就是到现在七年不允许我发期刊,只给做自己的研究课题,然后掌握这套学术训练体系。在我正式毕业答辩之前,我都得承受这种代价。

七是跟其他学者的交流。这个好理解,我自己认识很多老师和硕博(我微信里的老师硕博估计都超过500了……),各个领域的都有,包括自然科学、工程学、社会科学、人文艺术学科,不止是我自己这个方向,大家也会经常交流介绍彼此做的课题、做研究的过程、老师培养学生的方式以及学生自己做研究或接受老师指导时候的疑惑等等,这个过程也让我能发现这些老师或者硕博在学术水平以及培养学生水平上的巨大差异,最后有助于我完善我这个学术训练体系。

这七个方面就是本人学术训练体系的形成的现实来源。也就是说,这个学术训练体系并不是我自己拍脑门产生的,也不是从石头缝里蹦出来的,而是从那些已经深刻改变世界的科研成果中、在大量的研究范式和诸多类别学科知识的学习基础之上、在无数次跟我的恩师们以及其他学者之间就各种科研成果的思辨分析和讨论之上、在对不同类别学科发展史技术发展史的学习总结基础之上、在对我恩师们原来各自的学术训练体系的继承和发展之后,最终总结并发展出来的,它有着极其强大的现实基础,是基于事实的论证。

也正是因为它是基于事实的论证,那么如果要推翻我的论证,就应该从三个方面入手:

一是证明某个从0到1的工作,其分析问题解决问题的逻辑过程,与我提出的这个过程完全不一致。也就是用事实来证明还有其他的研究范式。不过这样只能证明我提出的这个过程并不是唯一的可以实现从0到1工作的研究范式,并不能完全推翻和否定我的学术训练体系。

二是论证我举的例子实际上是全部以另一种完全不同于我这套研究过程和逻辑的方式产生的,并且你论证的这种完全不同于我的新方式比起我提出的这套研究范式,能更好地解释从0到1工作产生的过程和产生结果,这样也可以推翻我的论证,毕竟这套新方式是完全不同于我的。换句话说,也就是用事实来论证我的论据内容完全不符合我的论点。

三是论证我提出的从0到1工作产生的研究过程存在重大逻辑漏洞,并且用事实来证明这个漏洞会必然导致现实中的错误,以至于我前后文完全无法衔接上,都不需要用到我后面举到的例子,也就是用事实来论证我论证的过程有重大逻辑问题。

但不管是哪一种,都同样得是基于事实的论证,都需要有着现实的证据来证明,这才是真正的科学精神。实际上,我会很欢迎鼓励大家去进行这个推翻的论证,因为这个过程不仅会让各位自己变得很强,也更有利于更多人去思考才是学术,从而为接下来的学术改革做好准备。

但是如果没有更好的论证和解释,那么我的论证过程就是最符合实际情况的解释和过程,那么我的学术训练体系就必然会成为范式,并且终将得到大规模推广应用,并且开辟新时代,这只是时间问题而已。

实际上,我的学术训练体系已经在除我之外的多位世界名校的博士身上得到了验证(意思是,我基本等于他们实际的PhD supervisor或者PhD co-supervior),实践结果相当好,不仅帮曾经要死要活没进展的他们顺利毕业了,还帮他们成功找到了世界名校的教职,这已经不仅是面试技巧和发文章技巧的问题了,而是他们成果impact的问题。他们也会同样将这套体系传给他们的学生和合作者,我也会。此外,截止目前为止(2021年10月),直接跟我取得联系并给我学术训练体系正向反馈的正教授已经有十几位了,包括院士等帽子、顶刊主编副主编、不同大学的院长副院长等;如果算学者人数(AP、副教授和教授一起),直接跟我取得联系并给我正向反馈的人数超过100人,而且也有不少来自于世界名校,并且他们还将这个文章推广给了自己的学生们;如果算博士人数,直接或者间接(点赞收藏都有但是跟我没互动就算成是间接)跟我取得联系并给我正向反馈的,超过200个,同样很多也来自于世界名校。而且这些人分布在不同学科领域的,这就是对未来力量的积蓄,也是对我学术训练体系的实践和有效证明。

当然比起支持人数,最后还是以事实为依据来进行论证,毕竟每一个新范式在开始之初都没有多少支持者,而每一个旧范式在被取代的前一天都有无数支持者。但与我而言,不管怎么样,都希望这篇文章能对大家有所启发,也希望这套范式能真正促进我国学术界的改革和发展!

你可能感兴趣的:(程序员读论文,科研训练)