你好,我是孔队,这是我在上的第一篇文章。我是一名国际高中英语老师,雅思8分,CATTI笔译二级;坚定的唯物主义者和终生学习者,试图用进化心理学、行为经济学、神经科学的思维固件,强行更新我这颗硬件配置与几万年前相差无几的大脑。欢迎关注我的微信公众号“自学自学”,查看更多优质原创文章。
大学生最熟悉的单词:abandon
作为中国大学生最熟悉的单词之一,abandon这个词的背后,是一本本前几页各种笔记、后面百来页崭新的词汇书的怨念。
很少有一种书籍像英语词汇书这样,给使用者带来一波又一波的绝望:
翻开第一个List,一半不认识,绝望;
好不容易背完,发现已经过了快一个小时,绝望;
背到第二个List,发现还是没几个认识的,绝望;
第三天不想背了,复习前面两个Lists吧,发现已经忘了一半以上,绝望;
在绝望中往后翻了翻剩下的四五十个Lists。OK,明天骗个师弟师妹把这书给买了。
为什么背单词这么痛苦?作为大学后没背过一本词汇书、却在雅思阅读中强行拿了满分的投机主义学习者孔队,我现在就帮你解决一个价值至少等于3000个单词的问题:
你真的需要背词汇书吗?
你是一个给所有罪犯都判死刑的法官吗?
先看看这几个字:火,水、又这三个字你肯定认识,那燚、淼、叒呢?(那位答出来的同学请坐下)
你肯定会反驳我,这些词平时都见不着,我干嘛要知道?说的好,所以:
在真实的语境中,用的越少的字词,背它们的必要性就越低。
可是为什么到学英文的时候,我们却直接无脑地抱起一本词汇书就啃,却忘了思考这个问题?原因大概有以下两个。
一方面,只有不断接触、使用一门语言,才知道这门语言中哪些词汇常用。大多数学生基本没接触过教科书和试卷以外的英文,所以对词汇的频率没什么感知。
另一方面,市面上很“方便”地提供了各类考试的词汇书,比如为参加雅思考试的学生“定制”的《雅思核心词汇》这样的词汇书。
这时候你会问,词汇书的名字不写着“核心”“高频”词汇吗?词汇书里当然覆盖了很多重要的单词,但是,这些词汇书编者的逻辑可是这样的:
“你只要背完了我这本词汇书,考试中就基本不会遇到生词了。”
然而,他们从来没有意识到,买书的那些学生可不像他们一样,对单词有着极高的热忱。大部分学生的真实画像是:对英语很头疼,背了几个或者十几个lists发现前面背了后面忘就放弃的人。
(瞬间很心疼编写词汇书的人有没有)
所以,背单词的第一步,是尽量缩小背单词的范围。
如果能背少点就通过考试或者满足工作需要的话,我何必背那么多?
拿起一本词汇书,试图背下每个单词的学生,就跟每个罪犯就直接判死刑的法官一样荒唐。
只要掌握不到1%的单词,你的英语水平就能达到TOP1%
那问题来了,我们究竟需要掌握多少个单词?
语言学家Alexander Arguelles的研究表明:
250 words constitute the essential core of a language, those without which you cannot construct any sentence.
250个单词构成了一门语言的核心,未掌握的话无法构成句子。
750 words constitute those that are used every single day by every person who speaks the language.
750个单词构成了每个人每天的日常表达。
2500 words constitute those that should enable you to express everything you could possibly want to say, albeit often by awkward circumlocutions.
如果掌握2500个单词,你就能够表达出任何想表达的意思,尽管经常需要迂回地借词。
所以2500这种被海淀区小学生吊打的词汇量,都可以随意表达?
再来看看词典出版社柯林斯在官网中给的说法:
About 90% of spoken and written English is made up of approximately 3,500 words.
口头和书面中90%的内容都是由大约3500个单词构成。
原文网址:
http://news.collinselt.com/cobuild-dictionary-online
另一个权威词典出版社麦克米伦则更加严格:
Although the English language has up to a million words, native speakers use just 7,500 words for 90% of what they speak or write.
英语虽然有多达一百多万个单词,但是其中大约有7500个单词,构成了母语者在说、写所用到词语的90%。
原文网址:
https://www.macmillandictionary.com/learn/red-words.html
只要掌握几千个单词,就可以应对语境中90%以上的情况。
如果你小宇宙爆发,背了最常用的一万个单词(占全部英文单词的1%不到),你在中文母语者里,英文水平绝对能排在前1%。那这个结论自然会让我们想到下一个问题是:
哪些单词是英文中最常用、最核心的?
01 权威的大数据:国家级语料库
国家级语料库机构,就是由国家级的语言研究机构牵头,整理统计本国语言在各类真实语境中,所有单词的使用情况。
自然,他们也统计了每个单词的使用次数,并形成了一个词频表。在词频表上,越靠前的单词,在各种材料上出现的次数越多,越“核心”。
英语现在有美式英语和英式英语两个主要流派,所以英语的语料库就可以参考这两个国家的,即:
英国国家语料库 The British National Corpus (BNC)
美国当代英语语料库 The Corpus of Contemporary American English (COCA)
The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in 2007.
BNC覆盖了各种来源的、一亿个单词的集合,最新的版本是2007年的。
As the following summary table shows, most (about 90%) of the words making up the corpus are taken from written texts of many different kinds, but 10 percent —about 10 million in total — are taken from transcribed speech, recorded in both formal and informal contexts.
BNC的词汇来源中,百分之九十来自于书面文本,百分之十来自口语文本,具体的来源可以参考下面的列表。
(http://www.natcorp.ox.ac.uk/corpus/index.xml?ID=numbers)
(BNC的语料来源)
BNC的词频表统计了前15000,即《BNC最常用15000词汇》
(公众号首页回复“词频表”即可获取)
比起BNC,美国的COCA更霸气,他们整理了多达十亿个单词的文本:
The corpus contains more than one billion words of text (20 million words each year 1990-2019) from eight genres: spoken, fiction, popular magazines, newspapers, academic texts, and (with the update in March 2020): TV and Movies subtitles,blogs, and other web pages.
超过十亿个单词,覆盖八大类别:口语、小说、杂志、报纸、学术、电视剧、博客和其他网页。最近更新还是2020年3月,非常有时效性。
COCA的词频表统计了排名前20000的单词,形成了《美国当代英语语料库20000词频表》
(公众号首页回复“词频表”即可获取)
02 看词频表+托福阅读如何打脸词汇书
大数据是有了,但是真的靠谱吗?我们来看看。
在《X东方雅思词汇词根联想记忆法-乱序版》一书的13页当中,出现了refer和tram这两个单词。如果由你来判断,你会觉得哪个更常见?
你就算不认识refer(涉及;提及),肯定也在很多语境中见过它。refer to本身就是一个高频词组,更别提各种论文和书籍末尾部分不停出现它的派生词reference了(参考文献)。而tram(有轨电车),我们见得就很少了。
下面我们来看看两个词频表中它们的排名:
Refer– BNC #1246; COCA #1159
Tram– BNC #11281; COCA #15431
显而易见,在两个语料库的词频表上,refer一词的排名都达到一千多,如果你词汇量有2000以上,应该就会认识这个词;但是tram一词直接排到了一万名以后。
上面只是感性认识做出的判断,下面不妨看看在托福阅读TPO1-30加上四套OG,共计一百多篇文章中,两个单词的出现频率:
首先搜索refer,出现101次。
直觉告诉我没有那么多,往下看发现把prefer也算在内了(包含refer这5个字母)。继续搜prefer,出现48次。
即refer及其派生词(referred,reference等),在托福阅读中,出现了53次。
下面再看看tram,总共仅出现4次。
如果你背词汇书的话,确实会背下很多重要单词,但同时也花费了大量时间精力,背下了很多你这辈子都难得一见的单词。
所以,我们只要从前往后记这两个词频表上的单词就行了,根据我个人经验,背到个七八千的话,托福雅思就有希望冲刺满分(后面你会知道,实际背的单词会比这个还少)。
至于选择英国的还是美国的,可以根据你的需求来定。不过还是那句话,小孩子才做选择。
03 如何优雅地使用词频表
到了这里,在文章开头提出的,背单词的范围问题我们终于解决了。下一个问题就是:在背这两个词频表时,具体该怎么操作呢?
首先,剔除部分单词,减轻记忆负担
第一,开始背以后,你会发现一个福利:
词频表中,同一个词的不同形式分别统计成不同的词条。比如do,did,done,doing分别统计了它们出现了多少次,占据了4个词条,所以词频表中自带“水分”。
我个人认为这是个好事,既是复习的手段,也会给你造成背的单词比实际多的“错觉”,增加背单词的动力。
第二,如果你学习英语是为了考试的话,你面对的一般都是简单的科普文或传记。在这种情况下,政治类、宗教类词语是可以直接排除的。
比如BNC #1514的cabinet,我猜测排名如此靠前是因为在政治新闻中做“内阁”的意思,仅凭“储物柜”的含义无法达到这种排名。
大多数英文考试中政治类题材较少,所以政治类词汇建议都不背。(对政治有兴趣的可以自行记忆)
再来看看COCA #10028的diocese(主教辖区),这个单词我之前也不认识。其实包括美国在内的很多英语国家里,宗教都是国民生活中的重要组成部分。(说个题外话,这也可以解释,为什么最近很多美国人觉得比尔盖茨开发疫苗是“人类清除计划”)
但是英语考试中,宗教类文章和词汇几乎没有,大多数国人对宗教应该也不感兴趣。所以,宗教类词汇建议跳过。
其次,未给单词释义?优秀与否的分界线
我在自己的教学中,给过许多学生这些词频表。不少学生打开后,都会惊讶或抱怨没有中文释义。我只能说,建议这样的学生放弃出国留学。(当然,并没有胆子当面说)
词频表打开后,知道意思的可以直接跳过,觉得模糊或者不知道的,查一查正好是掌握它们的第一步;而且查一遍比直接看解释印象更深刻。
当然,更优解是直接使用英英词典查英文解释。在查单词的过程中,即掌握了这个单词的同义替换——所有英语能力测试考察的核心。不过这种操作需要一定的词汇量,我推荐在词汇量达到3500-4000左右再进行。
最后,记单词APP助力优雅地使用词频表
话又说回来,这种文档式的词频表确实也有不友好的地方:手机上查看不方便,有时也不记得背到哪儿了,怎么破?我觉得可以交给专业的单词app来解决。
我最近正在测试十几款不同的词典app和背单词app,真的是感叹难求一款完美的背单词app,莫非又要靠我找一个程序员来做出来?
其中我一直在用的“欧路词典”自带了COCA词频表,还以1000个单词为单位分成了20组,覆盖了COCA的20000个最常用单词。
可惜的是,大部分app都不支持定制的词汇表,只能用内置的词汇书,这两个词频表肯定没包含在内。但是个别app可以,比如“不背单词”就支持从它的官网网页上传词频表。
那到底哪款app更能跟这两个词频表擦出火花?请静候我的测评结果。
04 结语
背哪些单词?不要背词汇书,吃力不讨好,记好高频词才是王道;
怎么确定高频词?用好BNC和COCA这两个语料库机构的词频表;
词频表怎么用?剔除政治、宗教类词语,自行查询词义,利用好单词类app。
(公众号首页回复“词频表”下载)
关联文章:
记忆的原理是什么?终极的记忆原则是什么?——
记忆术探秘:我如何用郭敬明记住托福阅读的目录
怎样在第一次碰到某个生词时,高效而优雅地记住?(文中搜索关键词“电钻”或者“drill”)——
非英语专业的我,是如何通过自学做到雅思首考8.0分的
一背单词就头疼,我该怎么养成背单词的习惯?——
5分钟看全书精华:《掌控习惯》