试论基础英语教学词表的编制原则与方法
摘要:外语教学词汇表对课程的词汇教学提出具体要求,是大纲的重要构件。基础教学的词汇量目标取决于语言交际的基本需要和当前我国中学英语教学的实际水平。选词的主要依据来自大型语料库的客观统计,但要全面体现词表的通用性、实用性、有用性和教学适用性,经验数据也不容忽视。《英语课程标准》先后提供了两个词表,各有特点,但在内容结构和选词方面尚需做进一步的定量和定性分析,体例方面也有待改进和完善。
关键词:基础英语;课程标准;教学词汇表;核心词汇;词频
教学词汇表是外语教学大纲的一个重要组成部分,它对学习者在外语课程学习中应掌握的词汇量提出具体要求,是教材编写、课堂教学和测试的主要依据之一。部2001年颁布的《全日制义务教育普通高级中学英语课程标准(实验稿)》(以下简称《课标1》)附有一个包括约3300个单词和360个词组的词汇表(以下简称“词表1”),[1]2003年颁布的《普通高中英语课程标准(实验)》(以下简称《课标2》),对这个词表作了较大幅度的修订,推出一个约3 500个单词的新词表(以下简称“词表2”)。[2]本文拟从词汇量的确定、选词原则与方法等方面对基础英语教学词表的编制与修订进行讨论。
一、基础英语教学对词汇量的要求
掌握足够量的基本词汇是外语学习者获得初步的外语交际能力的前提。以英语为外语的学习者到高中毕业时掌握的英语词汇量,应该为今后升入高等院校继续学习或个人自学打好基础。我们可以从基础英语词汇的相关研究、目前我国高中毕业生实际水平、中小学英语课的总学时数等方面对这个词汇量的大小加以论证和确定。
学习者掌握多少词汇才能满足一般口笔头交际的需要?我们可以通过测定最常用的词汇量来得到基本答案。根据Brown语料库的统计,英语中出现频率最高的1 000个词在其全部语料(500个长度为2 000词的样本单元,共100万词)中的覆盖率为72%,3 000词为84.0%,5 000词为88.7%。[3]这类统计都以词目(lemma),即去除词尾曲折变化的单词原形为单位。若以词族(word family)为单位、每个词族平均3个派生词,3 000个常用词族的实际含词量可达9 000词目,覆盖率可增至92%左右。词族的概念包括词根、它的曲折形式和少量的常规派生形式,[4]但具体界定却并不容易,确切的计数仍需以词目为单位。
Hirsh和Nation统计了为本族语青少年写的小说的词汇量,发现2 600个高频词的覆盖率达到了96%。[5]这个结果表明,如果外语学习者掌握了3 000个常用词族,他们阅读这类小说时平均生词率约为5%,这不会对理解产生太大的障碍。Nation和Waring进而推论,认知3 000~5 000词族是理解语言内容的基础,复用式掌握其中的2 000~3 000词族可以满足说和写的基本需要。[6]
近十年来,大型语料库的建设已从千万词级到亿词级,为词典编纂提供了客观、可靠的依据。一些著名的英语词典都标明了3 000左右的高频词(表1)。显然,对这些最常用的词汇在基础英语教学中应予以优先地位和重点关注,3 000词的量可以考虑作为基础英语教学词汇的一个基数。

近年来高中毕业生的平均英语词汇量尚无统计报告可查。大学英语教学大纲项目组曾于1996年和1997年对各地高校新生入学时的词汇量进行了大规模调查,测得他们的平均词汇量为1 800词,水平高的学校达2 200多词。[7]近八年来,我国中小学的英语教学水平有了显著的提高。2003年10月,黄建滨等对杭州地区部分高校的914名新生做了英语词汇量调查,结果显示这些大学生的认知词汇量平均已达5 617词。[8]尽管这项调查规模较小,仍可在一定程度上反映出目前中上水平高中毕业生的认知词数。
从总学时数看,2002年秋季以来我国城乡小学逐步从三年级开设英语课程,以小学400学时、中学850学时计算,总共1 250学时。若平均每学时学2.5个单词,累计总词汇量可达3 100以上。
综上所述,一般高中生达到3 000~3 300总词汇量的要求是必要的,也是可行的。《课标1》把普通高中英语学科的词汇量目标设为3 000个;《课标2》又对这个目标作了分层细化,把必修课要求(即毕业要求,或称一般要求)和选修课要求(即大学入学要求,或称较高要求)分别设为2 400~2 500词和3 300词(表2),既照顾到各地区教学发展的不平衡和学生的个体差异,又保持了一定的先进性和前瞻性,较好地体现了一个纲领性文件对全国中小学英语教学的指导作用。

注:此表中未列入为英语特长学校或学生而设的九级要求。
但是,迄今为止的词汇量测试都仅限于认知词数(receptive vocabulary),而学习者在口头和笔头上能够复用的词数(productive vocabulary)要低得多。课程标准把词汇量目标描述为“学会使用”,要求未免过高,或者说不够确切。2000年版的《高中英语教学大纲》要求复用式掌握1 200词,约占1 950个认知词汇的62%;现行的《大学英语教学大纲》(1999)中,大学英语四级要求复用式掌握的词汇仅2 500个,占4 200个认知词汇量的60%。对于3 000~3 300的总词汇量目标来说,复用其中1 800~2 000词的要求并不低。高中生若能在说、写英语时熟练运用这些词汇,便能表达相当丰富的信息和复杂的意念了。
二、教学词表的选词原则与方法
学习任何一种语言,无论是本族语还是外语,可以说都是从原始词汇和核心词汇开始的。原始词汇是最基本的概念、最常见的形状和事物、最直接的动作、性质和关系,也是一个人全部词汇量的基础。[9]核心词汇是在运用某一语言传递信息过程中起重要作用的、最为常用的一部分词,是在不同语域、不同语体中进行言语交际所用词汇的共核部分。[10]原始词汇和核心词汇有许多重合部分,但不尽相同,如人体各主要部分或一些日常用具的名称等,它们都可视做原始词汇,但不一定都是核心词汇。作为零起点的基础英语词表需要收录一定数量的原始词汇,更要尽可能多地收录核心词汇。
语言教育家们对核心词汇做了大量的研究。从C.K.Ogden的Basic English 850词[11]和M.West的A General Service List of English Words 2 000词,[12]到Longman Dictionary of Contemporary English的2 000个定义词和Collins COBUILD Essential English Dictionary的2 000个定义词,[13]都是为语言学习而编写的。从语言学角度看,核心词汇在句法替换(释义功能)、反义对应、搭配能力、构词能力、意义引申等方面都有明显的特征,对外语教学实践和学习者的语言习得有相当重要的促进作用。[14]不同单词的核心程度强弱不一,没有绝对的界定标准,但核心词汇的语言特征一直被认为是基础英语词汇教学的基本要素。
在充分考虑核心词汇的地位的基础上,教学词表的编写要尽力体现通用性、实用性、有用性和教学适用性原则。词汇的选取通常以定量分析为主,定性分析为辅,即采用客观统计与主观经验相结合的办法。
(一)通用性
通用性即普遍性,指选取的词汇应有较高的使用频率和分布率。由于各个语料库的大小不一,选词来源不同,词频统计结果有差异。词的分布状态牵涉文体、篇章、专业、年代等诸多方面,差异就更大了。许多语料库中词汇的分布率信息不足,不利于选词。但3 000词级的基础英语词汇词频都相当高,在千万词以上的通用语料库中分布状态是相对平均和稳定的。我国目前还没有专为英语教学而建的语料库,因此利用英语本族语语料库的统计成果仍是一个简便可行的办法,如选定十个左右基于大型语料库统计的词典和词表,将它们所提供的高频率词或定义词进行归并,再取其中频率最高的3 000~3 500词作为初选词条。
利用计算机读取数据的语料库只认词形,不能辨义,词义频率是很难统计的,所以人工分析的工作量仍然很大。同形异义词的问题比较容易解决,但一词多义的义项排列和取舍就需要参考几本按常用性次序排列义项的权威词典,再加上众多专家的经验数据而定。
(二)实用性
有些生活中不可或缺的词,如某些日常口语词汇、数词、货币单位等,在语料库统计中词频和分布率并不高,但母语使用者的熟知程度却很高,非常实用,触景便来;还有些词汇是表达社会道德、文明、文化等意念和反映我国国情所需要的,如emperor,Confucius,dragon,panda等,都要作定性分析加以确定。在基础英语词表的3 000~3 500词范围内,这些实用性很强的词应该选取多少,在总词汇量中占多大比例,需要词表编纂者们研究论证。
Gougenheim等人曾为学法语的外国人编写了一个1 475词的“初级法语基本词表”,其中712词(48%)按词频标准收录,其余均按“不可或缺”和“社会文化”标准收录。[15]当时所建的口语语料库仅31万词,生成频率大于20的词目1 063个,显然不够。现在我们借助多个大型语料库生成3 000词,覆盖率大大增加,“不可或缺”和“社会文化”类的词汇所占比例不会太大。
(三)有用性
词汇的有用性主要是指词的释义和替代能力、构词能力、搭配能力、语义多寡等,反映了核心词汇的语言特征。由于核心词汇的构词能力很强,如何控制其派生词和合成词的收录量值得考虑。派生词和合成词的比例越小,词表隐含的词汇量就越大。在Collins COBUILD English Dictionary(以下简称CCED)标明的最常用3 374词中,派生词和合成词约占20%,[16]基础英语选词似可参照这个比例。
核心词汇的搭配能力关系到常用词组的收录。词组的表意功能十分强大,是词表编纂中不容忽视的一部分,但词组收录与单词相比,其定性与定量的难度更大。一般中型词典的词组收录量都达到总词条数的25%~30%。《课标》设定的400~500个词组和固定搭配不到总词汇量的15%,尚可适量增加。增加词组量并不增加单词的词目,重在一个“用”字,充分体现核心词汇的有用性。
(四)教学适用性
教学适用性主要指词汇的难易和可教程度。英汉两种语言不属同一语系,在单词的音、形方面没有关联。有经验的教师和研究人员需要根据英、汉词汇在语义上的异同、中小学生的年龄特点、认知能力和词汇习得过程等因素来判断词汇的难度,编排和调整词表,以适应教学的需要。基础英语教学词表可以在词频统计的基础上,其他定性标准,将词表进一步划分层次,如分小学、初中、高中三个层次,或分“认知”和“复用”两个层次,使教材编写和教学评估更加有的放矢。
三、对基础英语教学词表修订的几点意见
基于以上对词汇量和选词原则、方法的讨论,我们看到《英语课程标准》提供的两个词表尚有不少值得研究的地方。
词表1共收了3 329个词,附词组363条,都提供了中文释义。其中的派生词与合成词共占总词数的21.1%,与CCED中高频词的比例相仿,含量比较适中。但在选词标准方面尚需斟酌:一些低频词,如beam,cathedral,conceited,coral,fell(伐木),hive,prairie,squid等,称不上是核心词汇或原始词汇;还有部分地名,如Moscow,Ottawa,语气词hey,um等收录价值似乎也不大。同时,可添加assignment,bother,cabinet,cable,elsewhere,solve等频率较高、实用性较强的常用词,以增强词表的核心程度。
词表2采用了正表加附表的办法,总计词数超过3 500。正表收录3 393词,并用*号标出其中的895个八级词汇作为较高要求;附表包括数字、月份、星期共97个词条,以及56个国家名称及相关的国民和形容词。正表中派生词、合成词等所占比例明显低于词表1,即词根词的比例扩大,提高了词表的实际含词量。表3比较了《课标》的两个词表与CCED高频词中相关词类的收录比例,虽然CCED并非教学词表,但来自大型语料库的词频统计数据仍有很好的参考价值。与CCED高频词相比,词表1和2中的派生词量较小,而合成词量明显偏大。像crossroads,fingernail,greengrocer,hometown,housewife,housework,motorcycle之类语义自明的合成词,很容易掌握,可以不列入;但中小学生对词缀知识的认识很粗浅,所以派生词还是多收录为好。词表2的说明中列有“根据构词法推导”一项,不妨增加一个常用词缀附表,以扩大正表词汇的使用范围,体现词表的灵活性;或者也可从基础的低起点考虑,将常用的派生词列于词根词之后,但不单列词条,即把词目提升到“准词族”的水平,仍可收到相似的效果。表3词表1、词表2及CCED高频词中派生词、合成词等所占比例的比较*

*此表中部分数据参考黄建滨等(2004)所做统计的结果。
**词表2的总词数包括正表和单独列出的数字、月份和星期,但不包括国家名称及相关信息的附表。
除此之外,笔者拟就词表2在内容结构、选词、体例等方面的修订谈一些粗浅的看法,求教于基础英语教育界的同行。
(一)内容结构
或因篇幅所限,词表2并未提供中文义项,也未列出《课标》要求的400~500个习语或固定搭配。这两项内容是十分重要和必不可少的,建议有关部门尽早另行出版含有这些内容的完整的词汇表。
附表列出了一些国家名称及其相关信息供教学参考,是词表编写的通常做法,但一些最常用的国名和语言仍应列入正表。词表2的正表中未收录China,Chinese,UK,the US,English,France,French这类词,显然不妥。附表中列出了国名、国民和相关形容词,可以再加上这些国家使用的主要语言。另外,表中未反映出在表示国籍与国民时常有的差别,如“英国籍”是British;“英国人”应为Briton;“全体英国人”则是The British。
(二)选词
词表2未收入一些频率与实用性都很高的词汇,如according(to),badly,criticize,detail,fulfil,gene,goodbye,sauce,sign,weapon,wrap等,像much,most,better,best这样功能强大的词也未单列词条,不能不说是明显的疏漏。一些带后辍-ly的常用副词,如absolutely,actually,certainly,finally,generally,gradually,usually等,尽管是派生词,但出现频率远高于它们的词根。基础英语的教学对象毕竟是初学者,这些副词还应尽量列入。
另有部分词汇的词频偏低,难度偏高。对照现行的大学英语教学大纲词汇表,词表2属于大学六级或六级后的词汇多达240个,其中有些词可视教学需要收录,但像abolish,abortion,adolescence,adore,allergic,alley,ambiguous,catastrophe,chant,sceptical等较难的词为数不少,无论作定量还是定性分析,在3 500词级的词表中选取机会都很小。
表示“穆斯林”的英文词有Moslen和Muslim两个,词表中只选了前者,实际上后者现在更通用。
(三)体例
正表中的同形异义词都已作分条处理,但tear v.(撕开)和tear n.(眼泪)未分词条。
国家名称表第二栏的Holland和Netherlands因按字母顺序分列两处,致使第一栏出现了两个中文“荷兰”,似应把它们归至同一行中为妥。
英美拼写不同的都以英式拼写在前,美式拼写放在后面的括号中。但Mr.,Mrs.,Ms.三个缩写词只是单独列出,没有注明美式写法,前面也未列出英式写法Mr,Mrs,Ms。
还有一些排印错误,如缩写am.和AM.应改为a.m.和A.M.;finance未标词性;conference,station,surplus,survival,vacation,web,website等词未按字母顺序排列。
总之,《英语课程标准》的两个词表给人的印象似乎是应急而生的过渡性产品,要加工成更为理想的精品,还有大量的定量和定性分析工作要做,这是一项十分复杂的工程。
教学词表作为国家教育部制定的课程标准的一部分,其权威性和重要性不言而喻,因此对编制的要求也就更为苛刻。我国现有的各种英语教学大纲词表,从基础教育到研究生教育,从大学英语专业到公共英语等级,纵横交错,不下七八种。由于各自为政,有的相互重叠,有的上下脱节。尽管投入很大,不断修订,效果仍不尽如人意。建议权威部门能联合各方力量协同工作,编制一个符合我国教学特点和实际的英语教学分级词表,每千词为一级,共十级,一万词。然后以这个总词表为基础,不同层次、不同类型的教学或考试词表各取所需,略作调整,即可使用。这样既能避免重复劳动,又能提高词表的质量,对增强各级教学、考试大纲和教材建设的性和先进性将有重要意义。
参考:
[1]中华人民共和国教育部.全日制义务教育普通高级中学英语课程标准(实验稿)[S].北京:北京师范大学出版社,2001.
[2]中华人民共和国教育部.普通高中英语课程标准(实验)[S].北京:人民教育出版社,2003.
[3]Frnacis W N,Kucera H.Frequency Analysis of English Usage[M].
[4]Bauer L.,Nation I S P.Word Families[J].International Journal of Lexicography,1993(3):1—27.
[5]Hirsh D,Nation P.What Vocabulary Size is Needed to Read Unsimplified Texts for Pleasure?[J].Reading in a Foreign Language,1992,(2):689—96.
[6]Nation P,Waring R.Vocabulary Size,Text Coverage and Word Lists[A].In Schmitt N.,McCarthy M.(ed.),Vocabulary:Description,Acquisition and Pedagogy[C]Cambridge,
[7]黄建滨.关于《大学英语教学大纲(修订本)》词汇表的说明[J].外语界,1999,(4):26—30.
[8]黄建滨,等.大学英语课程教学要求词表修订探讨[J].外语界,2004,(1):2—9.
[9]汪榕培.标准英语和核心词汇[J].外语和外语教学,2000,(12):2—5.
[10]张建颖,丁放.论核心词汇的判别标准[J].外语界,1995,(2):19—22.
[11]Ogden C K.Basic English[M].
[12]West M.A General Service List of English Words[M].
[13]Sinclair,J.Collins COBUILD Essential English Dictionary[M].
[14]Carter R A.Vocabulary:Applied Linguistic Perspectives[M].
[15]Gougenheim G,Michéa R,Rivenc P,Sauvageot A.L’élaboration du francais fondamental(lerdegré),2nd ed[M].
[16]Sinclair,J.Collins COBUILD English Dictionary[M].











