英米人の語彙数
英語の語彙数の数え方には、厳密に言うと、いろいろ厄介な問題が含まれているが、ここではあまりうるさいことは言わないで、常識的な範囲で話をすることにする。また、研究者によって推定語彙数には非常に幅があるが、そのうち比較的控え目な数字を引用することにした。一般的に、語彙には理解語彙(passive vocabulary)と使用語彙(active vocabulary)の2種類があるとされている。理解語彙はリスニングとリーディングに使われ、使用語彙はスピーキングとライティングに使われる。習得過程から見ると、最初に理解語彙に出会ってその語の意味を理解するようになり、その状態がしばらく続き、十分理解するようになった段階で、それを使うようになる。つまり、使用語彙に転換する。このことからも分かるように、理解語彙は常に使用語彙に時間的に先行し、理解語彙数は常に使用語彙数よりその数が多いという関係がある。
『ケンブリッジ英語百科事典(the Cambridge Encyclopedia of the English Language, 1995, 123)』によると、成人の理解語彙数と使用語彙数との関係は次のとおりである。
理解語彙数 |
使用語彙数 |
|
秘書 |
38,300 |
31,500 |
読書家 |
73,350 |
63,000 |
大学教師 |
76,250 |
56,250 |
これらの数字から、同百科事典は、理解語彙数は使用語彙数の平均 25%増になっている、と結論づけている。
『ギネスブック(Guinness Book of Records 1992, 396)』によると、IQ 148以上でないと入会できない the International Society of Philosophical Enquiry 会員の平均使用語彙数は 36,250 語であり、シェイクスピア(William Shakespeare)は 33,000 語を使用したそうである。また、個人で 60,000 語以上の語彙を使用することはない、とも述べている。
さらに、ギネスブックは使用語彙数を、口頭英語と文字英語との関係において比較している。それによると、16 年間の学校教育を受けたイギリス人のスピーキングとライティングに使う語彙数は次のとおりである。
スピーキング使用語彙数 |
約 5,000 |
ライティング使用語彙数 |
約10,000 |
ケンブリッジ英語百科事典とギネスブックの数字はかなり食い違っているが、ここではケンブリッジ英語百科事典の説をとることにする。ただし、ネイティブ・スピーカーの最低線として「秘書」の語彙数を採用し、それをさらにラウンドナンバー化して、理解語数を 40,000、使用語数を 30,000 とする。そしてギネスブックのスピーキングとライティングとの1対2の関係をそのまま保つと、次のような4技能間の語彙数の関係が考えられる。
口頭英語 |
リスニング |
スピーキング |
40,000 |
15,000 |
|
文字英語 |
リーディング |
ライティング |
40,000 |
30,000 |
これは二つの資料を便宜的に一つにしただけのことで、何ら確たる根拠があってのことではない。たとえば、リスニングの語彙数はリーディングの語彙数より多少少ないと思われる。また、スピーキングとライティングの語彙数はギネスブックのそれよりもはるかに多いのも気になるところである。しかし、パターンという意味では、一つの目安にはなるであろう。
実用レベルの語彙数
語彙の頻度に関する研究はこれまでいろいろ行われてきた。ある調査(Kucera & Francis 1967)によると,最も使用頻度の高い語彙数とその語彙によるカバー率との関係は次のとおりである。最高頻度語彙数 |
カバー率 |
135 |
50% |
2,500 |
78% |
5,000 |
86% |
10,000 |
92% |
英語の中での最高頻度語彙は定冠詞の the である。この1語だけで,実に全体の 6.9 %をカバーする。これに 24 語を加えた最高頻度語彙 25 語になると,全体の3分の1をカバーする。これがさらに増えて 135 語となると,上の表にあるように,全体の 50 %をカバーするという。さらに増えて 2,500 語になると 78%までカバーする。この程度の語彙数までは,だいたい,大学入試段階で暗記していると考えてよいであろう。しかし,問題なのはこれ以降である。
2,500 語の倍の 5,000 語となると,もうこれは一般大学生の領域を超えた語彙数である。ところが,その割にはカバー率の増加は意外に少なく,2,500 語の場合と比較して,わずか8%の増加にしか過ぎない。さらにこの 5,000 語が倍増して 10,000 語になっても,カバー率はさらに減り,わずか6%の増加にしか過ぎなくなる。いわゆる頭打ち状態である。上の表によれば,2,500 語を超えたあたりから,カバー率は急激に減少して平原状態になることが分かる。
全体の3分の1(33%)をカバーする最高頻度語彙 25 語,および 50 %をカバーする最高頻度語彙 135 語を品詞別に分類すると,その内訳は次のようになる。
最高頻度語彙 25 語 |
最高頻度語彙 135 語 |
|
名詞 |
0( 0%) |
16(12.0%) |
代名詞 |
7(28%) |
11( 8.1%) |
動詞 |
2( 8%) |
23(17.0%) |
助動詞 |
0( 0%) |
8( 5.9%) |
形容詞 |
2( 8%) |
13( 9.6%) |
(決定詞,他) |
1( 4%) |
17(13.0%) |
副詞 |
1( 4%) |
21(16.0%) |
前置詞 |
9(36%) |
17(13.0%) |
接続詞 |
3(12%) |
9( 6.7%) |
最高頻度語彙 25 語の場合には,機能語(代名詞,助動詞,決定詞,前置詞,接続詞)が多く(80%),内容語(名詞,動詞,形容詞,副詞)はきわめて少ない(20%)。これとは反対に,語彙数が増えて 135 語となると,機能語は少なくなり(46%),内容語が多くなる(54%)。この傾向は語彙数が増えるにしたがってますます顕著になる。つまり,語彙を増やせば増やすほど内容語が増える。これに対して,機能語はある線に達すると,頻度は高くなるが,もう増加はしなくなる。
ラドー(Robert Lado)によると,アメリカの大学で留学生がリーディングをこなして行くためには,最低 10,000 語近く知っておく必要がある,とのことである。この場合には,その語彙のほとんどは内容語となる。上に述べたように,10,000 語で全体の 92 %をカバーするわけであるが,これを 5,000 語の 86 %と比べると,パーセント的には,その差はわずかに6%であるが,実用的面から見ると,この6%は非常に大きな差となる。5,000 語では実用レベルのリーディングには役に立たないが,10,000 語あれば実用的レベルのリーディングに十分役立つ。
学習語彙と実用語彙の相違
最高頻度語彙 5,000 語は全体の語彙の 86 %をカバーするが,これを2倍の10,000 語に増やしても,全体のカバー率はわずか6%増えて,92 %になるだけであるということを前回述べた。その原因は,語彙の増加につれて,機能語(代名詞,助動詞,決定詞,前置詞,接続詞)が増えず,内容語(名詞,動詞,形容詞,副詞)が増えるためであるということも述べた。このことについて,もう少し具体的に説明してみよう。次の 28 語から成る英文は,英字新聞の記事の書き出しである。
| Of the foreigners held in Immigration Bureau detention centers pending deportation for staying illegally in Japan, 558 were minors-300 boys and 258 girls, the government said Friday. |
この中から最高頻度語彙 5,000 語を超える語彙を省略して,その代わりに ..........を挿入してみると,次のようになる。
| Of the foreigners held in .......... Bureau .......... centers ................... for staying .......... in Japan, 558 were .......... -300 boys and 258 girls, the government said Friday. |
このように,もし 5,000 語を超える語彙の意味がまったく分からない場合には,この英文の意味は理解できないであろう。5,000 語からはみ出した6語のうち,Immigration, detention, deportation, minors の4語は名詞,illegally は副詞で,いずれも内容語である。pending は機能的には前置詞であるが,この語独自の意味を内在しているので内容語に近い。
次の新聞記事の書き出しはどうであろうか。........に入るのは 5,000 語を超える語彙で,文末の( )内に示してある。
| Russian authorities have charged a former U.S. Navy officer with ....... after holding him in a Moscow prison for more than a week, saying he had tried to obtain military secrets, officials said Thursday. (espionage) |
34 語の中のわずか1語であるが,espionage はキーワードであるので,この意味が分からないと記事全体を理解できない。このように,英語の理解は単に,語数だけの問題ではない。語彙の重要度が問題なのである。
以上のことからも推測できることは,意味の理解という点で最も重要なのは名詞である。政治,社会,経済,文化,制度,宗教,スポーツ,ファッション,趣味,製品名,病名,薬品名,動植物,その他ありとあらゆるものが名詞の中に含まれている。ものの名を知っていれば,何とか意思を通じさせることができるというのはこの間の事情を物語っている。
しかし,学習者にとって,これら名詞の厄介なことは,少数の基本語を除いて,名詞は使用頻度がきわめて低いということである。ただし,使用頻度の低さを補う形で,膨大な数の語彙が名詞の中に含まれている。同じことは,その他の内容語,つまり動詞,形容詞,副詞についても言えるが,名詞ほど極端ではない。
これを Merriam-Webster's Collegiate Dictionary (10th ed., 1998) の任意のページ(p.906)でサンプル検査をしてみると,見出し語の品詞の数は,次のとおりである。
名詞 |
56 語 |
動詞 |
7 語 |
形容詞 |
16 語 |
副詞 |
4 語 |
以上のことからも明白なように,「頻度の高い語彙を中心に学習するのは効率がよい」とまでは言えるとしても,「頻度の高い語彙だけを学習すればよい」とは言えないことが分かる。頻度は低くても重要な語彙の学習なくして意味は理解できない,のである。この「頻度は低くても重要な語彙」が内容語,特に名詞に相当する。その数はきわめて多く,最多頻度語彙数の例で言えば,学習レベル5,000 語と実用レベル 10,000 語との差の 5,000 語のほとんどすべてが内容語である。語彙の使用頻度だけに目を奪われてはならない。
辞書から見た日本人とアメリカ人の語彙数
日本人とネイティブ・スピーカーの語彙力の差は1対5
外国人留学生がアメリカの大学で支障なく講義について行くためには,リーディングのために最低 10,000 語近くの語彙数が必要だろう,という言語教育者ラドーの説は以前紹介した。これと,これも以前紹介したネイティブ・スピーカーのリーディング用の最低語彙数 40,000 とをつき合わせてみると,日本人(実用レベル)とネイティブスピーカーとの語彙の関係が見えてくる。これらの数字をそのまま比較すると,1対4の関係になるが,日本人の実用レベルの 10,000 語は,実用レベル内でも多少上のレベルを示していると思われるので,これを低めに考えると,おそらく1対5程度の関係になるのではないかと想像される。つまり,日本人(実用レベル)の1に対して,ネイティブ・スピーカーの5くらいの関係である。しかし,日本人が英語学習者の場合には,両者の差はこれよりも大幅に広がることは当然である。
辞書の収録語彙数の差
ここで観点をまったく変えて,市販の英語辞書の収録語彙数という点から,辞書使用者としての日本人とアメリカ人の相違について見てみよう。辞書出版社の最大の関心事は,いかに優れた辞書を出版するかということと,それから得られる収益によって企業の安定を図ることである。そのためには,競合他社よりいかに魅力的な特色のある辞書を制作するかが大きな問題となる。収録語彙数も重要な特色の一つである。競合他社を意識した場合,収録語彙数は増える方向に傾く。もし辞書使用者から語彙の不足について苦情が出るようなことになれば,市販辞書にとっては決定的なダメージを与えることになるからである。そのため,市販辞書から辞書使用者の語彙数を推測する場合には,安全策をとって増加した語彙の分を差し引いて考えなければならない。
次に示したのは,日本人を対象にした英和辞書と,アメリカ人を対象にした英語辞書の収録語彙数の概算リストである。
《日本人向け英和辞典》
《アメリカ人向け英語辞典》
英語は日本人にとっては外国語であり,アメリカ人にとっては自国語であるので,両者の収録語彙数の差が大きいであろうことは容易に想像がつく。想像どおり,その差はかなりある。もちろん,これだけから語彙数を推測することはできないが,それでも日本人の辞書使用者とアメリカ人の辞書使用者との語彙数の差については,事実を反映していると考えて差し支えないであろう。このリストから分かることは,大雑把に言って,日本人中学生はアメリカ人小学生の語彙数に,日本人高校生はアメリカ人中学生に,日本人大学・一般はアメリカ人高校生に,それぞれ対応していることである。一つずつ対応レベルがずれているという感じで,面白い現象である。
次に示したのは,日本人を対象にした英和辞書と,アメリカ人を対象にした英語辞書の収録語彙数の概算リストである。
《日本人向け英和辞典》
対象者 |
中学生 |
高校生 |
大学・一般 |
収録語彙数 |
10,000 |
50,000 |
80,000 |
《アメリカ人向け英語辞典》
対象者 |
小学生 |
中学生 |
高校生 |
大学生 |
収録語彙数 |
15,000 |
60,000 |
80,000 |
160,000 |
英語は日本人にとっては外国語であり,アメリカ人にとっては自国語であるので,両者の収録語彙数の差が大きいであろうことは容易に想像がつく。想像どおり,その差はかなりある。もちろん,これだけから語彙数を推測することはできないが,それでも日本人の辞書使用者とアメリカ人の辞書使用者との語彙数の差については,事実を反映していると考えて差し支えないであろう。このリストから分かることは,大雑把に言って,日本人中学生はアメリカ人小学生の語彙数に,日本人高校生はアメリカ人中学生に,日本人大学・一般はアメリカ人高校生に,それぞれ対応していることである。一つずつ対応レベルがずれているという感じで,面白い現象である。
語彙数と定義数の関係
リストに例として挙げたアメリカ人大学生対象の英語辞書は,Merriam-Webster's Collegiate Dictionary (10th ed., 1998)からの引用である。同辞書の収録語彙数は 160,000 語であるが,語彙数ではなく定義数で言うと,215,000定義が収録されているという。したがって,1語当りの定義数は 1.3 ということになる。このように,語形は同じでも,定義が違えばまったく違った語として取り扱われるのは,ある意味では当然であろう。ここに収録語彙数のカウント方法の難しさがある。辞書によっては,give 本来とは意味の違う give up を独立した見出し語としてカウントすることもある。また,重要でなく,意味も容易に推測できるので,語形のみを示して定義を省略する場合もある。規則変化をする動詞の変化形,名詞の複数形,形容詞の比較変化などは記載しないのが慣例である。したがって,これらを語彙数としてカウントするかどうかで,語彙数は大きく変化する。しかし,一般常識的には,話がややこしくなるので,それほど厳密な分類はしない。ここでの語彙数のカウントの仕方も同様で,一般常識の範囲内で行ったものである
