PSS Concordancer プロジェクトについて

コンコーダンサ君こと PSS Concordancer について、作者としての公式見解を述べていなかったような気がしたので少し語ってみます。

一般的に Concordancer と呼ばれるソフトは、英語を学問として扱っている研究者の人が使う『コーパス分析用のソフト』だと考えています。最近では英語学習者にとっても有益なソフトウェアであると宣伝されているようですが、ほとんど浸透していないと感じています。
とはいえ某番組の影響で最近では『コーパス』という言葉が英語学習者にとってのキーワードになりつつありますし、コーパス分析により編集された辞書や書籍も多数出ていますよね。VITAL4500 もその1つ(というか本格的にコーパス分析を導入したという点では先駆的な存在)です。

さて、コーパス分析というと(あくまでも私の個人的な見解では)

  • 頻度
  • 語のつながり
  • ある文脈中で使われる語の意味

を分析することだと思います。
分析済みの資料としては、イギリス英語コーパスとして有名な BNC(The British National Corpus) などがあります。

「頻度」は読んで字のごとく、「ある文章(群)中に出現する単語と出現回数」です。

「語のつながり」は、ある単語に連なって使われることの多い単語(列)を見つけることです。
残念ながら私は研究者でも専門家でもないので的確な例は出せませんが、某有名な番組 2004 年第 58 回によると leave + 名詞では

leave +名詞(残していくもの)top5

  1. message
  2. thing(s)
  3. door(s)
  4. note
  5. key

のように、「ある単語は別の単語とセットで使われることが多い」ということが分かっています。

「ある文脈中で使われる語の意味」は、複数の意味を持つ動詞などにおいて、ある意味はどの文脈で使われるのかを調べる、といった操作です。


さて、前置きが長くなってしまいましたが、コンコーダンサ君ではこれらの全てを目指しているわけではありません

ある文章における頻出単語をリスト化すること(頻度表の作成)は行いますが、語のつながり分析や文脈中の意味は「ゆるーく」提示します。

つまり、ある単語が出現する位置(とその周辺の文章)をユーザに提示します。ただそれだけです。単語を学習しているときに「この単語はどんなときに使われるんだ?」と思ったときに、コンコーダンサ君は「こんな文章で使われているよ!」と教えてくれるわけです。

例文を表示するというのも基本的には同じ効果ではありますが、コンコーダンサ君を使うことで、たとえばニュースのような「生きた例文」を見ることができるわけです。

あ、PSS Corpus という名前にしなくてよかったですね。そうしてたら「コーパス君」と呼んでしまうのでw