Readability Square – 洋書を選べるサイト

ウェブサイトReadability Squareを制作いたしました。

http://readability.mackayst.com

このウェブサイトでは、Project Gutenbergが公開している電子書籍の読みやすさ(Readability)解析をリスト表示/検索できます。

使い方ですが、まずVocabulary Testerにて語彙数の確認を行います。語彙数は、既知語についてチェックボックスをつけていくとわかります。測った語彙数を検索にかけると、Gutenberg Readability Searchのページに移り、保有語彙数の範囲内でのおすすめ電子書籍が表示されます。検索は語彙カバレッジ99%基準を元にしていることと、Project Gutenbergがその性質上古い書籍を公開しているため語彙の難易度が高めであり、最低5000語の保有語彙数がないと推奨書が表示されません。Gutenberg Readability Searchの検索ボックスを空欄にして検索すると、全登録書籍が表示されます。

Gutenberg Readability Searchの表示結果の見方について

洋書を探す場合、主に保有語彙数・死亡年・単語数を確認されるとよいでしょう。

Born/Diedは著者の生年/死亡年をさし、これによりテキストの古さがわかります。古いほど現代と言い回しが異なるため読みにくくなる傾向があります。

Fog/Flesch Reading Ease/Flesch-Kincaidは既存のReadability指標です。各Readability指標についての詳細な説明はWikipediaなどをご覧ください。

Vocabulary Coverageはどの頻度レベルまでの単語でテキスト語彙中の何%をカバーしているかをしめします。Nation 2006の研究によると、98%の単語しかわからないテキストではレベルとして難しい、99%の単語がわかるテキストはレベルとして適切である、とされています。

Num of Wordsはテキストの単語数です。1ページ約400語であることから単語数を400で割るとおおよそのページ数がわかります。チャールズ・ディケンズの『二都物語』(Charles Dickens, “A Tale of Two Cities”)は134550語ですが、350ページ程度であるとわかります。

結果の表示の見方については、例えばアーサー・コナン・ドイル『シャーロックホームズの冒険』(Doyle, Arthur Conan, Sir, “The Adventures of Sherlock Holmes”)であれば保有語彙数8000語以上の読者が対象となります。これは、8000語の保有語彙数があれば99%の単語がわかり、99%の単語が分かるテキストはレベルとして適切であることから、保有語彙数8000語以上の読者が対象となります。

このウェブサイトの特色

語彙に基づく読みやすさ解析について語彙のレベル別難易度を下にテキストの評価をしており、他の指標とは独立に表示している点が他の読みやすさ解析と異なります。