ステップ1このステップでは、点訳したい文章を入力していただきます。下にあるフォームに漢字仮名交じりでお好きな文章を書き込んでください。テキストエディタなどからペーストしても便利でしょう。 改行までを一文とし、内部では一文単位で処理を行います。一文の長さは64キロバイトまでで、一文の長さがなるべく短くなるようにしてください。文の数に制限はありませんが、多くの文章を一度に点訳するのではなく、何度かに分けてもらった方がうまくいきます。入力できたら、下の[ステップ2へ]ボタンを押してください。
|
触読点字e-learning - 神戸大学大学院医学研究科 - 医療情報学分野 - eBrailleについて
©2012 eBraille
ステップ1とステップ2の間では、主に漢字仮名交じり文から、点字に適した仮名文を作り出すことを行います。
この作業は形態素解析と呼ばれる日本語の語句解析法によって得られた結果を利用して行います。形態素とは単語よりももうすこし小さい、文の構成要素のことです。入力された文章を形態素の単位に分解し、辞書から読みを調べ、点字により適した形での仮名の文章を作り出します。
一般に、墨字の文章は漢字仮名交じりで表記されるためか、単語間の明確な区切りはなくても構わないのに対し、主に仮名だけで表記する点字では、文節単位での区切りがないと非常に読みにくいことになります。これを避けるため、「分かち書き」と呼ばれるスペースを挿入する工夫をします。分かち書きは一般に文節単位で行うため、文節の切れ目を探すことが必要になりますが、これも形態素解析で得られた品詞の情報から行います。
また、分かち書きの処理と同時に、/wa/と発音する助詞の「は」や/e/と発音する「へ」の、「わ」「え」それぞれへの置き換え、長音の処理、数詞の処理、などを行い、ステップ2へと進みます。
なお、この形態素解析には、共同研究先の奈良先端科学技術大学院大学松本研究室の日本語形態素解析システム「茶筌」version 2.3.3 を使用させていただいております。神戸大学医学部で開発中のeBraille ver. 1.51は、ver. 0.91に比べて2.2倍点訳精度が向上しています。