近年, Webや電子メールで交換されるテキストデータでは、文字を組合せて描かれた下記のような絵がよく用いられています。これは一般にアスキーアートと呼ばれています。

アスキーアートの例

モナー

アスキーアートはテキストの表現を豊かにする一方で、テキストの形態素解析や読み上げでは障害となります。例えば、アスキーアートを読み上げソフトウェアに与えると、その読み上げは意味不明となることがあります。そこに使われている記号は読み飛ばされ、 その他の数字、平仮名、片仮名などだけが読まれてしまうからです。

そこで我々はテキストからアスキーアートの範囲を調べる方法を研究しています。それが可能になれば、アスキーアートを取り除いたり、代替文字列に置き換えたりできるので、上記の問題は解決できます。

特に我々はテキストに使用されている自然言語に依存しない手法を研究しています。つまり、なるべく汎用的なアスキーアート抽出法を研究しています。

アスキーアート抽出アルゴリズムのデモのページで、我々の提案手法のデモを行っています。

アスキーアートを含んだテキストの例

アスキーアートを含んだテキストの例

アスキーアートの抽出例

アスキーアートの抽出例