住所の漢数字→アラビア数字変換

今年は入籍したこともあって、お礼状の送付やら何やらで、近年まれに見るほどの(当社比)ハガキ作成、宛名書きを行わなくてはならない気配がする。いや、気配などという生易しいものではなくて実際に作業を行わなくてはならないわけであるが……。

幸い、実家の父親のeMacから親戚縁者の住所データベースをCSV書き出ししてUSBメモリに入れてもらってきて、住所データをExcelに入れてみて……絶句。
番地表記が全角半角入り交じり、さらに漢数字とアラビア数字の表記も混在しているではないか。

う〜ん、美しくない。

住所のデータなど別にハガキに印字してそれで届けばいいだけのものなのだが、それはそれで許せない。

この程度の処理ならツールが存在するだろう……と、探してみたところ……そこには予想外の惨状が広がっていた。その程度のツールがほとんど見つからないのだ。
アラビア数字から漢数字への変換程度ならどーーーってことはない。主に行いたいのはその逆だ。

一応、漢数字→アラビア数字変換のツールは、あることにはあった。だが……地名の中に漢数字を含むものがあった場合にはどーーするのだ????

きちんと対応しているツールはWindows用の「漢数字→数字変換プロセッサ『なんば君』」ぐらいしか見当たらなかった。偉い偉い。ちゃんと固有名詞は極力変換しないように処理してくれているようだ。しかし、「前後の状況判断をしながら数字に変換」、というあたりがちょっと怪しい。

まあ、Windows用だと選択肢には入らないのでMac用を(ちょっとだけ)探してみたのだが、それでもやっぱり見つからなかった。

「chasenで形態素解析してコンバートすれば楽勝なんでないの?」
そう思い、やおらTerminal.appからchasenを呼び出して試してみたところ……おお、なかなかよさげな感じではないか。
つく……らなくてはならないだろうか、これは(汗)。

Copyright By Piyomaru Software. All Rights Reserved