ソフトを開発しようと思った動機、背景
本ソフトを開発した動機は、Windows上で正規表現による置換を気軽に使いたいということです。例えば、HTMLファイルのタグを取り去る際も、正規表現を使えば、専用の変換ツールを使うまでもなく、「s/<[^>]*>//gk」だけでできてしまいます。短い1行だけで複雑な置換処理が可能で、特にこれは「一行野郎(one-liner)」と呼ばれています。正規表現を気軽に扱うソフトには、UNIXやDOSでは、コマンドライン版のgrep、awk、sed、Perl、rubyなどがあります。しかし、いちいちコマンドラインに降りていたのでは、せっかくの「一行野郎」もつい億劫になりがちです。
そこで、なんとかWindows上で「一行野郎」ができないかと思い、本ソフトを作成しました。正規表現エンジンには、本ソフトでは、Perl 5の正規表現エンジンである「BREGEXP.DLL」(Tatsuo Babaさんがhttp://www.hi-ho.ne.jp/babaq/index.htmlで公開)を使用しています。「clipsed」は、Visual Basic 6.0で開発していますが、エンジンであるBREGEXPはVisual Cで開発されているため、変換は高速です。
ユーザにお勧めする使い方
「一行野郎」は、短い文字数で複雑なことを表現できます。その半面、スマートな正規表現を見つけるまでには、ある程度の試行錯誤をともなうことも多いです。ご自分で練り上げた正規表現パターンこそが、本ソフトの核です。いくつか正規表現の例も組み込んであります。これを参考にしつつ、置換前と置換後の文字列を比較し、置換パターンがどのようにテキストに働いたのかを確認して、よりスマートな正規表現パターンを見つけてください。
置換のほかにも、半角カナを全角に変更するといった文字種変換、重複行の削除・抽出、特定文字が含まれている/含まれていない行を抜き出すgrep機能もあります。本家のsedやgrepを使うまでもない、ちょこっとしたテキスト処理にぜひ活用してください。
ソースも公開してありますので、ご自由に改良してお使いいただければと思います。
(塘 誠)