2009年5月26日火曜日

中国語ファイル名の一斉変更(リネーム)方法

中国国内向けのメール配信の仕事を請け負うことになった。
いわゆるBPOというやつ?


取引先からものすごい数のメールリストをもらった(数は把握できていない)。
何しろ中国であるからして、まぁ、とにかくすごい数なのだ。
中国の各都市ごとのリストで、ファイル数だけでも1000以上ある。
このままでは送信用ソフトにセットできない。
ファイルの数が多すぎるのだ。


ある程度固める必要があるのだが、あなたは1000個以上もあるファイルをどう
やって固める?


真っ先に思いつくのが、エディタを使うこと。
秀丸エディタなら1000万行まで編集できるから、理論上は1000万人分のメールア
ドレスファイルを取り扱えることになる。実は以前、700万人 (700万行)までは
やったことがある。
さすがにこの規模になると秀丸の動作も重い。
コピペする度に処理で待たされることになる。


もう一つはバッチファイルで各ファイルを結合してパイプ処理で一つのファイル
にまとめる方法。
UNIX使いの人なら、真っ先に思いつく方法だろう。これはエディタを使うよりも
早い。


だが、こうやって作ったメールアドレスファイルはそのままでは使えない。
名簿関係、電話番号リストなどを取り扱った方ならおわかりのように、この手の
リストは重複や無効のデータが相当数混じっているのだ。
メールアドレスの場合、重複や無効アドレスを取り除くと、元のリストの3分の
1以下にまで小さくなってしまった、などということはよくある。
この重複を取り除くためのフリーウェアがある。日本製のソフトなのでVectorで
たぶんすぐ見つけられるだろう。


しかし、これだけではまだ足りない。
いわゆるメールを送っても無駄な人、送ってはいけない人など、そういうメール
アドレスを除去する必要がある。
そういうメールアドレスというのは、政府関係や学校関係のドメインだ。
面倒だから送っちゃえ!
それでもかまいませんよ。だが、迷惑メール配信者としてマークされるのは確実。
この手のメアドリストは、何かの無料サービスを利用させる代わりに収集したも
の。だから基本的にはメール送信OKのハズなのだが、結構な確率で「送っちゃい
けないドメイン」「送っても無駄なドメイン」が混ざっているのだ。
こういう、いわゆるフィルタリング処理はどうするか?


以前は秀丸エディタでやってました。
でも、今なら専用のソフトがあります。
たくさんあるファイルの結合から重複・送っちゃいけないドメインの除去まで一
度にやってしまうやつ。
おそらく迷惑メール業者なんかが開発したソフトなんでしょう。海外製です。
これ自体がノウハウなので自分でお探しください。私はコレ出会うまでに2週間
かかりました。


今日の問題は、このソフトですら手に負えない事態だったということです。
日本語Windowsで中国語ファイル名のファイルを扱う場合、ソフトウェアが中国
語のファイル名を認識してくれないという問題です。だから、せっかくの便利な
ソフトも太刀打ちできない。
ファイル名を日本語か英語に変えれば問題は解決するのですが、なにしろファイ
ル数が1000を超えます。
いちいち一つずつリネームしていたら日が暮れます。


ファイル名は別に適当でかまいません。とにかく中国語の漢字じゃなければ、
メール結合整理ソフトが動きます。
そこで、ファイル名一括修正方法を探しました。


リネームしたいファイルを一つのフォルダの中に集めます。
Ctrl+Aでファイルを全部選択します。
ファイル一つを右クリックして名前の変更(M)をクリックします。
適当な名前を入力します。
すると選択されていた他のファイル名は変更した名前+(XX)、XXは通し番号に変
わります。
こうなればこっちのもの。メール結合整理ソフトで一気に読み込めるようになり
ます。


まぁ、本日はそうやってリストの整理を始めたわけです。
始めたのが夜からなんで、続きはまた明日。


昔に比べてPCで取り扱うデータ量はとんでもなく多くなりました。
まともにやってたのでは時間ばかりかかって、とんでもないことになります。
いかにして時間を短縮するか。
今やネットで検索して、ノウハウを集めるのは欠かせません。
実生活ではちっとも役に立たないノウハウではありますが、飯の種にはなります。


他の人が何日もかかっている作業がわずか1時間でできたとしたら?
PCを使う仕事は、やり方次第でとても効率よくできるのです。

0 件のコメント: