Wordファイルをtxtファイルに一括変換

Wordで大量のファイルがあったとき、一括検索をしたくなることも多いでしょう。 Tradosなどで処理することもできますが、もっと手軽な方法として、txtファイルに変換しておくというものがあります。 txtファイルであれば、PowerShellを使って全文検索が可能です。

# unoconv

txtファイルへの変換はLinuxのコマンド *”unoconv”*を使います。 Windowsからは利用できないため、仮想マシンを用意するか、 Windows10ユーザーであればWSLを利用するのが手軽だと思います。 (Linuxのインストールについてもいつか紹介します) 気になる方はストアから Ubuntu をインストールしてみてください。

以下、unoconvを使ったサンプルコードです。

# インストールがまだであればしておく
sudo apt-get install unoconv

# 変換の実行
# -fの後ろに変換後のフォーマット、その後に入力ファイルパス
unoconv -f txt *.doc*

unoconvはLibreOfficeを利用しているとのことで、インストールされていなければ、結構多量のパッケージがインストールされます。 急ぎの案件だとイライラしてしまうので、早めにインストールしておきましょう。

-fで指定するフォーマットには、PDFやHTML、RTFなどもあるようです。

ファイル数が多いときは時間がかかるので、根気も必要です。

# PR

Wordの使い方を初歩から徹底的に勉強したい人向けの本を紹介します。

ゴールデンブリッジでは、
翻訳・通訳・インバウンドツアー・国際会議運営など
ご用命をお待ちしております!
また、翻訳に関わるツール・ソフトウェアの開発等についてもお気軽にお声掛けください。

株式会社ゴールデンブリッジ 公式Webサイト