Wordファイルをtxtファイルに一括変換
Wordで大量のファイルがあったとき、一括検索をしたくなることも多いでしょう。 Tradosなどで処理することもできますが、もっと手軽な方法として、txtファイルに変換しておくというものがあります。 txtファイルであれば、PowerShellを使って全文検索が可能です。
# unoconv
txtファイルへの変換はLinuxのコマンド *”unoconv”*を使います。 Windowsからは利用できないため、仮想マシンを用意するか、 Windows10ユーザーであればWSLを利用するのが手軽だと思います。 (Linuxのインストールについてもいつか紹介します) 気になる方はストアから Ubuntu をインストールしてみてください。
以下、unoconvを使ったサンプルコードです。
# インストールがまだであればしておく
sudo apt-get install unoconv
# 変換の実行
# -fの後ろに変換後のフォーマット、その後に入力ファイルパス
unoconv -f txt *.doc*
unoconvはLibreOfficeを利用しているとのことで、インストールされていなければ、結構多量のパッケージがインストールされます。 急ぎの案件だとイライラしてしまうので、早めにインストールしておきましょう。
-fで指定するフォーマットには、PDFやHTML、RTFなどもあるようです。
ファイル数が多いときは時間がかかるので、根気も必要です。
# PR
Wordの使い方を初歩から徹底的に勉強したい人向けの本を紹介します。
ゴールデンブリッジでは、
翻訳・通訳・インバウンドツアー・国際会議運営など
ご用命をお待ちしております!
また、翻訳に関わるツール・ソフトウェアの開発等についてもお気軽にお声掛けください。