PowerShellでゼロ埋め

最近のWindowsは賢いので、1、2、3…10、11という名前のファイルが並んでいても、きちんと数字のとおり並べてくれます。ところがソフトによっては最初の文字だけを基準にソートするものもあり、1、11、12...2、3、4...のように並べられることもあります。 これを回避するためには、01、02、03…のようにいわゆる「ゼロ埋め」をするのが常套手段なのですが、桁数が増えるとなかなか面倒で ...

Elasticsearchを導入してみた

Windows7のサポート終了で余ったPCが出てきたので、CentOSをインストールしてElasticsearchに手を出してみました。 全文検索に向け、ジャブを放ってみます。 Elasticsearchってなに? オープンソースの全文検索エンジンです。速いらしいのと、日本語も中国語にも対応している(形態素解析による検索が可能)ということで選びました。 詳しくは[El ...

Wordからテキストを抽出する

日々テキストファイルを量産する翻訳会社にとって、使いやすい全文検索システムは夢の一つです。 弊社でも探三郎やFESSをはじめ、色々なソフトを導入したのですが、中国語に対応していなかったり、翻訳中のものを拾ってきたりと、そのままではなかなか「使いやすい」とはいきませんでした。 これはソフトの問題というよりは、フォルダ構成の問題というか、普段の業務フローそのままでは使い勝手が向上しない ...

Get-ChildItem チートシート

PowerShellの入門向けで、なおかつ翻訳者にとってお世話になる頻度が高いのがこの”Get-ChildItem”。 指定したフォルダにあるファイル・フォルダを表示してくれるコマンドレットです。 いくつかのオプションがあるので見ていきましょう。 概要 エイリアス gci ls dir オプション | オプション | 引数 | 説明 ...

Get-ChildItemとリダイレクトでファイルリストをつくる

複数に分割されたファイルで翻訳依頼を受けた場合、ファイルリストを作って管理したくなることもしばしば。 そんなときはPowerShellで一気に解決しましょう。 `powershell Get-ChildItem -File -Name > list.txt ` リダイレクト記号 リダイレクト記号 ”>” は不等号というより矢印の意味。 本来出力される結果 ...