Mazn.net

やってみて 調べてみて 苦労しなけりゃ 箱は動かじ

文字コード一括変換@Linux

      2013/07/15

最近のLinuxはUTF8が標準になっていますが、ちょっと昔のファイルはEUCだったりします。UTF8に変換したい場合、一つずつ変換してもいいですが、大量ファイルがあると面倒なので、一括で変換する方法です。

nkf編

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; nkf -d -w80 $i > utf8/$i ; done

nkf :
-d : LF(UNIX)に変換
-w80 : UTF8に変換

ls :
-I utf8 : utf8というファイル名やディレクトリ名を出力しない

iconv編

iconvはうまく変換できずにエラーになる場合があるようです。
また、改行コードは変換できません。

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; iconv -f EUC-JP -t UTF9 $i > utf8/$i ; done

iconv :
-f インプットファイルのコード
-t アウトプットのコード

 - IT技術, プログラミング ,

336px

Message

メールアドレスが公開されることはありません。

  関連記事

no image
PAM認証でのchroot

サーバのセキュリティを確保するためにchrootを使用する方法がありますが、サー …

no image
自分のWebページにTwitterの呟きを表示

WordPressのTwitter表示プラグインが重たいので、直接以下のコードを …

no image
b-mobileのプロキシ

b-mobileのプロキシって三つあるんですね。 marion 低圧縮 mari …

no image
cygwin ck のダブルクリック選択文字列の範囲を変更する

Cygwin 用のターミナルソフトウェア cygwin ck  を便利に使わせて …

no image
リモートデスクトップサーバ構築@Ubuntu 14.04 LTS

Ubuntu 14.04.2 LTS (Cloud-image版)に、リモートデ …

no image
コマンドラインのロック@CentOS 5

コンソールログインやssh接続などでコマンドラインを使用しているとき、少し席を外 …

GO言語1.12の新機能モジュールを使う

GO 1.12から、公式にmoduleが使えるようになるようなので、一足先に1. …

no image
Windowsでの自動起動ソフトウェアを制御する@Windows XP

Windowsの起動時に自動で起動するソフトウェアは、全てのプログラムのスタート …

no image
タイムゾーンの変更方法@RHEL

RHELやCentoSインストール時にタイムゾーン間違ったり、VMwareでクイ …

no image
PC電源ユニット ENERMAX MODU82+ EMD525AWT購入

PCのATX電源として、Seasonic の”SS-300FS&#8 …