Mazn.net

やってみて 調べてみて 苦労しなけりゃ 箱は動かじ

文字コード一括変換@Linux

      2013/07/15

最近のLinuxはUTF8が標準になっていますが、ちょっと昔のファイルはEUCだったりします。UTF8に変換したい場合、一つずつ変換してもいいですが、大量ファイルがあると面倒なので、一括で変換する方法です。

nkf編

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; nkf -d -w80 $i > utf8/$i ; done

nkf :
-d : LF(UNIX)に変換
-w80 : UTF8に変換

ls :
-I utf8 : utf8というファイル名やディレクトリ名を出力しない

iconv編

iconvはうまく変換できずにエラーになる場合があるようです。
また、改行コードは変換できません。

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; iconv -f EUC-JP -t UTF9 $i > utf8/$i ; done

iconv :
-f インプットファイルのコード
-t アウトプットのコード

 - IT技術, プログラミング ,

336px

Message

メールアドレスが公開されることはありません。

  関連記事

no image
Thinkpad USB Trackpoint キーボードでスクロール@Fedora 17

Fedora 17 上で、Thinkpad USB Trackpoint キーボ …

no image
fileコマンドの判定方法@CentOS 5.4

あるファイルが何のファイルかを判別するためのコマンドfileコマンドがありますが …

no image
b-mobileのプロキシ

b-mobileのプロキシって三つあるんですね。 marion 低圧縮 mari …

no image
USBハードディスクにWindows 7インストール

今あるPCのシステムを消したくなかったので、USBハードディスクにWindows …

no image
PXEブートでネットワークインストール@RHEL5 or CentOS5

最近のPCやサーバーではPXEというネットワークブートを使って、CDやDVDを使 …

no image
Java スクリプト API

Javascriptではありません。Java スクリプト APIです。 JRub …

no image
コマンドプロンプトを任意のフォルダから開く@Windows 7

Shiftを押しながらフォルダを右クリックすることで、”コマンドウィ …

no image
Linuxコンテナ(LXC)を使ってみた@Ubuntu 14.04

Linuxコンテナ(LXC)をUbuntu 14.04上で使用した時のメモです。 …

no image
OpenOffice 3のインストール@debian系 Linux

OpenOffice 3がリリースされたので、Linuxにインストールしてみまし …

no image
Javaアプリの日本語文字化け対策

Linux上のSunのJVMで、GUIアプリを動かすと文字化けしてしまいます。 …