Mazn.net

やってみて 調べてみて 苦労しなけりゃ 箱は動かじ

文字コード一括変換@Linux

      2013/07/15

最近のLinuxはUTF8が標準になっていますが、ちょっと昔のファイルはEUCだったりします。UTF8に変換したい場合、一つずつ変換してもいいですが、大量ファイルがあると面倒なので、一括で変換する方法です。

nkf編

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; nkf -d -w80 $i > utf8/$i ; done

nkf :
-d : LF(UNIX)に変換
-w80 : UTF8に変換

ls :
-I utf8 : utf8というファイル名やディレクトリ名を出力しない

iconv編

iconvはうまく変換できずにエラーになる場合があるようです。
また、改行コードは変換できません。

$ mkdir utf8
$ for i in `ls -I utf8`; do  echo $i; iconv -f EUC-JP -t UTF9 $i > utf8/$i ; done

iconv :
-f インプットファイルのコード
-t アウトプットのコード

 - IT技術, プログラミング ,

336px

Message

メールアドレスが公開されることはありません。

  関連記事

no image
ck@cygwin 1.7

cygwin 1.7 より前では、ターミナルエミュレータにckを使っていたのです …

no image
Cisco IOSエミュレータDynamipsを使ってみる@CentOS 5

Ciscoのスイッチやルータの設定の勉強をしたくて、DynamipsというCis …

no image
DLNAサーバ TVersity

PS3はDLNAクライアント機能があるため、ネットワーク上にある音楽や動画を再生 …

no image
パイプを使ったループの中で使用した変数をループ外で参照できない@bash

bashでパイプを使って以下のような処理をすると、ループ内の変数の値をループ外で …

no image
Systemtapを使ってみる@RHEL 5.5 x86_64

Systemtap を使用してみたので覚え書き。 Systemtapでは、動的に …

no image
自分のWebページにTwitterの呟きを表示

WordPressのTwitter表示プラグインが重たいので、直接以下のコードを …

no image
ドメイン名一覧をドメイン毎にソート(文字列の反転)@bash

Webページのアクセス解析をドメイン毎に集計してみようと思って、IPを抜き出しホ …

no image
Arrows Tab LTE F-01D をICS (4.0) にアップデート

やっとでました。Arrows Tab の 4.0アップデート。 早速アップデート …

no image
vimで改行に置換

viで改行を置換(削除)するには、 :%s/\\n//g とすればよいですが、改 …

no image
Oprofile @ RHEL5.5 on KVM

システムのプロファイルに役に立つOpfofileですが、KVM上でOprofil …