[!NOTE]
この記事は 2012/10/08 に momoto.github.io へ投稿した内容を Qiita へ移行してきたものです
文字コードを変換するためには、 iconv
のオプション --from-code (-f)
に変換前の文字コードを、--to-code (-t)
に変換後の文字コードを、さらに入力ファイルと出力ファイルを指定します。
例えば、Windows で作成したテキストファイル(SJIS-WIN)を UTF-8 へ変換したい場合は次のようなコマンドになります。
iconv -f SJIS-WIN -t UTF-8 coded_in_sjiswin.txt > coded_in_utf8.txt
扱える文字コードについては iconv --list
で一覧を出力できます。日本語に関連しそうな行に見当をつけて、制限して表示してみると次のような出力でした。
iconv --list | grep -iP "ja|jp"
CSEUCPKDFMTJAPANESE//
CSISO2022JP//
CSISO2022JP2//
EBCDIC-JP-E//
EBCDIC-JP-KANA//
EUC-JP-MS//
EUC-JP//
EUCJP-MS//
EUCJP-OPEN//
EUCJP-WIN//
EUCJP//
ISO-2022-JP-2//
ISO-2022-JP-3//
ISO-2022-JP//
ISO646-JP-OCR-B//
ISO646-JP//
ISO2022JP//
ISO2022JP2//
JP-OCR-B//
JP//