shellスクリプトで、以下のような形で

Question

FujiiRock

82

75もっと見る

100pt

コンピュータウェブ制作

shellスクリプトで、以下のような形で

csvファイルを読み込んでいるのですが、
csvの文字コードがUTF-8,LFであれば、
問題ないのですが、
csvの文字コードがShift-JISのCRLFですと、
FIELD5を読んだ時改行コードを取得してしまい、
[ "$FIELD5" != "" ] が、trueになってしまいます。
こういった場合の対処方法を教えて下さい。

for STR in `cat $BUF`
do
FIELD1=`echo -n $STR | cut -f 1 -d','`
FIELD2=`echo -n $STR | cut -f 2 -d','`
FIELD3=`echo -n $STR | cut -f 3 -d','`

〜処理略〜
done

回答の条件

1人5回まで

登録：2013/06/25 01:37:18
終了：2013/07/02 01:40:04

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

コメントはまだありません

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

ghost · Answer 1 · 2013-06-25T02:33:58+09:00

` cat $BUF ` の部分を ` cat $BUF | tr -d '\r' ` とでもすればよいです。

なおシェルスクリプト自体を SHIFT_JIS のlocaleで動かしているのでないなら、文字コードも変換した方が安全です・・・というより、さもなくば特定の文字が来たときに確実にコケます。たとえば UTF-8 のlocaleで動かすなら同様に以下のような感じで。

  ` iconv -f SHIFT_JIS -t UTF-8 -- $BUF | tr -d '\r' `

最終的に SHIFT_JIS で結果が欲しいなら出力時に逆向きに変換しなおします。

localeについては http://q.hatena.ne.jp/1363594648#a1194456 あたりもご参照ください。
(おおっと誤植修正:-)

a-kuma3 · Answer 2 · 2013-06-25T02:36:27+09:00

こんな感じで、どうでしょう？

for STR in `cat $BUF`

を、

for STR in `cat $BUF | tr -d \\r`

$BUF が指すファイルに、空白やタブが入ってたらどうするんだろう、という気がしなくもないんですが。

んで、処理の内容が分からないで書きますが、日本語の文字コードは別にして、こんな感じの方が良いんじゃないかと思います。

#   一行の処理を、サブルーチンにする
my_proc () {
    # 一行のデータを、カンマで分離する
    IFS=","
    FIELD1=$1
    FIELD2=$2
    FIELD3=$3
    ...
}

#   read で、一行ずつ処理する
cat $BUF | tr -d \\r | while read line
do
    my_proc $line
done

＃ bash で良いんですよね？

shellスクリプトで、以下のような形で

回答（2件）

ghost2192013/06/25 02:33:58

a-kuma3497421542013/06/25 02:36:27

コメント（0件)

この質問への反応（ブックマークコメント）