RubyでUTF-8でのﾌｧｲﾙ入出力について質問です｡ UTF-8のﾃｷｽﾄﾌｧｲﾙを読み込み､putやp等で出力すると､必ず最初の文字の先頭に存在しない｢･｣が勝手に挿入され…

RubyでUTF-8でのﾌｧｲﾙ入出力について質問です｡
UTF-8のﾃｷｽﾄﾌｧｲﾙを読み込み､putやp等で出力すると､必ず最初の文字の先頭に
存在しない｢･｣が勝手に挿入されてしまいます｡
｢･｣が挿入されない様にするにはどうすれば良いか教えて頂けますでしょうか｡

利用環境は以下になります｡
OS：Windows7 pro SP1
IDE：NetBeans7.0.1
Rubyﾊﾞｰｼﾞｮﾝ：ruby 1.9.3p194

ﾃｷｽﾄ内容は以下になります｡(UTF-8で保存)
10
20
30
田中
佐藤

出力結果が以下の様になります｡
????????･10
20
30
田中
佐藤

以上の出力結果の10の前に｢･｣が勝手に挿入されている状態となります｡
ちなみにｴﾝｺｰﾄﾞを別のに変えて保存した場合は｢･｣は無くなります｡

参考になるか分かりませんが､IDEで表示されている｢･｣をｺﾋﾟｰして
ﾃｷｽﾄｴﾃﾞｨﾀに貼り付けると｢？｣で表示され､Windows標準のﾒﾓ帳に貼り付け
ようとすると､貼り付けが出来ない状態(存在しない状態)となります｡
また､external_encodingはUTF-8になっている事を確認しています｡

以上の原因と対策を教えて頂けますでしょうか｡
何卒宜しくお願い致します

BOM有りのUTF-8ﾌｧｲﾙを読み込んでいるものと思われます｡
(ﾌｧｲﾙの先頭にﾊﾞｲﾄｵｰﾀﾞｰの情報があるﾌｧｲﾙ)

元のﾃﾞｰﾀを作成する側でBOM無し保存できるなら､
それに越したことはありません｡

ﾃﾞｰﾀ作成側での対応が無理で､ruby側で対処するならば､
BOM付きであることを明示してopenすると良いでしょう｡

open(ﾌｧｲﾙ名, 'r:BOM|UTF-8')

BOMの有無が判らない場合は､
先頭の3ﾊﾞｲﾄが以下であれば､削れば良いでしょう｡
http://ja.wikipedia.org/wiki/%E3%83%90%E3%82%A4%E3%83%88%E3%82%AA%E3%83%BC%E3%83%80%E3%83%BC%E3%83%9E%E3%83%BC%E3%82%AF

0xEF 0xBB 0xBF

BOM(Byte Order Mark)ですね｡

http://ruby.11.n6.nabble.com/ruby-dev-32979-BOM-of-UTF-td3519737.html

まつもとゆきひろです
...
|つぎに現状でdon't care であるとして､それは仕様として(とりあえずの
|形であっても)固定されたものですか?

将来にわたって対応しないと断言するほどではないですが､対応す
る予定はありません｡

と､昔の情報では､こんなことを書いています｡
なので､こんな対応をしているのも見つかります｡

http://stackoverflow.com/questions/5011504/is-there-a-way-to-remove-the-bom-from-a-utf-8-encoded-file

 content.gsub!("\xEF\xBB\xBF".force_encoding("UTF-8"), '')

でも､最新のﾊﾞｰｼﾞｮﾝでは､対応されてるみたい｡

http://doc.ruby-lang.org/ja/1.9.3/method/Kernel/m/open.html

ｴﾝｺｰﾃﾞｨﾝｸﾞの指定
ext_enc(外部ｴﾝｺｰﾃﾞｨﾝｸﾞ)が指定されている場合､読み込まれた文字列にはこのｴﾝｺｰﾃﾞｨﾝｸﾞが指定され､出力する文字列はそのｴﾝｺｰﾃﾞｨﾝｸﾞに変換されます｡
ext_encが'-bom'で終わる場合､その入力に含まれるBOMはあらかじめ削られます｡また､BOMがあった場合､入力された文字列にはそのBOMに対応するｴﾝｺｰﾃﾞｨﾝｸﾞが設定されます｡

でも､ちょっと罠があるらしく...
http://smileruby.hatenablog.com/entry/20110221/1298298952

つｰか､Encodingに-bomで終わるのなんてあたっけ？

で､こうなんだとか｡

念のためこっち(Index of Classes & Methods in Ruby 1.9.3 (Ruby 1.9.3) )で確認したら…
『If ext_enc starts with ‘BOM|’,? 』ってなっている!!
ってことでｺﾁﾗが正解

puts File.open("utf8.txt", "r:UTF-8"){ |fp| fp.read(6).dump }
# => "\xEF\xBB\xBF20\t"
puts File.open("utf8.txt", "r:BOM|UTF-8"){ |fp| fp.read(3).dump }
# => "20\t"
puts File.open("utf8n.txt", "r:BOM|UTF-8"){ |fp| fp.read(3).dump }
# => "20\t"

http://www.ruby-doc.org/core-1.9.3/Kernel.html#method-i-open

If ext_enc starts with ‘BOM|’, check whether the input has a BOM. If there is a BOM, strip it and set external encoding as what the BOM tells.