ある文章を先頭から50文字の位置で切り分けたいのですが
きちんと文字と文字の間で切れる方法を教えてください。
文章は英数字日本語その他色々な文字を含んでいるとします。
EUCだと下記のように取得出来ますがUTF-8で
同様のことがしたいと考えています。
(([\x00-\x7F]|[\x8E\xA1-\xFE][\xA1-\xFE]|\x8F[\xA1-\xFE][\xA1-\xFE]){50})
よろしくお願いします。
(([\x00-\x7F]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|[\xF0-\xF7][\x80-\xBF]{3}){50})
でいけると思います。Perlの正規表現ですが、このあたりが参考になると思います。
ありがとうございます。
が、だめでした...
追記
申し訳ありません。
検証のしかたに問題があったようです。
問題なく動作しました。
ありがとうございました。