人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

perlスクリプトで日本語文字列を
頭から250byte切り出しているのですが、
そこで最後の文字が壊れてしまうようです。
とりあえず、半角スペースをくっつけてしのいでいるのですが、
時には機種依存文字と認識されたりするようです。
何か良いやり方があるのでしょうか。

RSS(RDF?)ファイルを自動生成させています。
mixiに自作の日記を拾ってもらいたいのです。
http://sf.lovelove.jp/takaakira/index.rdf

●質問者: no1livesforever
●カテゴリ:コンピュータ
✍キーワード:mixi Perl RDF RSS スクリプト
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● TomCat
●50ポイント

http://akebi.jp/support/cyclamen.cgi?log=perl&tree=r20

全角文字対応substr(S-JIS専用)

要するに全角文字対応のsubstr、

ってことですよね。

ご紹介したページは非常に巧妙な方法で

これを実現しています。

ここではS-JISを前提にコーディングされていますが、

全角文字「泣き別れ」の処理方法は

どのコード体系でも同じです。

◎質問者からの返答

なるほど!ちょっと改良してみます。


2 ● ponta3rd
●13ポイント

http://www.gac.jp/article/index.php?stats=question&category=11&i...

GAC なぜなにGAC->PHP

こちらのurlで分割した箇所の文字判断(半角、全角の途中)のロジックが記載されています。

◎質問者からの返答

なるほど。


3 ● snitch
●13ポイント

http://www.din.or.jp/~ohzaki/perl.htm#JP_Fold

Perlメモ

日本語の処理がうまくいっていないようですね。

上記の特定の長さで折り返すで利用しているfold.plを利用してみてはどうでしょうか?

http://www.srekcah.org/~utashiro/perl/scripts/fold_pl/

fold_pl

◎質問者からの返答

ありがとうございました。

質問を終了させていただきます。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ