「独自の意味を持つ語句をマークアップするのに最適なASCII文字は?」
個人的に特殊な意味を与えた単語(例えば "EN" は常に「『英語』という言語」の意味)を、それとわかるように、マークアップしておいて、検索やプログラムによる自動処理に使いたいと思います。
つきましては、US ASCII 文字の中から、最適なマークアップ文字を推薦してください。また、その理由も説明してください。
US ASCII 一覧: http://upload.wikimedia.org/wikipedia/commons/8/85/ASCII_Code_Chart-Quick_ref_card.jpg
私は次の技術・書式を常用しています。
・ISO規格
・WWW
・URI
・Windows 2000以降
・Mac OS X
・Linux
・Google Chrome OS (出たら)
・XML
・(X)HTML
・CSS
・PHP
・JavaScript
・C
・C++
・Java
・VisualBasic.NET
・C#
・VBA
・Google Go
・MySQL
・Postgre SQL
・正規表現
・国際音声記号(IPA)
また、私はすでに、下記の文字を一意な意味で使っています。
・# …半角数字
・x …文字
・_ …空白(blank)
と言っているんだから「プログラム言語寄り」が行き過ぎですか?
よくわかりませんね。
英語に詳しいわけではないが、自然文でセミコロンってそんなに多用されるんです?
常用しているという「技術・書式」から察すれば相応に造詣もありそうなので、
理解されていると思いますが、マークアップ文字を頭だけに付けても
どこが単語の終わりなのか判定できませんよね。
辞書を持つとか(←本末転倒)、品詞分解(←これもどうかと)するとかが
結局必要になりますが!?
私が扱う英文は学術論文が多いので、セミコロンは非常に多用されます。
マークアップを頭に付ける場合、ひとまとまりの句のスペースをアンダーバーに置き換えます。独自の意味ですから、それでよいのです。
ありがとうございました。今回の質問だけでは決まりませんでした。
http://q.hatena.ne.jp/1292698357
へ続きますので、引き続きお付き合いいただければ幸いです。
ごめんなさい、返答を書き換え忘れました。