「独自の意味を持つ語句をマークアップするのに最適なASCII文字は?」
個人的に特殊な意味を与えた単語(例えば "EN" は常に「『英語』という言語」の意味)を、それとわかるように、マークアップしておいて、検索やプログラムによる自動処理に使いたいと思います。
つきましては、US ASCII 文字の中から、最適なマークアップ文字を推薦してください。また、その理由も説明してください。
US ASCII 一覧: http://upload.wikimedia.org/wikipedia/commons/8/85/ASCII_Code_Chart-Quick_ref_card.jpg
私は次の技術・書式を常用しています。
・ISO規格
・WWW
・URI
・Windows 2000以降
・Mac OS X
・Linux
・Google Chrome OS (出たら)
・XML
・(X)HTML
・CSS
・PHP
・JavaScript
・C
・C++
・Java
・VisualBasic.NET
・C#
・VBA
・Google Go
・MySQL
・Postgre SQL
・正規表現
・国際音声記号(IPA)
また、私はすでに、下記の文字を一意な意味で使っています。
・# …半角数字
・x …文字
・_ …空白(blank)
やはり1文字がいいですねぇ。
^、検討いたします。
検討結果はこの返信の書き換えにてお知らせいたします。
決定したマークアップ文字で囲うんですよね?
総合的に_(アンダースコア)が無難そうですが、すでに空白として
予約されているようなので、;(セミコロン)あたりでしょうか。
(下記の考えのもと!も好み的には美しいのですが、もっぱらif構文
で使われることも多く、;なら仮にステートメントの区切りと
解釈された場合、明らかにコードエラーとなるので検知も容易
という点で決めました。)
考え方としては、各種挙げられている言語や正規表現、
コメント用マークアップ等のすべてでメタキャラクタ定義
されていない文字とするか、
むしろその反対で、すべてでメタキャラクタ定義されているものを
選ぶかというのはどうでしょう?
前者の場合、エスケープが不要になりますし、
後者ですと逆にエスケープしないと解釈が変わるため
コンパイル言語ではミスを検知できる可能性もゼロではないと
思いますが、スクリプト系言語は当然ながら、
まったく検知できない可能性のほうが高いかと。
スクリプト系言語はそもそもコードエラー/ワーニングの検知が
やや困難な傾向にあると思うので、やはり共通で
メタキャラクタ定義されていない前者のほうが無難かも知れません。
いずれにしてもかなり広範囲な言語/仕様等を網羅されている
ようなので、あくまで考え方のご相談という認識でして、
本当に適当な文字は広く精通されたakkeyyyyさんのほうが
よくご存知だと思いますが・・・
囲っても、語句の最初につけるだけでもよいです。どちらかと言えば、頻繁に使うので、頭に付けるだけの方が良いかな。
すみません、;はちょっと……。英語の自然文でよく使うので。
ちょっと、ご助言がプログラミング言語中心すぎるような感じがします。
多用するのでしたらやはり"^"ではないでしょうか
理由は、入力時にシフトが不要で普通は使わないから。
url表記をあまりつかわないなら"\"もよいかもしれません
^に一票というということで承ります。
コード 0x7f []
はどうでしょう。確実にどの言語でも使われていません。
場合によっては文字化けするかもしれませんが。
viやシェルで入力するならctrl-v BackSpace で入力できます。grepもできます。
有難うございます。"[" と "]" とで挟みこむということですね。
やはり1文字がいいですねぇ。
^、検討いたします。
検討結果はこの返信の書き換えにてお知らせいたします。