【良回答に100P~パーフェクト採用回答に500P】


「独自の意味を持つ語句をマークアップするのに最適なASCII文字は?」

個人的に特殊な意味を与えた単語(例えば "EN" は常に「『英語』という言語」の意味)を、それとわかるように、マークアップしておいて、検索やプログラムによる自動処理に使いたいと思います。

つきましては、US ASCII 文字の中から、最適なマークアップ文字を推薦してください。また、その理由も説明してください。

US ASCII 一覧: http://upload.wikimedia.org/wikipedia/commons/8/85/ASCII_Code_Chart-Quick_ref_card.jpg


私は次の技術・書式を常用しています。

・ISO規格
・WWW
・URI

・Windows 2000以降
・Mac OS X
・Linux
・Google Chrome OS (出たら)

・XML
・(X)HTML
・CSS
・PHP
・JavaScript

・C
・C++
・Java
・VisualBasic.NET
・C#
・VBA
・Google Go

・MySQL
・Postgre SQL

・正規表現
・国際音声記号(IPA)

また、私はすでに、下記の文字を一意な意味で使っています。

・# …半角数字
・x …文字
・_ …空白(blank)

回答の条件
  • 1人2回まで
  • 13歳以上
  • 登録:2010/12/14 20:58:12
  • 終了:2010/12/19 03:50:16

ベストアンサー

id:sibazyun No.1

sibazyun回答回数1738ベストアンサー獲得回数2342010/12/14 22:58:50

ポイント100pt
  • もし1文字でなくて良いというなら、htmlの注釈用の<!-- -->をもとに<!--my -->とでもすれば、他のマークアップとも重なることなく、後での抽出にも使えるでしょう。入力時には、これを例えば「my」で単語辞書登録しておけばよい。(注:上記の< >で囲まれた部分は、本来は半角文字です。この回答欄に半角で書くと、注釈となるならしくて、表示されなくなってしまいますので、便宜的に全角文字で書きました)
  • どうしても1文字というなら^あたりはどうでしょう。もちろん、日常的に数式を扱うとかエスペラントの字上付文字を扱うとかならまぎれるでしょうが、英文、ローマ字の範囲で、他に使わないコードということで。
id:akkeyyyy

やはり1文字がいいですねぇ。

^、検討いたします。

検討結果はこの返信の書き換えにてお知らせいたします。

2010/12/15 00:10:27

その他の回答(4件)

id:sibazyun No.1

sibazyun回答回数1738ベストアンサー獲得回数2342010/12/14 22:58:50ここでベストアンサー

ポイント100pt
  • もし1文字でなくて良いというなら、htmlの注釈用の<!-- -->をもとに<!--my -->とでもすれば、他のマークアップとも重なることなく、後での抽出にも使えるでしょう。入力時には、これを例えば「my」で単語辞書登録しておけばよい。(注:上記の< >で囲まれた部分は、本来は半角文字です。この回答欄に半角で書くと、注釈となるならしくて、表示されなくなってしまいますので、便宜的に全角文字で書きました)
  • どうしても1文字というなら^あたりはどうでしょう。もちろん、日常的に数式を扱うとかエスペラントの字上付文字を扱うとかならまぎれるでしょうが、英文、ローマ字の範囲で、他に使わないコードということで。
id:akkeyyyy

やはり1文字がいいですねぇ。

^、検討いたします。

検討結果はこの返信の書き換えにてお知らせいたします。

2010/12/15 00:10:27
id:Galapagos No.2

Galapagos回答回数963ベストアンサー獲得回数892010/12/14 23:27:15

JP
日本語。全角文字。JaPanだから。
id:akkeyyyy

× 質問にある通り、US ASCII限定です。

2010/12/15 00:09:34
id:typista No.3

typista回答回数359ベストアンサー獲得回数72010/12/15 09:03:00

ポイント100pt

決定したマークアップ文字で囲うんですよね?

総合的に_(アンダースコア)が無難そうですが、すでに空白として

予約されているようなので、;(セミコロン)あたりでしょうか。

(下記の考えのもと!も好み的には美しいのですが、もっぱらif構文

で使われることも多く、;なら仮にステートメントの区切りと

解釈された場合、明らかにコードエラーとなるので検知も容易

という点で決めました。)

考え方としては、各種挙げられている言語や正規表現、

コメント用マークアップ等のすべてでメタキャラクタ定義

されていない文字とするか、

むしろその反対で、すべてでメタキャラクタ定義されているものを

選ぶかというのはどうでしょう?

前者の場合、エスケープが不要になりますし、

後者ですと逆にエスケープしないと解釈が変わるため

コンパイル言語ではミスを検知できる可能性もゼロではないと

思いますが、スクリプト系言語は当然ながら、

まったく検知できない可能性のほうが高いかと。

スクリプト系言語はそもそもコードエラー/ワーニングの検知が

やや困難な傾向にあると思うので、やはり共通で

メタキャラクタ定義されていない前者のほうが無難かも知れません。

いずれにしてもかなり広範囲な言語/仕様等を網羅されている

ようなので、あくまで考え方のご相談という認識でして、

本当に適当な文字は広く精通されたakkeyyyyさんのほうが

よくご存知だと思いますが・・・

id:akkeyyyy

囲っても、語句の最初につけるだけでもよいです。どちらかと言えば、頻繁に使うので、頭に付けるだけの方が良いかな。

すみません、;はちょっと……。英語の自然文でよく使うので。

ちょっと、ご助言がプログラミング言語中心すぎるような感じがします。

2010/12/16 21:43:43
id:loio No.4

loio回答回数342ベストアンサー獲得回数502010/12/15 18:23:45

ポイント100pt

多用するのでしたらやはり"^"ではないでしょうか

理由は、入力時にシフトが不要で普通は使わないから。

url表記をあまりつかわないなら"\"もよいかもしれません

id:akkeyyyy

^に一票というということで承ります。

2010/12/15 18:48:17
id:ita No.5

ita回答回数203ベストアンサー獲得回数472010/12/18 17:44:54

ポイント100pt

コード 0x7f []

はどうでしょう。確実にどの言語でも使われていません。

場合によっては文字化けするかもしれませんが。

viやシェルで入力するならctrl-v BackSpace で入力できます。grepもできます。

id:akkeyyyy

有難うございます。"[" と "]" とで挟みこむということですね。

2010/12/19 02:23:20
  • id:typista
    > 検索やプログラムによる自動処理に使いたい
    と言っているんだから「プログラム言語寄り」が行き過ぎですか?
    よくわかりませんね。

    英語に詳しいわけではないが、自然文でセミコロンってそんなに多用されるんです?
    常用しているという「技術・書式」から察すれば相応に造詣もありそうなので、
    理解されていると思いますが、マークアップ文字を頭だけに付けても
    どこが単語の終わりなのか判定できませんよね。
    辞書を持つとか(←本末転倒)、品詞分解(←これもどうかと)するとかが
    結局必要になりますが!?

  • id:akkeyyyy
    >typista様

    私が扱う英文は学術論文が多いので、セミコロンは非常に多用されます。

    マークアップを頭に付ける場合、ひとまとまりの句のスペースをアンダーバーに置き換えます。独自の意味ですから、それでよいのです。
  • id:akkeyyyy
    !!!!!!!!!!!!!!!!!!!!!!!!!!!!! >皆様 !!!!!!!!!!!!!!!!!!!!!!!!!!!

    ありがとうございました。今回の質問だけでは決まりませんでした。

    http://q.hatena.ne.jp/1292698357
    へ続きますので、引き続きお付き合いいただければ幸いです。
  • id:akkeyyyy
    >sibazyun様

    ごめんなさい、返答を書き換え忘れました。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません