xmisao回答ポイント 200pt

データベースについての質問です。

一般的にRDBMSではインデックスにB+木を利用していると思います。良くわからないのは、キーが文字列で長い場合です。単純にキーをノードに格納すると、キーがノードの容量の多くを占めます。このため、ノードに格納できる要素数が少なくなり、時間的・空間的な効率が悪化するように思います。RDBMSでは、どのようにこの問題を解決しているのでしょうか?

以下いずれかの形式に沿って回答をお願いします。
簡単な解説も加えていただけると助かります。

1. 文字列をキーとするインデックスで効率の良いXXというアルゴリズムがあり、一般的にRDBMSではそれを利用している

2. XXというRDBMSでは、XXのようなアプローチを採用している

3. 一般的にRDBMSでは長いキーに特に対策をしていない

なお、MySQLのcol_name(length)のようにプリフィックス長でキーを切り詰める方法や、PostgreSQLのpg_trgmモジュールのようにn-gramインデックスを作る方法は、回答不要です。

また、そもそもとんちんかんなことを質問している場合、そのことをご指摘ください。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ログインして回答する

みんなの回答

なむうぉんす2014/08/06 09:26:46
満足200pt

1. 文字列をキーとするインデックスで効率の良いハッシュというアルゴリズムがあり、一般的にRDBMSではそれを利用している。

ハッシュ関数 - Wikipedia

　アルゴリズムとしては、MD5とかが有名です。

http://ja.wikipedia.org/wiki/MD5

スター
- 3件のコメントを見る
- xmisao 2014/08/06 18:50:32
  
  キーは探索する値と大小を比較できる必要がありますから、元の値の大小関係を保持できないハッシュは利用できないのではないでしょうか。ハッシュをどのように利用してRDBMSがこの問題を問題を解決しているのかもう少し詳しくご教示願えませんか。
  
  スター
- なむうぉんす 2014/08/06 21:01:29
  
  　ハッシュ値を使うのは全値一致の時のみです。というこで、こちらで必要なのは、ただのB・treeした。B+treeを使うからには、シーケンスな大小関係を扱うと言うことですね。失礼しました。
  
  　B+treeの方は、全文検索をベースにtreeを作るんですよ。力業ですね。各ノードのキーは全文が入っているリーフそのものだったりします。私が習ってる頃はそうでしたね。
  
  スター
- xmisao 2014/08/06 21:55:24
  
  確かに完全一致の場合にはハッシュが利用できますね。sasadaさんの見解はわかりました。回答ありがとうございました。
  
  スター

データベースについての質問です。

みんなの回答

なむうぉんす2014/08/06 09:26:46
満足200pt

xmisao 2014/08/06 18:50:32

なむうぉんす 2014/08/06 21:01:29

xmisao 2014/08/06 21:55:24

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

データベースについての質問です。

みんなの回答

なむうぉんす2014/08/06 09:26:46 満足200pt

xmisao 2014/08/06 18:50:32

なむうぉんす 2014/08/06 21:01:29

xmisao 2014/08/06 21:55:24

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

なむうぉんす2014/08/06 09:26:46
満足200pt