akagi_paon回答ポイント 100pt

【アルゴリズムを教えてください】

要素数 m の配列が n 個あるとします。
一つめの配列のそれぞれの要素が全体で小さいほうから何番目に
あるかを算出するアルゴリズムで、O(nm^2) より小さいものを教えてください。
ただし、同順位の場合は順位の平均を求めるものとします。

例：(m = 4, n = 3)
[21, 11, 16, 19]
[20, 15, 12, 17]
[14, 21, 18, 13]
が与えられたとき、[11.5, 1, 6, 9] を求めたい。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ログインして回答する

ベストアンサー

犬猫ハーフ2009/05/08 15:18:26
満足100pt

アルゴリズムとして名前があるかは不明ですが、今思い付いたアルゴリズムを書きます。

（質問文のO(nm^2)はO((nm)^2)だと考えて、要求を満たすものだと考えました。私の思い違いでしたら申し訳ありません。）

1. 全ての配列を1つの（mn要素の）配列にまとめる（O(mn)）

2. 上記の配列をソートする（適切なアルゴリズムを使えばO(mn log(mn))）

3. ソート済みの配列から必要な順位を計算する（大体O((m^2)n)?）

質問文の例だと

1. [21, 11, 16, 19, 20, 15, 12, 17, 14, 21, 18, 13]

2. [11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 21]

3. ソート済みの配列から、21の平均順位は11.5、11の順位は1、…

3.の処理ですが、ソート済みの配列から任意の一要素（例えば11）を見つけるのは二分探索でO(m log(mn))。そこから同順位の要素を探すのが（1個あたりのワーストケースが）O(mn)なので、3.のオーダーはO((m^2)n)ではないかと。

という訳で、全体のオーダーは3.のO((m^2)n)になります。

スター
- akagi_paon 2009/05/08 18:18:56
  
  えーと、O(nm^2) は O(n×m×m) の意味です。
  
  単純に全体をなめるアルゴリズムでも O(n×m×m) でできますよね？
  
  とりあえず実装してみて使えそうならポイント差し上げます。
  
  ----
  
  実装してみました。
  
  ハッキリ言って、むちゃくちゃ速くなりました！
  
  今まで20分ほどかかっていた処理が50秒で終わりました＼(^o^)／
  
  ありがとうございました！

その他の回答

この質問へのコメント

akagi_paon2009/05/08 15:10:34

補足ですが、配列の要素は実際は整数とは限りませんので注意してください。
犬猫ハーフ2009/05/08 15:51:42

＞O(nm^2) は O(n×m×m) の意味です
そうでしたか、失礼しました。
SALINGER2009/05/08 15:55:22

全体をソートしてしまうと、全体を走査するO(nm^2)よりも時間が掛かってしまいますね。
そこで、考えた方法は、
まず例では、２１を全体から走査して順位を出します。
そのときに、各要素を２１より大きい物と小さい物の２つの要素分けます。
次に、１１の順位を出すときに２１より小さいので先ほどの小さい物を集めた要素から順位を出します。
このように、一つ前の要素を利用して短縮することで、O(nm^2)より早くなります。
Mook2009/05/08 18:29:41

締め切りになっていますが、せっかく作ってみたのでサンプルです。
対象となる先頭の配列のみソートしていますが、あとは１回のスキャンで
終わっているので、計算量としては O(mn)になります。
n が十分大きい場合には有効かと思います。

<html>
<head>
<script type="text/javascript">

</script>
</head>
<body>
<input type="text" name="ar1" value="21">
<input type="text" name="ar1" value="11">
<input type="text" name="ar1" value="16">
<input type="text" name="ar1" value="19">
<br>

<input type="text" name="ar" value="20">
<input type="text" name="ar" value="15">
<input type="text" name="ar" value="12">
<input type="text" name="ar" value="17">
<br>

<input type="text" name="ar" value="14">
<input type="text" name="ar" value="21">
<input type="text" name="ar" value="18">
<input type="text" name="ar" value="13">
<br>
<br>
<br>
<input type="button" value="実行" onclick="arrayRanking();">
<br>
<br>
<input type="text" name="ans">
<input type="text" name="ans">
<input type="text" name="ans">
<input type="text" name="ans">
<br>
</body>
</html>
akagi_paon2009/05/08 19:09:54

SALINGER さん、Mook さん、コメントありがとうございます。
特に Mook さんのは休みが明けたら実装してみようかと思います
(JavaScriptはあんまりわかんないんですよね・・・)
akagi_paon2009/05/08 19:41:11

Mook さん・・・これ・・・
一番上の段を[1,2,3,4]にすると結果が[1,8,11,12]になるんですけど・・・
なにか間違ってませんか？
Mook2009/05/08 20:03:25

数値が文字列として処理されている部分があったようです。

// 集計処理
for ( var i=0 ; i< ars.length ; i++ ) {
for( var j=0 ; j<base.length ; j++ ) {
if ( Number(ars[i].value) < base[j] ) {
( backet[2 * j] )++;
break;
}
if ( Number(ars[i].value) == base[j] ) {
backet[2 * j + 1]++;
break;
}
}
}

のように
　　ars[i].value
を
　　Number(ars[i].value)
に変えてください。
犬猫ハーフ2009/05/08 21:34:10

今更回答1の補足ですが「そこから同順位の要素を探すのが（1個あたりのワーストケースが）O(mn)なので」の部分は、本当にワーストケース（要素の重複がかなり多いケース）を想定して書いたので、実際はそこまで遅くはないかもしれません。
SALINGERさんのアイデアは面白いですね。一度処理した結果を流用するというのは私には思い付きませんでした。
Mook2009/05/10 20:30:38

JavaScript がお得意ではないということなので、
とりあえずアルゴリズムの説明です。

（１）計測対象の配列（1列目：サイズ N）だけをソートした配列を用意します。
　　（このとき元の順番を示す情報を作成しておくと結果の処理が楽になりそうです）。
　　　DataArray[N] （JavaScript では base[N] ）

（２）計測用の配列（サイズ N）を二つ用意します（例示では面倒なので２Nの配列にしました）。　　
　　　LessThanArray[N]　　（JavaScript では backet[2N] ・・・・正しい綴りは bucket でした。）
　　　SameArray[N]

（３）すべてのデータを先頭配列のN番目のデータより小さい、N番目のデータに等しい、に応じてカウントします。
　　　LessThanArray[i] は DataArray[i-1] より大きく DataArray[i] より小さいものの数
　　　SameArray[i] は DataArray[i] と等しいものの数

（４）DataArray[i] の順位は次の式になります。
　　　DataArray[i] の順位 =（ LessThanArray[0] から LessThanArray[i] までの和）＋１＋（※ 同じものがある場合の勘案分）

　　※の処理があいまいな部分があるのですが、11番目のものが４つあったら 11.25 になるのですか？
　　であれば、JavaScript にあるように、SameArray[i] が2以上の場合のみ、
　　（４）に（　1 / SameArray[i]　）を足します。

各データを処理する部分は（３）のデータを計数する部分のみですので、O(mn)になるかと思います。

どうでもよい話ですが、
O(...)というのは係数を無視した計算量のオーダーを示す表現なので
実際の計算量が 100 × m × n でも 1/100 × m × n でも O(mn) となります。

例えばバブルソートの平均計算量は 1/2 n × n ですが、O(n^2) というように表現します。
akagi_paon2009/05/12 16:01:41

Mookさん、アルゴリズムの解説ありがとうございます。
だいたいつかめました。
ところで（３）の処理って O(nm^2) かかるような気がするんですけどどうでしょう？
テーブル全体をなめるのに O(mn)、LessThanArray の添字を出すのに(上のプログラムでは) O(m) かかっている気がします。
添字を求めるのにバイナリサーチを使えば O(nm*log(m)) くらいにはできそうですけど。
Mook2009/05/12 21:07:26

うーん、確かにそうですね。
考え違いをしていたようです。

ただ、負け惜しみですが、m×n の要素全体をソートするコストは
クイックソートでもO(nm・log(mn))ですから、それよりは高速だと
思います。

mが大きいのであれば、バイナリサーチを使用したほうが良いかも
しれませんが、実例のように４程度であれば、単純な比較でも性能に
影響はなさそうな気もします。

実際の、ｍ、ｎはどのくらいの数値なのでしょうか。
akagi_paon2009/05/13 15:36:53

＞実際の、ｍ、ｎはどのくらいの数値なのでしょうか。
m=300～100000, n=30～100 くらいです。

実装してみましたが、速度に関しては cdaotg さんのアルゴリズムも Mook さんのアルゴリズムもたいした違いは出ませんでした（Mook さんの方がちょっとだけ遅かった）
しかし、cdaotg さんのアルゴリズムでは配列を最初にすべて取り込んでおかないといけないのに対し、Mook さんのアルゴリズムでは逐次的に取り込めばいいので、消費メモリ量に格段に差が出ました。
よって、Mook さんのアルゴリズムを使おうと思います。
Mook さんありがとうございました。あとでポイント送信させていただきます。
Mook2009/05/13 19:49:59

>m=300～100000, n=30～100 くらいです。
あらら、期待していた状態とは逆に m の方がずっと大きいのですか。
であれば、cdaotg さんのアルゴリズムとさほど性能差はないですね。

実際にどの言語で実装されているのか、入出力のデータ形式がなんであるのか、
またデータ運用がどうであるかも興味のあるところですが、単純にアルゴリズムを
考えるだけでも興味深い問題で、こちらも楽しませていただきました。

【アルゴリズムを教えてください】

ベストアンサー

犬猫ハーフ2009/05/08 15:18:26
満足100pt

akagi_paon 2009/05/08 18:18:56

その他の回答

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

【アルゴリズムを教えてください】

ベストアンサー

犬猫ハーフ2009/05/08 15:18:26 満足100pt

akagi_paon 2009/05/08 18:18:56

その他の回答

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

犬猫ハーフ2009/05/08 15:18:26
満足100pt