以下のような、品名とその金額が書かれたテキストがあります。

Question

tetlis

185

171もっと見る

120pt

コンピュータインターネット

以下のような、品名とその金額が書かれたテキストがあります。

品名の文字数でソートするにはどうしたらよいでしょうか？

※行数が100万行以上ありExcelでは扱えません。
※品名と金額の間はタブで区切られているとします。

★例(実際は100万行以上あります)★

<ソート前データ>
りんご 1000円
鉛筆 20円
ジャガイモ 210円

<ソート後データ>
鉛筆 20円
りんご 1000円
ジャガイモ 210円

回答の条件

URL必須
1人2回まで

登録：2007/09/11 12:08:19
終了：2007/09/18 12:10:25

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

コメントはまだありません

ardarimの日記 2007-09-15 00:59:42

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

リクエスト送信済

回答リクエストを送信したユーザーはいません

snpgr · Answer 1 · 2007-09-11T12:12:33+09:00

パッと思いつく物としては

タブを「,」に置き換えてCSV形式として保存し

EXCELでソートしてCSVで書き戻してから「,」をタブに戻すとか

参考：CSV形式

http://www.morgan.co.jp/kiso/3file-4.htm

kopj · Answer 2 · 2007-09-11T12:50:28+09:00

以下のソフトを用いたらいかがでしょうか？

ozsort テキストデータベース(並べ替え)

http://www.vector.co.jp/soft/win95/util/se290604.html

Yota · Answer 3 · 2007-09-11T14:10:06+09:00

タブ区切りファイルからリレーショナルデータベースのテーブルにINSERTすれば、文字列の長さでソートできます。

例えば、

http://www.postgresql.jp/

Yota · Answer 4 · 2007-09-11T15:23:22+09:00

1.PostgreSQLサーバをインストールする。

2.テーブルを作る

CREATE TABLE tablename(columnname type,.....) ;

3.データを入れる。

COPY tablename FROM 'filename' ;

参照。

http://www.postgresql.jp/document/pg820doc/html/sql-copy.html

4.並べ替える。

SELECT * FROM tablename ORDER BY char_length(columnname) ASC

参照。

http://www.postgresql.jp/document/pg820doc/html/functions-string...

5.タブ区切りファイルに書き出す。

COPY tablename TO 'filename';

aside · Answer 5 · 2007-09-11T17:08:01+09:00

http://q.hatena.ne.jp/answer

MS Accessで下記構成のテーブルを作成して

データを取り込んで、下記クエリを作って

実行すると、200万件のソート結果が

表示できました。

テーブル名：Test

品物名：フィールド1

価格：フィールド2

クエリ内容：

SELECT フィールド1, フィールド2

FROM Test

ORDER BY lenb(フィールド1);

みねそうた · Answer 6 · 2007-09-12T02:10:14+09:00

最終手段として…Perlで。

まずActivePerlをインストールします。

ここから（項目は入力せずcontinueを押して先へ行けます。）

ActivePerlのインストール方法を参考にして下さい。

以下のコードを

#!perl

$data = 'data_file.txt'; #データの入っているファイル

$new_file_name = '>>newlist.txt'; #作成するファイル名「>>」は必要です

open DATA, $data;

open NEW, $new_file_name;

print NEW sort {

length( (split /\t/,$a)[0] ) <=> length( (split /\t/,$b)[0] )

}<DATA>;

C:\tmp\sort.plのように保存、

コマンドプロンプトから

perl C:\tmp\sort.pl を実行すると出力されます。

このコードはメモリを非常に使います。だいたいデータ量の4倍です。40MBなら120MB以上の空きが必要です。時間もそれなりにかかります。32MBの150万件のデータで5分くらいです。

みねそうた · Answer 7 · 2007-09-13T00:02:00+09:00

Unicode(UTF-16LE)でしたら、以下のコードで

#!perl
$data = 'C:\data\data_file.txt'; #データの入っているファイル
$new_file_name = 'newlist.txt'; #作成するファイル名

open DATA, "<:encoding(utf16-le)", $data;
open NEW, ">:raw:encoding(utf16-le)", $new_file_name;

print NEW sort {
    length( (split /\t/,$a)[0] ) <=> length( (split /\t/,$b)[0] )
}<DATA>;

エンコードする分時間がかかります。

これでダメならデータをいったんTeraPadなどのテキストエディタでShift-Jisにして、最初のコードで出力後、Unicodeにする手もあります。

以下のような、品名とその金額が書かれたテキストがあります。

回答（7件）

snpgr2732007/09/11 12:12:33

kopj12362007/09/11 12:50:28

Yota453282007/09/11 14:10:06

Yota453282007/09/11 15:23:22

aside339312007/09/11 17:08:01

みねそうた2322007/09/12 02:10:14

みねそうた2322007/09/13 00:02:00

コメント（0件)

この質問への反応（ブックマークコメント）

トラックバック