【テキストデータHPのボリューム】

単純な質問です。
テキストデータオンリーのホームページで、容量が23メガバイトある場合、
大体「400字詰め原稿用紙にして何枚」の文章量に相当するのでしょうか?
あるいは「A4サイズの紙に印刷して何ページ相当」という回答でもOKです。

自分のホームページ
http://www.geocities.co.jp/HeartLand-Keyaki/7891/
が23メガバイトあるのですが、文章量にしてどれ位のボリュームが
あるのか、自分でも把握できないので・・・
(ネットサーファーがイチから自分のページを読み始めた場合、
 延べ何時間掛かるのか、把握したい)

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/11/21 18:29:26
  • 終了:--

回答(5件)

id:kaminoitte No.1

kaminoitte回答回数254ベストアンサー獲得回数02005/11/21 18:42:51

ポイント20pt

http://www.forest.impress.co.jp/article/1999/10/29/okiniiri.html

���̓m - �y�����̂��C�ɓ����z�������v�Z�u�������J�E���g�c�[�� StrCount�vv1.10

こういうソフトを使ったらどうでしょうか?

自分のPCにバックアップしてあるサイトデータをドラッグ&ドロップするだけでいいみたいですよ。

http://www.vector.co.jp/soft/win95/util/se103220.html

文字数カウントツール(Windows95/98/Me / ユーティリティ)

最新のはこちら

id:itarumurayama

なるほどです。

ありがとうございます・・・と言いたいところですが、ページ数が(多分)1,000ページ近くあるので、いちいちページ毎にドラッグ&ドロップする手間が大変かな?

それともフォルダまるごと、まとめてドラッグ&ドロップできるのかな?

2005/11/21 18:46:22
id:nitscape No.2

nitscape回答回数526ベストアンサー獲得回数02005/11/21 19:02:02

ポイント20pt

http://www.geocities.co.jp/HeartLand-Keyaki/7891/preftale/k.html

�s���{���������ܘb�i�ߋE�j

23GB=23*1000*1000Bytes

とすると、文字数は全角文字で23*1000*1000/2文字になります。


ホームページ内の文章を見てみると(少なくとも私が見たページは)

------

  また修学旅行で先生方が京都の寺社ばかり行かせるのがいけない。

  生徒はだから「京都=カビ臭い街」とかステレオタイプに信じ込むのです。

  だから京都の修学旅行は生徒にとってつまらなくなり、その影響か、京都への修学旅行はジリ貧です。

  高校生なら、たとえば京大とか同志社・立命館のキャンパスや研究所を見せて、受験生でもある生徒に

  「大学とはこういうものか」と見せるのも手ではないでしょうか?

------

という感じでした。


このことから文章を、行頭に全角スペース2つ、1行平均全角30文字、シフトJISと仮定すると、文字数30文字に対して

改行(2バイト)+全角スペース2文字がかかりますから、実際の文章の割合は30/33になります。


つまり文字数的には

23*1000*1000/2*30/33文字=10454545文字になります。

原稿用紙を400字詰めとすると(改行を抜かした文字だけで)10454545/400枚=


原稿用紙2万6136枚


ということになるかと思います。


注意!これはあくまでも文章量の概算です!かなりの誤差はあると思います。しかし2万枚、3万枚はありそうですね。

id:itarumurayama

丁寧な試算ありがとうございます。

2005/11/21 20:51:38
id:aki73ix No.3

aki73ix回答回数5224ベストアンサー獲得回数272005/11/21 19:03:16

ポイント20pt

テキストのみのページであっても、タグがありますから若干実際のサイズよりも小さくなります


例えば、上記のページですが

ソースは31kありますが、テキストにすると

20.2kになります、全て全角にしてみても

20kなのでこれを文字数に直すと10000文字です


さらに、インデントの空白があるので、それを取り除くと18.4kになりますから

およそ9200文字です

つまり、10バイト辺り3文字の情報が含まれてるわけです

およそ、23Mにこれをかけると700万文字

つまり原稿用紙17500枚分に相当します


いくつかのページで計算してみると全体のテキスト量も概算できるわけです

http://www.vector.co.jp/soft/dl/win95/util/se373689.html

文字変換(Windows95/98/Me / ユーティリティ)

半角を全角に変換するソフト


例えば、 12ああTEST(10byte) -> 12ああTEST(16byte/8文字)と計算できます

テキスト抽出ははてナビのクリップ機能を使いました

id:itarumurayama

ありがとうございます。

掲示板の過去ログとかもあるので、全部自分で執筆した訳ではないのですが、我ながらビックリ。

2005/11/21 20:52:59
id:kaminoitte No.4

kaminoitte回答回数254ベストアンサー獲得回数02005/11/21 19:03:47

すみません。再回答です。

自分でもダウンロードして試してみましたが

ファイルごとのドラッグはだめみたいですね。


こういうのを探したのでこれではどうでしょうか?

必要なランタイムが自分のPCには入ってなかったので試してないのですが、説明文の通りならできるはずです。

id:itarumurayama

再回答どうもです。

2005/11/21 20:53:22
id:Pocha No.5

Pocha回答回数109ベストアンサー獲得回数12005/11/21 19:39:40

ポイント20pt

http://www.yahoo.de/

Yahoo! Deutschland

 ヘッダ部やエレメントの分、2バイト文字/1バイト文字、改行改頁等の問題もありますが、オーダーを出したいだけなら、


23*1000*1000/2/400=28750


約3万ページです。

id:itarumurayama

ありがとうございます。

2005/11/21 20:53:41

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません