人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

【テキストデータHPのボリューム】
単純な質問です。
テキストデータオンリーのホームページで、容量が23メガバイトある場合、
大体「400字詰め原稿用紙にして何枚」の文章量に相当するのでしょうか?
あるいは「A4サイズの紙に印刷して何ページ相当」という回答でもOKです。

自分のホームページ
http://www.geocities.co.jp/HeartLand-Keyaki/7891/
が23メガバイトあるのですが、文章量にしてどれ位のボリュームが
あるのか、自分でも把握できないので・・・
(ネットサーファーがイチから自分のページを読み始めた場合、
延べ何時間掛かるのか、把握したい)

●質問者: itarumurayama
●カテゴリ:コンピュータ 科学・統計資料
✍キーワード:オンリー サイズ サーファー テキスト データ
○ 状態 :終了
└ 回答数 : 5/5件

▽最新の回答へ

1 ● kaminoitte
●20ポイント

http://www.forest.impress.co.jp/article/1999/10/29/okiniiri.html

????m - ?y????????C??????z???????v?Z?u???????J?E???g?c?[?? StrCount?vv1.10

こういうソフトを使ったらどうでしょうか?

自分のPCにバックアップしてあるサイトデータをドラッグ&ドロップするだけでいいみたいですよ。

http://www.vector.co.jp/soft/win95/util/se103220.html

文字数カウントツール(Windows95/98/Me / ユーティリティ)

最新のはこちら

◎質問者からの返答

なるほどです。

ありがとうございます・・・と言いたいところですが、ページ数が(多分)1,000ページ近くあるので、いちいちページ毎にドラッグ&ドロップする手間が大変かな?

それともフォルダまるごと、まとめてドラッグ&ドロップできるのかな?


2 ● nitscape
●20ポイント

http://www.geocities.co.jp/HeartLand-Keyaki/7891/preftale/k.html

?s???{??????????b?i??E?j

23GB=23*1000*1000Bytes

とすると、文字数は全角文字で23*1000*1000/2文字になります。


ホームページ内の文章を見てみると(少なくとも私が見たページは)

------

また修学旅行で先生方が京都の寺社ばかり行かせるのがいけない。

生徒はだから「京都=カビ臭い街」とかステレオタイプに信じ込むのです。

だから京都の修学旅行は生徒にとってつまらなくなり、その影響か、京都への修学旅行はジリ貧です。

高校生なら、たとえば京大とか同志社・立命館のキャンパスや研究所を見せて、受験生でもある生徒に

「大学とはこういうものか」と見せるのも手ではないでしょうか?

------

という感じでした。


このことから文章を、行頭に全角スペース2つ、1行平均全角30文字、シフトJISと仮定すると、文字数30文字に対して

改行(2バイト)+全角スペース2文字がかかりますから、実際の文章の割合は30/33になります。


つまり文字数的には

23*1000*1000/2*30/33文字=10454545文字になります。

原稿用紙を400字詰めとすると(改行を抜かした文字だけで)10454545/400枚=


原稿用紙2万6136枚


ということになるかと思います。


注意!これはあくまでも文章量の概算です!かなりの誤差はあると思います。しかし2万枚、3万枚はありそうですね。

◎質問者からの返答

丁寧な試算ありがとうございます。


3 ● aki73ix
●20ポイント

http://www.geocities.co.jp/HeartLand-Keyaki/7891/preftale/w.html

都道府県よもやま話(西日本)

テキストのみのページであっても、タグがありますから若干実際のサイズよりも小さくなります


例えば、上記のページですが

ソースは31kありますが、テキストにすると

20.2kになります、全て全角にしてみても

20kなのでこれを文字数に直すと10000文字です


さらに、インデントの空白があるので、それを取り除くと18.4kになりますから

およそ9200文字です

つまり、10バイト辺り3文字の情報が含まれてるわけです

およそ、23Mにこれをかけると700万文字

つまり原稿用紙17500枚分に相当します


いくつかのページで計算してみると全体のテキスト量も概算できるわけです

http://www.vector.co.jp/soft/dl/win95/util/se373689.html

文字変換(Windows95/98/Me / ユーティリティ)

半角を全角に変換するソフト


例えば、 12ああTEST(10byte) -> 12ああTEST(16byte/8文字)と計算できます

http://beta.g.hatena.ne.jp/aki73ix/

betaグループ

テキスト抽出ははてナビのクリップ機能を使いました

◎質問者からの返答

ありがとうございます。

掲示板の過去ログとかもあるので、全部自分で執筆した訳ではないのですが、我ながらビックリ。


4 ● kaminoitte
●0ポイント

http://hp.vector.co.jp/authors/VA014370/win_soft/hpcount/hpcount...

すみません。再回答です。

自分でもダウンロードして試してみましたが

ファイルごとのドラッグはだめみたいですね。


こういうのを探したのでこれではどうでしょうか?

必要なランタイムが自分のPCには入ってなかったので試してないのですが、説明文の通りならできるはずです。

◎質問者からの返答

再回答どうもです。


5 ● Pocha
●20ポイント

http://www.yahoo.de/

Yahoo! Deutschland

ヘッダ部やエレメントの分、2バイト文字/1バイト文字、改行改頁等の問題もありますが、オーダーを出したいだけなら、


23*1000*1000/2/400=28750


約3万ページです。

◎質問者からの返答

ありがとうございます。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ