700人ほどの名前一覧のエクセルファイル)があるのですが、男女区別が付きません。名前から男女を(アバウトで結構なので)判別するフリーソフトのようなものはないですよね?その他抽出方法などありましたら教えてください。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/06/04 16:37:02
  • 終了:--

回答(1件)

id:minakaji No.1

minakaji回答回数31ベストアンサー獲得回数02004/06/04 16:55:57

ポイント40pt

URLはダミーです。csvファイルに書き出して、正規表現が使えるエディターで”[夫雄],”にマッチしたら男、”子,”にマッチしたら女、という風にアバウトルールを決めたらどうでしょうか。だいぶ推測できそうな感じがします。他にも平仮名で終わっていたら女とか。

Emacsやviのように正規表現にマッチしたら変換できるともっと楽ですね。viだと”%s/¥([雄夫]¥),,/¥1,男性,/”とかいうコマンドになるんでしょうか。名前の次のカラムが空で、そこに性別を入れる、という感じです。

id:tamanacchi

ありがとうございます。ちょっと難しそうですね。「子」や「美」などを女性として抽出してみたんですが、絞りきれなそうでした。

2004/06/04 17:19:20
  • id:garyo
    「女の子の名前辞書」計画

    「女の子の名前辞書」計画
    収録名前数 79,837種類 …だそうです。
    これから名前データを取り出してACCESSにインポートして
    EXCELのデータもACCESSにインポートして名前で関連付けしてみるといいのでは。ただしWEBのデータを取り出すのが大変そうです。
    http://www.dd.iij4u.or.jp/~ume20/f_name/
  • id:cx20
    Re:「女の子の名前辞書」計画

    > ただしWEBのデータを取り出すのが大変そうです。

    ダウンロードが可能なようですね。

    女の子の名前全リストをダウンロードする (f_name20040531.lzh 340,032 bytes)
    http://www.dd.iij4u.or.jp/~ume20/f_name/

    タブ区切りのテキストのようです。
  • id:garyo
    Re(2):「女の子の名前辞書」計画

    >ダウンロードが可能なようですね。
    なるほど。これならデータベースと組み合わせれば女性のみ抽出できそうですね。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません