血の繋がっている、祖父、父、兄、弟のY染色体については同一であるという話を聞き、簡単なスクリプトを付くって本当か確かめてみたいのですが、どこかにzipファイルなどで公開されていますでしょうか?


また、最近、DNAシーケンサーが安くなったと聞きますが、私の全ゲノム情報を調べる場合、どこで、いくらくらいでやってもらえますか?

回答の条件
  • URL必須
  • 1人1回まで
  • 13歳以上
  • 登録:2017/06/26 17:16:34
  • 終了:2017/07/26 17:20:05

回答(0件)

回答はまだありません

  • id:NAPORIN
    スクリプト以前の問題では。
    本人の性別がよくわからないけど、父や祖父から性決定染色体のうちのXのほうが受け継がれればあなたは女性なわけですし、
    何らかの事故でどちらも受け継がれなければまあ不受胎か流産ですよね。
     
    ただ、突然変異とかXXYとかありますけどね。
  • id:NAPORIN
    「遺伝子組換えされていないあなた」かどうかはだれにもわからない。
  • id:jwrekitan
    アメリカでは999ドル(約10万円)で情報提供するところが表れたそうです。
    http://jp.techcrunch.com/2016/03/09/20160308you-can-now-pull-up-your-entire-genome-for-under-1000-on-your-smartphone/

    ただし、総データ量という観点から考えますと、

    http://www.megabank.tohoku.ac.jp/news/michi/5831
    >>
    塩基一つが1文字だとすると60億塩基の情報は新聞紙500万枚に相当します。
    <<

    仮に1文字ではなく1バイトで収めると、1人分のデータは6Tになります。
    スマホの転送速度が仮に10MB/sですと、6T ÷ 10M = 600000(秒)
    という転送時間が求められます。1人分のデータをダウンロードするのに
    24時間最大転送速度でフル稼働しても約7日かかる計算です。
    もちろんそんな大容量のデータをスマホには保存しておけませんし、
    最大転送速度が常に出る事なんて期待できませんから、
    かなり努力しても入手に1ヶ月くらいかかると思った方がいいと思います
    (1人分のデータです)。

    また、このデータをローカルのPCに保存するとして、
    1人につき10TクラスのHDD(費用は5万円程度~)1台を
    新規に用意しなければならないでしょう。

    あとは上記に比較する人数分を掛けるとおおよその金額が求められます。
    作業内容は単純なループと比較だけですので数行のプログラムで済むでしょう。
    (データのフォーマットが分かるまでは作成できませんが)

    ソースがあまりにも単純すぎて公開する意味が無い、
    扱うデータが無駄に大きく利用者がいるとも思えない、
    以上2つの理由から仮にそうしたスクリプトがあったとしても
    公開などされていないと思います。
  • id:j4mika
    コメントありがとうございます!


    なぽりんさま
    父、祖父、息子 例えば、この三人のY染色体情報のdiffを取れば良いだけかと思うのですが違いますかね?



    椶櫚さま
    ありがとうございます。海外サイトですが10万円ですか。国際プロジェクトの頃と比べだいぶ安くなりましたね。できればあと一桁やすくなれば気軽ですね。ただ、英語は正直よく分からないですし漠然とした不安があり、国内企業でもあればと思っています。ただ、それでも実際にこの価格でこのサービスされているという情報はともても貴重な情報です。ありがとうございます!感謝です。

    なお、データ量については、人の染色体はATGCの4進数のデジタルデータですし、1文字1バイトで計算すると、600,000,000バイトかと思います。未圧縮でもCD-ROMに入りそうですし、ヒト同士では99.9%程度は同一らしいですし1枚のCD-R(700MB)に数百人は余裕で入るかと思っています。

    スクリプトについてはY染色体の情報だけであれば、普段扱っているデータ量と比べると小さく、全てPCのメモリに載せて操作できる程度かと思っています。このくらいなら自作のDiffソフトでやってみたいと思っています。

    当方、生物は専攻していませんでしたのでもし間違いがあれば指摘頂けると幸いです。
  • id:jwrekitan
    ああ、すみません、なんか思いっきり桁間違ってますね。
    KMGTなので6Gですか(600,000,000は6億なのでこれも桁が1つ少ないようです)。
    CO-ROMだと8枚程度でしょうか。10MB/sだと600秒、あれそんなものか^^;
  • id:j4mika
    いえいえ、こちらは十年以上盛大に勘違いしていました。無圧縮でCD-R1枚だと思い込んでいました。指摘頂きありがとうございます。私の中では10年以上ゲノムの容量はCD1枚だと思っていたため、1コメントで4倍に増え、内心、衝撃を受けています。

    容量ですが、60億ですが半分は同じデータですので30億になるようです。
    通常英数字1文字1バイトですので、3GB(CD、4枚ちょっと)という所でしょうか。

    一応、私の勘違いについてハッキリしましたので書いておきますと、
    1バイトは8ビット、ATGCの文字1つは2ビットで物理的には記録できるため、
    3,000,000,000のATGCの文字は750MBになるようです。
    二進数でそのまま記録すれば750MBのCD-Rがあれば理論上は1枚に入るようです。

    時々男のY染色体は神代から代々引き継がれるという話を聞き、
    Y染色体だけなら気軽に扱えそうな容量ですし、実際どうなのか調べてみたく思っています。
  • id:jwrekitan
    半分は同じデータというか、理論上同じデータであるはずのものを
    実際に同じであるかどうか確かめたい、という趣旨だったのでは?w

    とはいえ、必用なのはY染色体だけであるという事ならば確かに半分の30億になりますし、
    4種類の塩基配列を分類するには2ビットで事足りるから
    1バイトに4桁入るというのはその通りなので、
    確かにCD-R1枚に収めようとすれば入らないこともないようですけれども。
  • id:j4mika
    女性はXXですが男性のみXYとなり、このYは父からしか引き継がれないという話を聞きました。
    その為、男系では先祖代々、どの程度完璧にコピーされ続けているのか気になっています。
    http://y-arisa.sakura.ne.jp/link/yamadaka/seimei-renzoku/Germcell-1/Human-ch.jpg
    もっと言えば、私と他の人のY染色体の違いも気になっています。
  • id:NAPORIN
    個人のを調べるとなると、体細胞は長く生きているうちに輸血だ天然キメラだとなる可能性が排除できないわけで、おじいちゃんの生まれたときの体細胞とか保存してないわけで。技術上の誤謬や誤解を恐れないとしてもそんな神のいたずらの痕跡を探した結果、法律上はともかく心情上の親子関係を否定されるのもかわいそうなので、倫理上なんとかかんとかで確か規制されていたかとおもいますし(遺伝子治療や不妊治療といったきちんとした利用目的があるものでさえ・・・)。結論からいいますと生物学の研究室(しかも外国)でやるならともかく、日本で個人がやるのはやめたほうがいいとおもいます。
    やんごとない方(男系)を担ぐ国では、46組のうちの1組でしかない性決定染色体の継代性をものすごく心情上の依存先にしてる人がたくさんいるんで、公表したりすると藪蛇(政治宗教闘争の火種?)になりそうな気がします。
    女性はまあそういうのはあんまり気にしないんですけどね。
  • id:NAPORIN
    https://web.stanford.edu/~philr/Bachman/DNABachman3.html には社会的影響について
    「リスク。 家族研究のためにテストされたマーカーは「ジャンク」DNAであり、物理的または医学的特性とは無関係であると考えられています。これは、テスト会社のプライバシー保証が何らかの形で破られた場合、ほとんど危険がないことを意味します。マーカ値の同じセットは、多くの関連する、または無関係な(系統的な時間枠内の)個体によって共有され得るため、試験されたマーカーは個体を一意的に同定するために使用されない。したがって、結果は、民事訴訟や刑事手続には有用ではない。y染色体検査の潜在的リスクは、費用が含まれていない限り、単一の潜在的リスクであり、参加者は、他の誰かと生物学的に関連していないことが予想される可能性があります。時には長い間確立され受け入れられている家系図が間違っていることが判明します。不正犯罪率は、時間、場所、経済的、社会的地位によって異なりますが、常に発生しています。養子縁組も常に発生しており、その知識は後世に失われる可能性があり、特に重要な記録が広まる前に失われる可能性があります。したがって、予期しない不一致が起こる可能性があり、特に最近の過去に「非父性的な出来事」が起きた場合には、このような不安定さや外傷性が見られることがあります。」
    と書いてあります。(グーグル日本語翻訳を使用)最初の1文にあるのは「敢えてジャンクDNA(機能が発見されていない部分)しか見ない。重要な機能を持つ遺伝子までは見ない。つまり、ガンのなりやすさなどといった遺伝子疾患などの診断とかにつかえないように調べている。このことが遺伝子父系調査が社会的に許されている一つの条件である」という意味でしょう。その他の部分にもその他のリスクが説明されています。
  • id:j4mika
    ちょっとその法律を探そうとググったところ、逆に、5年前に自分のゲノム情報を年齢や職業を明記して実名アップしている人を見つけました。http://gigazine.net/news/20120731-personal-genom/5年前から今もアップが継続していますし、言語を限定せず見つけることができれば親子で公開している人がいても良いという気がしてきました。日本語ではとりあえず見つからなかったですが、もう一人男性を見つければ、やる気になればDiffは取れそうな気がしています。この男性と私は遺伝上親戚でしょうし。
    因みに、私は男ですが気にしませんよ。親族に里親がいたり再婚した人がいるからかも知れませんが実際の繋がりが大切に思います。ま、気にする人はしますが今の時代離婚再婚が当たり前の時代ですしね。
    また、実際にはどうなのか分かりませんが、普通に計算すると僅か10世代でDNAの特徴は1/1000、20世代で1/1000000と10世代毎に約3桁ずつ薄まります。理論的にも気にする事の意味が無いかも知れません。逆に、日本や世界中の男性が同じY染色体であれば寧ろ今以上に同族意識が芽生えるかも知れません。
  • id:NAPORIN
     もう何をいっても実行なさるつもりかもしれませんね。
     
    たとえば、今、木の絵を描いて、タイムカプセルに埋める。100年後、AIの解析にかけて見たらこの絵は〇〇発達障害だとか、しかも〇か月以内に女に振られたなどまでわかる。これはまあありかもしれません。100年後ならおそらく書いた人も死んでいますし。
     
     ただ、今の世の中では「バレないとおもってコンビニのアルバイト中にアイスクリームのケースに土足で潜って写真をとって公開したら、紆余曲折あってバイトは首、大学除籍、就職もまともにできなくなって、つぶれたコンビニから損害賠償をうけた」ということが実際に起こっている世の中ですよ、とだけ。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません