topimg_news42_01

人間が扱うデジタルデータは、指数関数的に増加し続けている。ハードディスクやSSDの大容量化、低コスト化は日々行われているし、さらに現在とは異なる方式でデータを記録するための技術も研究開発が進む。次世代記憶媒体としては、ホログラフィ(3次元像を記録する技術)を応用した光ディスク、電子のスピンを利用した半導体素子などが挙げられるが、このほかにDNAを使った研究も行われている。

DNAが膨大なデータを記録できることはよく知られている。DNAには、アデニン(A)、グアニン(G)、シトシン(C)、チミン(T)という4種類の塩基が含まれて、この配列によって遺伝子が表現されている。これは、1つの塩基対で2ビットのデータを表しているともいえるわけだ※。人間の全遺伝子情報、ヒトゲノムは約30億個の塩基対で構成されているが、仮に1対の塩基で2ビットのデータを記録できるとすると、60億ビットで、約750メガバイト(1バイトは8ビット)。人間の細胞1つの核にこれだけのデータが収められていることになる。

DNAを使ってデータを記録する研究は世界中で行われているが、大きな問題点があった。生きた細胞を使う場合、細胞が死ぬとデータが失われること。そして、細胞分裂で遺伝子が複製される際に、遺伝子の変異が起こり、データが書き換わってしまうことだ。

ハーバード大学のGeorge Church博士らは、生きた細胞を使わないDNAへのデータ記録技術を開発した。この技術では、化学的に合成されたDNAをインクジェットプリンターで小さなガラス基板に出力する。データの読み出しには、DNAシーケンサー(DNA塩基配列の自動読み取り装置)を使う。記録されるデータは何千回と複製され、複製ミスをコンピュータで検出することでデータの誤り訂正を行うようになっている。

遺伝学の教科書をデジタル化して(データサイズは5.27メガビット)、DNAで記録。記録されたデータを読み出したところ、データのエラー発生率は100万ビット中2件だったという。このエラー発生率はハードディスクよりもはるかに低い。このデータを記録するのに要したDNAの重量は、1ピコグラム(=10億分の1ミリグラム)にも満たない。

現在のところ、DNAの読み書きには高価な研究用機材が必要だが、DNAシーケンサーの高性能化、低コスト化は急速に進んでおり、1人のヒトゲノムを1000ドル以下で解析できるようになりつつある。DNA記録技術が実用化されるのは、それほど遠くないかもしれない。

(文/山路達也)

注) ※1ビットで表せる情報は、0か1の2種類。2ビットになると、00、01、10、11の4種類の情報を表せる

記事提供:テレスコープマガジン