topimg_news62_01

巨大データを保存するために、いま有望視されているのがDNAを用いた記録技術だ。
2012年には、ハーバード大学のGeorge Church博士らが、生きた細胞を使わずにDNAにデータを記録する技術を開発している。ハーバード大学の研究チームは、データをDNAの4つの塩基(A:アデニン、G:グアニン、C:シトシン、T:チミン)で表し、そのDNAを化学的に合成、インクジェット技術を使ってガラス基板に打ち出した。データの読み出しには、DNAシーケンサー(DNA塩基配列の自動読み取り装置)で行う。データサイズが5.27メガビットのテキストデータ(遺伝学の教科書)をDNAに変換して記録し、読み出したところ、データのエラー発生率は100万ビット中2件だった。

2013年1月に、EBI(欧州バイオインフォマティクス研究所)のNick Goldman博士らも、ハーバード大学の研究チームとほぼ同じ容量のデータの記録、読み出しに成功した。EBIのチームが用いたデータは、マーティン・ルーサー・キング・ジュニア牧師の演説から抜粋した26秒間のオーディオクリップや、研究所の写真などで、データの復元率は100%だった。

ハーバード大学もEBIも、DNAの合成や読み出しにはほとんど同じ方法を用いている。異なるのは、データをどのようにしてDNAの塩基で表現するかという、符号化方式だ。ハーバード大学のチームは、アデニンもしくはシトシンなら「0」、グアニンかチミンなら「1」として1ビット(2進数で表現された1桁の数字)を表現した。これに対してEBIチームの手法は、4種類の塩基5つ分で、1バイト(8ビット。10進法で0~255の値を表現できる)を表現できるため、必要とされるDNAの量が少なくて済む。また、データは少しずつ重複するように符号化されているため、一部の塩基が間違っていても誤りが修正されるようになっている。こうした仕組みによって、データの復元率100%を達成することが可能になった。

DNAは冷暗所に保管されてさえいれば、1000年単位でデータを保つことができ、保存する上での電力消費もない。1グラムのDNAで、2ペタバイトのデータを記録できることになり、これは300万枚のCDの情報量に相当する。

現在のところ、1メガバイトのデータを記録するための費用は12400ドル、読み出しは220ドルと高価だ。しかし、今後10年でコストは100分の1以下になることが予想されており、50年以上保管するデータであれば十分な費用効果が見込めるようになると、研究チームは考えている。

(文/山路達也)

記事提供:テレスコープマガジン