top of page

完全線形符号

​概要

本研究は,生物の遺伝を司る物質であるDNAの新しいコード化技法を提案するとともに,有効な応用例を示しました.

 DNAには4種類の塩基,A:アデニン, C:シトシン, G:グアニン, T:チミンが用いられています.遺伝子は4種類の塩基の文字列として表現されます.

 

従来DNAを計算機で扱う場合,2bit固定長で, Aを00, Cを01,Gを10,Tを11として表現してきました.これを私はガロア拡大体GF(4)の元として塩基を表現する事を提案しました.

 

この表現方法により,DNA配列の解析に符号理論の知識を直接適用する事が可能となります.

 

論文ではその応用例として,符号理論における完全ハミング符号の誤り訂正を利用することにより類似DNA配列の探索時の計算量を約70%削減できる事を証明しました.

​論文紹介

Perfect Hamming code with a hash table for faster genome mapping

bottom of page