在庆祝人类基因组草案的科学里程碑二十多年之后,科学家
终于完成了这项工作。人类基因组的第一个完整、无间隙的测序结果已经发表,这一进展有望为关于健康以及我们这个物种独特之处的新见解铺平道路。到目前为止,大约有 8% 的人类基因组缺失,其中包括大量高度重复的序列,它们有时被称为“垃圾DNA”。但实际上,这些重复的部分被省略是因为对它们进行测序存在技术难度,而不是纯粹由于缺乏兴趣。对基因组进行测序就像是将一本书切成文本片段,然后尝试将它们再次拼凑在一起以重建这本书。和独特的文本片段相比,将包含很多常见或重复单词和短语的文本片段放置在正确的位置难度更大。新的“长读”测序技术可以一次性解码大块的DNA——足以捕捉许多重复——帮助克服了这一障碍。科学家能通过使用一种不寻常的细胞类型进一步简化这个谜题,这种细胞类型只包含从父亲那里继承的 DNA(人体内大多数细胞都包含两个基因组,这两个基因组分别来自父母)。这两项进步让我们能解码构成人类基因组的超过 30 亿个字母。
研究报告发表在《科学》期刊上。