手机版
您的当前位置: 早操健康网 > 疾病 > 疾病新闻 > 【数百万人类基因组进行测序的这个领域的未来发展轨迹】人类基因组测序

【数百万人类基因组进行测序的这个领域的未来发展轨迹】人类基因组测序

来源:疾病新闻 时间:2019-07-20 17:18:00 点击:

由麻省理工学院和哈佛大学Broad研究所的研究人员领导的一个国际小组汇编并分析了迄今为止最大的人类蛋白质编码序列集合。Exome Aggregation Consortium(ExAC)成员的研究人员自2014年以来一直向研究界公开提供这些原始数据。该团队对来自世界各地的外显子组的最新分析 -部分在2015年的基因组学会议上提出 -该团队强调了大型数据集的实用性,以识别罕见的致病变异和对突变变异特别敏感的基因,包括功能丧失。

这项工作的重要部分是大量的[外显子], Stephen Scherer在加拿大多伦多医院和加拿大多伦多大学研究人类基因组的变异,但没有参与这项工作,科学家在一封电子邮件中。这是研究和临床社区可以以不同方式使用的良好数据。

西雅图华盛顿大学的Jay Shendure 说:这是[人类]基因组中任何实质性部分中最深的一个人。 他写了一篇相关的观点,但没有参与这项研究。

蛋白质编码序列 - 占整个人类基因组的不到2% - 是我们最了解的基因组部分,它们也是发现绝大多数严重致病突变的基因组区域,研究合着者布罗德研究所的丹尼尔麦克阿瑟在新闻发布会上对记者说。

麦克阿瑟及其同事汇集了来自二十多个疾病特定项目的研究人员提供的外显子组数据,从60,706个个体中创建了超过740万个遗传变异列表 - 比以前的任何外显子组数据库大10倍。根据麦克阿瑟的说法,这些信息占据了几乎1PB的存储空间(总计有4,000台笔记本电脑的原始数据)。

这些项目中有许多是直接研究常见的人类疾病,但取得了不同程度的成功,这表明数据可以用于其预期目的之外,Shendure告诉The Scientist。

由MacArthur实验室研究员Monkol Lek领导的研究小组发现,平均而言,基因组中每八个碱基对间隔的变异体特别容易发生变异。研究人员经常一遍又一遍地捕获相同的变体,这表明数据集足够大,这些区域内的变体已经变得饱和。虽然数据集不足以看到每个可能的遗传变异,但在这些特定的地点,团队能够捕获所有可能的同义变体中的63%。Shendure说:我发现这令人兴奋,因为它预测了在我们对数百万人类基因组进行测序的这个领域的未来发展轨迹中存在的东西。

大量外显子组允许研究人员发现192个等位基因变异中的183个先前被归类为致病性(但在ExAC数据库中以相对较高的频率发现)可能是良性的。

该研究小组还发现了3,230个基因,即使该基因的第二个拷贝是野生型,也特别不能突变。这些基因中有72%没有与任何已知疾病相关联,这表明来自表面健康个体的数据能够揭示突变时可能导致疾病的基因。

ExAC已经从几个不同的对照和常见疾病队列项目中采集了外显子组序列样本,但通过重新分析和回忆整个数据集的变体,它产生了一致且准确的罕见变异频率, 研究遗传学的Roddy Walsh伦敦帝国理工学院继承了心脏病,并使用了ExAC数据,在给The Scientist的一封电子邮件中写道。

另外,伦敦帝国理工学院和英国牛津大学的Walsh及其同事已经证明了积累的遗传信息用于评估多基因遗传性疾病相关基因的效用。研究小组将ExAC数据与7,855例临床心肌病患者进行了比较,发现许多假定的心肌病相关基因不太可能导致该疾病。沃尔什写道:通过关注已证实的基因,我们希望通过减少不确定甚至假阳性结果的数量来改善心肌病的临床基因检测。 该团队的成果今天出现在医学遗传学中。

在第三份出版物中,来自纽约市西奈山伊坎医学院的Douglas Ruderfer及其同事分析了ExAC数据中发现的拷贝数变异(CNV)的模式和频率。与单核苷酸变化或插入缺失(插入或缺失)相比,CNV,长度至少1000个碱基对的序列的增加或减少更罕见且难以检测。研究人员今天在 自然遗传学杂志上报告说,大约70%的外显子组包含至少一种罕见的CNV ; 个体外显子组平均含有0.81个缺失和1.75个重复基因。

ExAc数据集目前代表非洲/非裔美国人,拉丁裔,东亚人,欧洲人和东南亚人的血统。对于麦克阿瑟来说,未来的一个目标是填补代表性不足人群的空白,包括来自中东和非洲部分地区的人口。

该项目还旨在发布一个新的外显子组数据集,其数量约为今年10月美国人类遗传学会会议的人数的两倍,Lek在给The Scientist的一封电子邮件中写道。

栏目分类

早操健康网 www.zaocao.com.cn

Copyright © 2002-2018 . 早操健康网 版权所有 湘ICP备12008529号-1

Top