bbin宝盈

bbin宝盈基因遗传病基因检测组织排名,三甲医院的选择

基因检测就找bbin宝盈基因!

热门搜索
  • 癫痫
  • 精神分裂症
  • 鱼鳞病
  • 白癜风
  • 唇腭裂
  • 多指并指
  • 特发性震颤
  • 白化病
  • 色素失禁症
  • 狐臭
  • 斜视
  • 视网膜色素变性
  • 脊髓小脑萎缩
  • 软骨发育不全
  • 血友病

客服电话

4001601189

在线咨询

CONSULTATION

一键分享

CLICK SHARING

返回顶部

BACK TO TOP

分享基因科技,实现人人健康!
×
查病因,阻遗传,哪里干?bbin宝盈基因准确有效服务好! 靶向用药怎么搞,bbin宝盈基因测基因,优化疗效 风险基因哪里测,bbin宝盈基因
当前位置:    致电4001601189! > 基因课堂 > 基因价值 > 行业前景 >

【bbin宝盈基因检测】如何利用基因检测在试管婴儿中筛选胚胎

【bbin宝盈基因检测】如何利用基因检测在试管婴儿中筛选胚胎 http://pmc.ncbi.nlm.nih.gov/articles/PMC8938270/ bbin宝盈基因导读 体外受精胚胎的植入前遗传学检测 (PGT) 是阻断遗传、降低遗传病在人群和家族中

bbin宝盈基因检测】如何利用基因检测在试管婴儿中筛选胚胎


 

bbin宝盈基因导读

体外受精胚胎的植入前遗传学检测 (PGT) 是阻断遗传、降低遗传病在人群和家族中遗传中的一个有效方法;然而,现在仍缺乏更全面的胚胎遗传学评估,无法将常见变异和罕见变异的影响结合起来。在遗传病的阻断研究中,研究组织结合分子和统计学技术,可靠地推断了 110 个胚胎的基因组序列,并模拟了 12 种常见疾病的易感性。分析发现,在来自第 5 天胚胎活检的病例中,与多基因风险评分相关的位点的基因型准确率为 99.0% 至 99.4%,而在来自第 3 天胚胎活检的病例中,基因型准确率为 97.2% 至 99.1%。将罕见变异与多基因风险评分 (PRS) 相结合会放大同胞胚胎之间的预测差异。例如,对于携带致病性BRCA1变异的夫妇,阻断遗传课题组预测,当结合 BRCA1 或 PRS 时,兄弟姐妹之间的比值比 (OR) 差异为 15 倍,而单独使用BRCA1或 PRS时,差异为 4.5 倍或 3 倍。这一研究结果可能为基于基因组的 PGT 在临床实践中的实用性和实施​​的讨论给予参考。

关键词:预测医学、诊断标记、基因组学


结合亲本基因组的全基因组测序和植入前胚胎的基因分型的计算方法可以准确预测胚胎的遗传基因组并计算多基因风险评分。

以下是详细介绍

PGT 可以在植入前对胚胎进行家族特异性遗传疾病分析。虽然 PGT 现在用于预防罕见的孟德尔遗传疾病1、2 ,但有几个团队已经探索将检测范围扩大到常见疾病,如心脏病癌症3-6。这些方法依赖于使用 PRS 7 ,它将数十、数百或数千种遗传变异的影响结合成一个预测因子。然而,由于单细胞或少细胞胚胎活检中 DNA 的数量和质量有限,全面分析胚胎基因组的尝试成本高昂且耗时8-10 ,存在与等位基因丢失相关的不准确性,需要远亲2或依赖于填补,这妨碍了检测BRCA1 11等基因中罕见的有害变异。为了克服这些限制,阻断遗传课题组扩展了全基因组重建 (WGR) 策略1 ,该策略使用亲本基因组测序和胚胎基因分型来预测胚胎的遗传基因组序列。在本文中,阻断遗传课题组将这种方法应用于10对夫妇的110个胚胎,并计算了12种疾病的多基因预测因子,包括癌症、心脏代谢疾病和自身免疫性疾病(图1)。阻断遗传课题组将这些胚胎的重建基因组和多基因预测结果与相应出生儿童组织样本生成的预测结​​果进行了比较。

WGR和方法

图 1. WGR 和方法。

a、在这个实验中,遗传病阻断课题组分析了10对夫妇的110个胚胎基因组,并与出生婴儿的基因组序列进行比较。根据出生婴儿样本和10个相应的胚胎基因序列结果分析计算了12个PRS模型,并比较了它们的一致性。b 、 WGR采用未来父母的全基因组测序(WGS)和同胞胚胎的单核苷酸多态性(SNP)微阵列基因分型。每个SNP的等位基因测量结果都根据a中所示的亲本来源单倍型进行颜色编码。分子和统计/基于群体的技术相结合,对父母的染色体进行分期,推断每个胚胎的减数分裂重组位置,并纠正在测试单细胞或少细胞胚胎活检过程中引入的错误(方法)。重建的胚胎全基因组用于顺利获得计算PRS并推断对疾病风险影响较大的罕见变异的遗传来预测常见疾病风险。c、顺利获得将WGR基因型与出生婴儿的DNA进行比较,结果显示,在用于多基因预测的位点上,第5天胚胎的基因型准确率为99.0%至99.4%,在第3天胚胎的基因型准确率为97.2%至99.1%。案例1仅包含第3天胚胎,案例2同时包含第3天和第5天胚胎。所有其他案例仅包含第5天胚胎。统计数据根据出生婴儿的基因型(杂合子或纯合子)细分。

结果

本研究中使用的样本来自之前接受过体外受精 (IVF) 且在组织审查委员会 (IRB) 方案下进行过临床 PGT(扩展数据图1 )的夫妇(方法)。阻断遗传课题组从 10 名已有 PGT 结果的出生儿童身上获取了 DNA。非整倍体临床 PGT(PGT-A)显示,110 个胚胎中有 68 个为整倍体,110 个胚胎中有 42 个有一个或多个非整倍体染色体(扩展数据图1和扩展数据图2)。阻断遗传课题组顺利获得对父母双方进行高覆盖率基因组测序和对同胞胚胎进行阵列测量,实现了胚胎的 WGR(方法和补充说明1)。阻断遗传课题组结合使用分子和统计学方法,将亲本变异链接到与单个整倍体染色体相对应的“单倍型”中,确定每个胚胎的减数分裂重组位点,并组装每个重组位点之间的相关单倍型片段,以近似整个遗传的胚胎基因组1。

如何用胚胎进行全基因组分析

扩展数据图 1. 进行的 PGT 检测的摘要。

共计29名个体在多种测序平台上进行了测序。胚胎活检样本的PGT检测由使用HumanCytoSNP-12 BeadChip芯片进行,样本量从3到33个胚胎不等。在父母和出生婴儿中,对高置信度基因型检出的基因组位点的覆盖率和准确性进行了评估。

扩展数据图 2. 预测胚胎的非整倍体和基因型并与出生的孩子进行比较。

 

将每个胚胎染色体微阵列位置的基因型预测结果与出生婴儿全基因组测序 (WGS) 测得的基因型进行比较。预测结果基于 SNP 阵列和父母支持数据。

阻断遗传课题组顺利获得将基因型预测与出生儿童的实际基因型进行比较,评估了WGR的准确性。阻断遗传课题组预测的胚胎中的基因位点平均为580万个位点,位点数量从540万到640万个不等(图1、扩展数据图1和图2)。与出生儿童相比,全基因组预测准确率范围从第3天胚胎活检的96.3%-98.4%到第5天胚胎活检的98.0%-98.9%。阻断遗传课题组推测,与处理和检测第5天滋养外胚层活检中的多个细胞相比,处理和检测第3天卵裂球活检中的单个细胞的性能会有所降低。在四对夫妇中,阻断遗传课题组还使用长片段 DNA(合成长读测序(转座酶联长读测序 (TELL-Seq);扩展数据图1和扩展数据图3)进行了改进形式的文库制备,以捕获罕见变异的阶段(定义为等位基因频率低于 0.1%),并增加了每个家庭中预测的罕见变异的数量和准确性(扩展数据图3)。

扩展数据图 3. 使用合成长读测序作为分阶段父母的方法,对个别罕见变异进行全基因组重建。

该方法已用于4例病例(病例ID 5、8、9和10)的亲本基因组。由于没有已出生的儿童可供比较,因此无法评估病例ID 10的准确度。等位基因频率<0.1%或未在gnomAD数据库中找到的变异被视为罕见变异。仅评估了Tell-Seq和无PCR全基因组测序方案中高可信度的变异(详见方法部分)。

阻断遗传课题组的方法能够预测胚胎基因组中的罕见和常见变异。为了探索结合这些变异对预测常见疾病风险的影响,阻断遗传课题组使用重建的胚胎基因组来计算 PRS。对于每个胚胎,阻断遗传课题组计算了一组已发表的多基因模型的风险评分,这些模型阻断遗传课题组在英国生物样本库 (UKB) 中基于特定人群进行了验证和校准(方法、扩展数据图4和补充表2)。使用从出生儿童 WGS 中调用的高置信度位置作为“真相”,阻断遗传课题组观察到在来自第 5 天滋养外胚层活检的病例中与多基因风险评分相关的位点的基因型准确率为 99.0–99.4%,在包含第 3 天卵裂球活检的周期中为 97.2–99.1%(扩展数据图1和图1)。阻断遗传课题组对每个胚胎的 PRS 进行了标准化以考虑群体结构,并使用逻辑回归模型将分数转换为预测的疾病几率(方法)。根据胚胎活检计算出的残余 PRS 与根据出生婴儿样本计算出的残余 PRS 之间的相关性为r 2  = 0.947(扩展数据图5)。阻断遗传课题组观察到不同家族的胚胎之间以及家族内同胞胚胎之间的多基因疾病风险存在差异(图2和扩展数据图6)。预测 OR 的最大变化出现在自身免疫性疾病中,这可能是因为 PRS 模型中具有高影响的变异比例较大。虽然白癜风和 1 型糖尿病显示出最高的 OR,但由于疾病相对罕见,这些病例同胞胚胎之间的绝对风险差异不到 10%。绝对风险的最大差异出现在更常见的心脏代谢疾病中。

扩展数据图 4. 英国生物银行成年人队列多基因风险评分的表现。

 

在英国生物银行中计算英国白人个体 PRS 评分每十分位数的经验优势比。

扩展数据图 5. 胚胎预测和出生孩子的多基因风险评分的相关性。

a,说明预测值与测量值(出生儿童)原始多基因风险评分之间的密切相关性,与预测值与测量值之间的基因型一致性一致。b ,预测值与测量值(源自原始多基因风险评分)z值之间的相关性(r 2 =0.947)。病例ID 5和9被排除在本分析之外,因为使用群体血统计算平均中心多基因风险的方法无法解释混合因素。

 

图 2. 家庭内部和家庭间乳腺癌易感性遗传风险的预测差异。

a,对具有乳腺癌家族史、BRCA1变异和多个胚胎(红色)的研究参与者进行多基因/单基因综合预测。13 个胚胎携带致病性BRCA1变异。阻断遗传课题组使用逻辑斯蒂模型对 UKB 中超过 22,000 名具有相关临床和遗传信息的个体进行拟合,以 PRS 和携带者状态作为独立变量,按照 Fahed 等人的方法预测了每个胚胎的患病几率。12蓝线表示BRCA1携带者的 OR 与 PRS 的关系,黑线表示非携带者的 OR。该方法解释了在BRCA1阳性状态下 PRS 效应的降低,这体现在两条线的斜率差异中。女性参与者的 PRS 显示为粉色虚线,男性参与者的 PRS 显示为绿色虚线(投射为女性风险进行比较)。同样,男性胚胎(三角形)也单独显示。b ,显示了十对夫妇及其胚胎的乳腺癌基因组风险。每个胚胎的预测遗传病风险(圆圈)以及500个模拟胚胎结果的小提琴图分布(详见方法部分),其中父母的平均PRS以蓝色虚线表示。致病性BRCA1变异的遗传(a)导致病例10的乳腺癌患病风险变异性增加,并呈现双峰分布。

扩展数据图 6. 另外 11 种情况预测疾病风险的变化。

 

a、预测的疾病相对风险。b 、预测的绝对疾病风险。如前所述,自身免疫性疾病(1 型糖尿病、白癜风)在预测疾病风险方面表现出更大的可变性。注意:携带APC风险等位基因rs1801155 的病例 ID 7 中胚胎的风险完全基于该等位基因。使用竞争风险法(Gail et al 1989)计算心房颤动、冠状动脉疾病、前列腺癌和 2 型糖尿病的绝对风险。年龄和种族特定的总体死亡率和疾病特定死亡率取自 CDC Wonder 数据库(1999-2019 年死亡根本原因)。使用 ELAI 软件确定的非洲/亚洲血统混合比例 >20% 的个体不在本分析考虑范围内。

接下来,阻断遗传课题组研究了在PGT(基因检测)中使用单基因和多基因变异的潜在影响。一对有乳腺癌家族史的夫妇接受了单基因疾病的PGT检测,阻断遗传课题组确认了母亲体内先前发现的致病性BRCA1变异。在该家族的20个整倍体胚胎中,阻断遗传课题组预测其中13个胚胎携带致病性BRCA1变异。在基因组重建后,阻断遗传课题组将携带致病性BRCA1或BRCA2变异的影响与多基因模型的影响相结合,使用Fahed等人12中描述的逻辑回归,计算出每个胚胎的单一风险预测值,并解释了BRCA1阳性状态下PRS效应大小的变化。阻断遗传课题组计算出,携带者中每标准差的PRS OR为1.3,非携带者中每标准差的PRS OR为1.6。不同胚胎的乳腺癌遗传风险预测值相差 15 倍,OR 范围从 0.35(非BRCA1携带者,低 PRS)到 5.35(BRCA1携带者,高 PRS)(图2a)。阻断遗传课题组探讨了单独使用 PRS(现在可用于多基因疾病的 PGT)是否会导致无意中转移高风险胚胎。在这种情况下,在 PRS 低于第 50 个百分位数的 14 个胚胎中,有 9 个携带致病性BRCA1变异。接下来,阻断遗传课题组比较了剩余夫妇的胚胎的乳腺癌风险预测值。除了那些具有BRCA1突变的胚胎外,预测大多数胚胎的乳腺癌 OR 值不到两倍(图2b ),这表明在致病变异对疾病风险影响较大的情况下,乳腺癌 PGT 最有益5、6 。一对未接受单基因疾病PGT的夫妇偶然发现,他们携带APC风险等位基因(rs1801155),该基因与结直肠癌风险增加两倍相关。对这对夫妇的三个整倍体胚胎进行基因组重建后,预测其中一个胚胎携带APC的风险等位基因(扩展数据图6 )。阻断遗传课题组在这些已确定的结肠癌( APC)和乳腺癌(BRCA1)中发现的两种罕见变异,) 基因很可能因估算方法而遗漏,具体取决于所使用的参考人群。由于对致病变异一无所知,有家族病史的夫妇可能会无意中仅根据 PRS 就优先植入突变阳性的胚胎。这种情况的发生频率取决于病情和家族史。例如,乳腺癌遗传基因突变估计占病例的 5% 至 10%,在某些人群13和有家族病史的人群中估计比例更高。

讨论

在这项临床前研究中,阻断遗传课题组证明了胚胎全基因组扩增(WGR)的可行性,并且能够与10个出生儿童的基因组样本结果进行比较,从而准确计算PRS。阻断遗传课题组观察到不同家族和不同兄弟姐妹之间预测疾病风险的异质性。许多效应量较小的常见变异的PRS与罕见变异的PRS相结合,或许可以更好地反映预测疾病风险的异质性。

仍有一些领域需要改进。第一时间,阻断遗传课题组的方法仅限于遗传基因变异。尽管阻断遗传课题组确认了出生婴儿数百万个位点的遗传信息,但阻断遗传课题组排除了配子中可能“新”或新生的变异,或受孕后出现的体细胞突变。虽然新生变异罕见,但它们在某些早发性神经发育障碍(包括自闭症和智力障碍)中占很大比例。阻断遗传课题组对第5天胚胎的预测比第3天胚胎更准确,这可能是因为滋养外胚层活检中存在的细胞物质增多。随着全基因组测序 (WGS) 成本的降低,阻断遗传课题组预计阻断遗传课题组的方法可以与胚胎活检的超深度测序相结合,以检测这些变异。

其次,PRS 在非欧洲人群中的有效性有限。人类遗传学研究历来涉及欧洲血统的参与者,因此,其在非欧洲人群中的预测能力有限。从长远来看,包括招募祖先多样化的人群和对致病变异进行精细定位等策略应该能够提高跨血统预测的效果。短期内,可能需要使用一组具有跨血统预测能力证据的模型子集。

第三,使用 PRS 降低植入前胚胎疾病风险的临床实用性仍有待证实。研究队列的结果可能不适用于 IVF 中的兄弟姐妹胚胎,并会降低阻断遗传课题组的预测准确性。这些生物库主要由无血缘关系的个体组成;一些研究小组报告称,使用家庭内无血缘关系的个体训练的模型的预测能力下降,尤其是在认知和精神特征方面14。阻断遗传课题组对 UKB 中的兄弟姐妹与无血缘关系个体队列进行了分析,用于生成兄弟姐妹胚胎之间的相应 OR(补充说明3),结果显示兄弟姐妹与无血缘关系个体的乳腺癌 PRS 效应大小相似。需要更多基于家庭的遗传学和疾病前瞻性研究来缓解这些担忧。此外,除了家庭内部效应之外,现在出生的儿童可能面临的环境和风险状况与大多数研究生物库中的成年参与者不同。另外,有家族病史的个体可能由于先验患病风险较高而表现出较高的绝对患病风险降低(和较低的相对患病风险降低)6,15。

第四,将多基因信息纳入产前决策会引发伦理和实践问题,这些问题在本已复杂的领域中值得考虑15 , 16。最重要的是,由于 IVF 的成本或多基因模型的跨祖先表现的局限性,家庭无法平等地取得这项技术的风险。阻断遗传课题组的研究对参与者免费,并涉及多个祖先验证的几个模型。然而,必须继续解决普遍存在的差距。另外,Turley 等人强调了传达预期风险(相对和绝对)的复杂性以及这些估计中涉及的不确定性15。阻断遗传课题组同意 Turley 等人关于需要进行清晰准确的测试前沟通的观点;那些收到胚胎预测的研究参与者第一时间完成了与医学遗传学家的测试前咨询和同意会议,然后完成了后续调查,以评估他们的理解和感知到的益处。尽管存在局限性,但新出现的证据表明公众有兴趣将 PRS 纳入胚胎筛查;最近的一项调查发现,在1,457名美国参与者中,68%的人认为使用PRS进行胚胎筛查是合理的17。顺利获得像阻断遗传课题组这样的研究方案进行进一步的研究,可以帮助取得关于实用性的急需证据。

第五,本研究中的一部分个体被推荐使用PGT-A进行非整倍体筛查,PGT-A是IVF的辅助干预措施18。囊胚活检中发现的染色体嵌合体对PGT-A临床有效性的影响仍存在争议18-20 。此外,阻断遗传课题组的方法并未解决在PGT-A过程中发现嵌合体或非整倍体胚胎进行PRS检测的准确性问题。

随着阻断遗传课题组对 PRS 的理解和预测能力的提高以及测序技术变得更具成本效益,这种方法可用于可靠地推断遗传基因组序列,并模拟在接受 IVF 治疗时有个人和/或家族常见疾病史的夫妇的胚胎中的预测遗传风险。

方法

招募参与者、样本收集和测序

所有参与者都是顺利获得几项 IRB 研究(E&I 西海岸委员会 IRB 协议 10176)和 WCG IRB 协议 20180294 和 20202676 中的一项招募的。阻断遗传课题组从每位参与者那里取得了适当的同意,参与协议 20180294 的一部分个人同意返回结果,以接收他们自己的某些偶然的单基因发现和关于整倍体胚胎的报告。对于一些纳入分析数据的夫妇,阻断遗传课题组事先知道存在罕见的致病变异。对于每个人,阻断遗传课题组从全血或唾液样本中提取基因组 DNA(如果有)。阻断遗传课题组按照制造商的说明,使用 Illumina 或 BGI 试剂盒以双端 100 bp(案例 4)或 150 bp 读取配置对 DNA 进行片段化、制​​备和测序。阻断遗传课题组对父母和出生孩子的 DNA 进行 WGS 的目标是平均深度为 30 倍。所有样本的实际平均覆盖率≥29,范围从29倍到111倍(补充表3)。参与方案20180294(前瞻性研究)的个体还可以选择接收自身偶然发现的某些单基因疾病,以及包含多基因疾病风险信息的整倍体胚胎报告,而无需额外支付其IVF周期费用。选择接收多基因风险信息的个人将接受医学遗传学家或遗传咨询师的检测前和检测后咨询,内容包括讨论多基因模型的构建方法、预测的实验性质以及多基因风险的可视化。

在四个有新鲜血液样本的家庭中,阻断遗传课题组额外对夫妇双方进行了合成长读长测序。阻断遗传课题组对方案进行了修改,包括高分子量DNA提取(Circulomics),并使用TELL-Seq文库按照标准方案进行文库制备,但减少了转座酶的含量。

WGS、比对和基因分型

WGS 初级和次级分析均根据 Broad Institute 的最佳实践流程 (GATK) 进行,由 Sentieon 软件 (Sentieon) 实施。简而言之,阻断遗传课题组使用 bwa v0.7.17 将读数映射到人类参考基因组序列 (GRCh37)。基因分型包括两个步骤。第一时间,阻断遗传课题组使用 Sentieon 的 GVCFtyper 对父母和出生的孩子进行联合变异调用,并根据内部质量控制阈值对其进行过滤,包括碱基质量 ≥20、读取深度 ≥8、Fisher 链偏差 <30 和深度质量 >4。其次,阻断遗传课题组在特定于多基因模型的位点调用基因型,读取深度至少为 8 倍。阻断遗传课题组之前的出版物1中也报告了来自病例 4 的序列读数。

胚胎基因分型和PS分析

为了对胚胎活检样本进行基因分型,阻断遗传课题组提取并扩增了 DNA,然后使用 Illumina 的 HumanCytoSNP-12 BeadChip 上的快速 SNP 微阵列协议进行基因分型。阻断遗传课题组将同胞胚胎和父母的 SNP 微阵列测量结果结合起来,采用两步法,称为父母支持 (PS;补充说明1 )。第一时间,阻断遗传课题组使用统计模型顺利获得将 HapMap 数据库中的重组频率与父母的 SNP 阵列测量结果和同胞胚胎的 SNP 阵列测量结果相结合,确定每个亲本中杂合单核苷酸变异的最大似然估计相。这被称为 PS 单倍型。其次,阻断遗传课题组使用隐马尔可夫模型 (HMM) 确定 PS 胚胎基因型,该模型根据胚胎的 SNP 阵列测量结果和每个亲本的最大似然估计相,找到最有可能传递给每个胚胎的亲本单倍型 (补充说明1 )。HMM 的输出告知减数分裂重组位点。由于这些样本的处理流程与临床PGT-A平台(Natera)相同,阻断遗传课题组依靠成熟的Natera Spectrum流程来识别含有非整倍体20号染色体的胚胎。该平台可以检测到小至5 Mb的拷贝数变异。

父母的单倍型定相

为了对每个亲本中的 WGS 衍生变异进行分期,阻断遗传课题组使用了 SHAPEIT4(参考文献11),使用默认参数,以 UK10K Imputation Cohort + 1000 Genomes 第 3 阶段(EGAD00001000776)作为参考面板,以 PS 单倍型作为支架(补充说明1)。这个支架由约 200,000 个分期变异组成,用于锚定使用参考面板执行的分期(扩展数据图7)。每个染色体都独立且并行地处理;之后合并所有染色体。排除多等位基因位点。为了取得参考面板未代表的罕见变异的额外性能,阻断遗传课题组使用了高分子量 DNA 的链接读取测序(补充说明2)。

扩展数据图 7. 获取分阶段的亲本基因组。

使用PS亲本单倍型(参见补充说明1)和SHAPEIT4软件的群体参考组对每个亲本的基因组进行分期。PS亲本单倍型作为支架(步骤1),包含约20万个变异。使用群体参考组对父母双方的WGS进行临时分期,并与PS亲本单倍型进行比较。亲本支持单倍型与临时分期WGS之间的重叠位置被标记为具有一致(1)或不一致(0)相位(步骤2),并分组为区块(步骤3)。这些区块之间的间隔区域提示减数分裂重组或亲本一方或双方分期错误;这些位点将被丢弃(步骤3中标记为“X”的位置)。所有剩余位点将用于后续“分期亲本基因组”的组装(步骤4)。

重建方法

为了预测每个胚胎的全基因组序列,阻断遗传课题组将PS胚胎基因型(见上文)与定相的亲本基因组1相结合,并使用补充说明1中讨论的HMM添加了跨染色体单倍型。顺利获得比较PS单倍型(“父母的单倍型定相”)和胚胎的PS基因型(“胚胎基因分型和PS分析”),取得了父母遗传给胚胎的单倍型。阻断遗传课题组对每条母系和父系染色体重复了此过程(扩展数据图7和8),但使用临床PGT-A检测(Natera Spectrum)预测为非整倍体的染色体除外。

扩展数据图 8.胚胎重建方法。

使用分阶段的亲本基因组和亲本支持 (PS) 胚胎基因型来重建整倍体染色体上的胚胎基因组。分阶段的亲本基因组在扩展数据图7中确定。一位亲本(亲本 1)传递的单倍型显示为粉色(标记为 1 和 2),另一位亲本(亲本 2)分阶段的单倍型显示为紫色(标记为 3 和 4)。在步骤 1 中,胚胎的 PS 基因型决定了哪个亲本单倍型会传递给胚胎(虚线)。胚胎或父母分阶段基因组中缺失的数据被排除在外。在步骤 2 中,将父母双方基因型均有的位置组合起来,以创建预测的胚胎基因组;缺失数据的位置被排除在外。

阻断遗传课题组筛选了父母和出生儿童基因组中的低质量位点(见上文),以及每个家族序列数据中多等位基因位点和与孟德尔错误相对应的位点,形成一组“高置信度位点”,用于评估覆盖率和准确性。阻断遗传课题组将预测的胚胎基因型识别结果(基于重建结果)与出生儿童DNA测序识别出的变异进行了比较。

阻断遗传课题组利用 gnomAD v2.1 数据集中的群体等位基因频率对高置信度位点进行了注释。该数据集包含来自七个群体(非洲人、拉丁裔、阿什肯纳兹犹太人、东亚人、欧洲人、南亚人及其他)的约 15,000 个全基因组和 125,000 个外显子组。等位基因频率 < 0.1% 或未在 gnomAD 数据库中出现的变异被视为罕见变异。

多基因风险模型

UKB 人口

为了独立于 PRS 原始出版物验证每个模型,阻断遗传课题组使用了 UKB 队列中约 50 万名个体的遗传和疾病信息。为了验证模型,阻断遗传课题组根据参与者自我报告的血统(字段代码 21,000:白人、黑人、东亚人(华人)或南亚人)将他们分为四组,并分别计算了每组的模型性能和 PRS 效应大小。

表型定义

阻断遗传课题组结合 ICD-9 和 ICD-10 代码、自我报告疾病和诊疗程序代码来定义每种感兴趣的表型。所有表型的详细描述见补充表2。

多基因模型

阻断遗传课题组优先考虑了先前已发表的针对每种目标疾病的多基因模型,这些模型已在广泛人群中至少1,000名个体中进行了测试(补充表4)。为了独立于原始出版物验证每个模型,阻断遗传课题组使用了来自UKB队列中约500,000名个体的遗传和疾病信息。已发表模型中在UKB中没有基因型数据的变异被排除在外。其余变异的效应大小(对数转换的OR)取自原始出版物(总结于补充表4)。PRS计算为疾病相关基因型的加权和。

PRS 效应大小

阻断遗传课题组计算了 UKB 中每个个体的 PRS,并按如下所述对分数进行了标准化。阻断遗传课题组使用包含标准化 PRS、年龄和性别(针对乳腺癌、前列腺癌和冠状动脉疾病)的逻辑回归计算了风险评分每个标准差的 OR。阻断遗传课题组使用了多种指标,包括曲线下面积和每十分位数的 OR,以评估每个模型的性能。本研究使用的模型符合以下标准:曲线下面积内部质量≥0.6、每 PRS 十分位数的 OR 增加以及 PRS 上下十分位数之间 OR ≥ 2。各十分位数的模型性能可在扩展数据图3中查看。

定心和标准化

为了将 PRS 标准化并集中到均值近似为零、方差为单位的分布,阻断遗传课题组修改了 Khera 等人描述的方法。21第一时间,阻断遗传课题组顺利获得将 UKB 中个体的基因型投影到千人基因组计划中个体计算的主成分 (PC) 上来计算他们的主成分。接下来,阻断遗传课题组顺利获得减去 PRS 对对照个体(即没有感兴趣表型的个体)前四个 PC 分数的线性回归预测的 PRS 值来集中 PRS。然后将这个集中的 PRS 除以与每个个体关系最密切的千人基因组计划人群的标准差。扩展数据图9中可以看到跨多个祖先的标准化和集中的 PRS。具有阿什肯纳兹犹太血统的个体的 PRS 评分涉及补充说明4中讨论的修改后的集中过程。

扩展数据图 9. 多基因风险评分的标准化。

英国生物样本库中5个人群的多基因风险评分在中心化和标准化之前(左)和之后(右)。标准化的PRS评分在每个人群中均值约为零,方差为单位。

计算胚胎分数

阻断遗传课题组采用类似的方法计算了每个重建胚胎的PRS和祖先PC。如果无法在胚胎中做出预测,阻断遗传课题组会使用群体等位基因频率来调整评分。评分按上述方法进行中心化和标准化,并根据PRS转化为疾病的OR值。具体而言,OR PRS = e β *PRS,其中β是从UKB(上述分析)得出的PRS效应大小(即对数比值/标准差),PRS是中心化和标准化后的PRS。

单基因和多基因风险的整合

阻断遗传课题组调查了一组知情同意的参与者,寻找在一组预先定义的基因中被诊断为致病或可能致病的变异,这组基因包含美国医学遗传学学会 (American College of Medical Genetics) 指定为可报告为研究次要发现的 59 个基因。变异根据美国医学遗传学学会的标准进行分类,并对 ClinVar 中注释为可能致病或致病的变异进行人工审核。与阻断遗传课题组报告 PRS 的表型相关的致病/可能致病变异被纳入风险评估。在本研究中,这包括乳腺癌的BRCA1 基因。

在计算了英国基因型识别 (UKB) 中拥有外显子组数据的女性的 PRS 评分后,阻断遗传课题组分别对英国基因型识别(UKB) 中约 22,000 名个体中的BRCA1和BRCA2致病变异携带者和非携带者分别运行了逻辑回归模型。BRCA1和BRCA2变异的定义来自 Fahed 等人的研究[ 12]。携带者的 PRS OR 为 1.3,非携带者的 PRS OR 为 1.6。该信息被投射到第 99 个百分位数,并将胚胎映射到每个类别。

PRS的模拟分布

阻断遗传课题组从父母双方的分阶段基因组开始模拟胚胎(连锁方法),在两个母亲或两个父亲的染色体之间添加重组(以近似于配子中的减数分裂重组),并随机组合这些“虚拟配子”。阻断遗传课题组将 PS 单倍型与 WGS 相结合,如上所述,以取得分阶段的亲本基因组。阻断遗传课题组使用 ped-sim(http://github.com/williamslab/ped-sim)与谱系(两个父母和一个孩子)和遗传图谱(http://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination)来模拟重组位点。阻断遗传课题组将从 ped-sim 取得的断点与分阶段的亲本基因组相交以生成虚拟配子,将来自母亲和父亲的虚拟配子组合以生成胚胎基因组,并如上所述计算这些胚胎中的多基因风险。为了生成风险评分分布,阻断遗传课题组对每对夫妇重复此过程 500 次。在另一种方法(非链接方法)中,阻断遗传课题组顺利获得从每个亲本中随机选择一个等位基因来模拟胚胎,并且不对相邻变异是否链接做出任何假设(扩展数据图10)。

扩展数据图 10. 模拟胚胎风险的分布。

假设一对研究夫妇(病例ID 3)的相邻SNP存在关联和非关联,比较模拟比值比的分布。心房颤动呈现关联SNP的双峰分布,模拟的几个子女预测OR为2,这与基于胚胎的预测结果一致(扩展数据图6 )。关联SNP的模拟采用了《方法》和Caballero等人22中描述的方法。

 

(责任编辑:bbin宝盈基因)
顶一下
(0)
0%
踩一下
(0)
0%
推荐内容:
来了,就说两句!
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码: 点击我更换图片

Copyright © 2013-2033 网站由bbin宝盈基因医学技术(北京)有限公司,湖北bbin宝盈基因医学检验实验室有限公司所有 京ICP备16057506号-1;鄂ICP备2021017120号-1

设计制作 基因解码基因检测信息技术部