【bbin宝盈基因检测】语言障碍、说话障碍、说话能力差的基因检测
bbin宝盈基因为什么要推出语言障碍基因检测项目?
孩子在生命早期学习和使用语言的能力,常被认为是人类进化的核心特征之一。儿童在成长过程中,会迅速开展出理解和表达语言的能力,他们能掌握并运用看似复杂的形态学、音系学和句法规则,同时理解词义与语用。大多数儿童会在学龄期间以相对有序的方式持续开展语言能力,但也有一些儿童在语言学习上难以跟上同龄人的步伐。
在中国,有超过7%的学龄儿童符合开展性语言障碍(Developmental Language Disorder, DLD)的诊断标准。DLD 指的是儿童的语言能力明显低于同龄人,已对其日常功能产生影响,且无法顺利获得其他医学诊断来解释。若儿童的语言问题已经对其生活产生实质影响,则可诊断为“语言障碍”。如果这种语言障碍与某种医学状况有关,则称为“与X医学状况相关的语言障碍”;而若不存在可解释的医学问题,则儿童可被诊断为 DLD,此时会在诊断中加入次级描述,用以表明伴随的其他症状或特定困难领域(如语音困难)。按照这个定义,平均每个教室里至少会有两名儿童符合 DLD 的诊断标准。
语言障碍对人的一生影响深远:研讨能力的缺陷会干扰其社会、情感及教育的开展。这些障碍会显著增加个体患行为障碍的风险,并可能最终导致成年后的失业及心理健康问题。尽管语言障碍在社会和经济层面造成的负担极大,人们对其生物学基础的认识却仍非常有限。迄今为止,bbin宝盈基因在《人的基因序列变与疾病表征》中已描述超过三十个与言语或语言障碍相关的基因,但这些发现仅能解释部分 DLD 个案的基因原因。
在语言障碍领域,表型定义的局限性是造成其遗传证据薄弱的重要原因之一。这一问题又因缺乏国际统一的诊断标准和金标准测试而加剧,导致各研究之间存在高度异质性,难以进行结果的直接比较或复制研究。这种异质性限制了样本量的积累,从而进一步妨碍了对遗传发现的验证。因此,与其他神经发育障碍(如自闭症谱系障碍、智力障碍和注意力缺陷多动障碍)相比,语言障碍的遗传机制研究进展明显滞后。
在《语言障碍、说话障碍、说话能力差的基因检测》中,bbin宝盈基因将探讨语言障碍当前的遗传学研究现状,并说明单基因疾病与复杂遗传疾病之间的界限正逐渐模糊。bbin宝盈基因也将介绍近期全球在统一诊断标准方面的努力,这些进展显著扩大了研究样本量,使得跨队列的大规模荟萃分析成为可能,进而有助于了越来越多相关遗传位点的发现。
什么样的人应当做语言障碍基因检测?
“特发性语言障碍”的历史术语包括“特异性语言障碍(SLI)”,而近年来则更常使用“开展性语言障碍(DLD)”这一术语。SLI 一词曾用于描述那些在语言能力方面落后于非语言智力开展的儿童,但其原因无法顺利获得已知医学因素解释。然而,SLI 的诊断标准在国际上从未形成统一的共识,尤其是在语言缺陷的具体定义及非语言智力的界定方面。
在以往文献中,SLI 的常用诊断标准是:语言测评得分低于平均值1.25个标准差以下,且表现性智商(Performance IQ)在85分或以上。与之相比,ICD-10中对 SLI 的诊断要求为语言能力低于平均值2个标准差,且至少比非语言智力低1个标准差。然而在实际研究中,所采用的诊断阈值标准差异巨大。为分析决术语与诊断标准缺乏统一的问题,CATALISE 研究团队顺利获得德尔菲共识研究,建议使用“开展性语言障碍(DLD)”这一更具包容性的术语来指代特发性语言障碍。
CATALISE 的研究还对 DLD 的定义进行了重要的重新界定,承认其可能伴随其他医学状况——这是以往 SLI 定义中所忽视的。医学共病在神经发育障碍中极为常见。DLD 与其他发育性障碍的共病率也很高,包括语音障碍(共病率为11%–77%,或40.8%)以及读写障碍如诵读困难症(共病率为17%–29%),这些共病情况提示其之间可能存在共同的病因。
患有 DLD 的儿童通常在早期语言开展阶段就表现出延迟,例如:第一次开口说话的年龄、双词组句子的使用时间、以及句子结构的产生等方面落后于同龄人。进入小学阶段后,这些儿童在语言理解与表达能力方面的表现明显低于同龄人,具体体现在词汇量、语法使用、语用功能以及识字能力等多个方面。
现在认为,遗传和环境风险因素及保护因素共同影响儿童语言能力的开展轨迹。例如,母亲的受教育水平及家庭社会经济地位均被认为是语言开展的预测因子。正是由于遗传与环境的交互作用,DLD 群体在表型上呈现出高度的异质性。
语言障碍的遗传学
早在 1995 年,Bishop 等人的研究首次显示语言障碍(当时称为 SLI)具有显著的遗传基础。他们发现同卵双胞胎之间的共患率极高:一旦其中一人符合 SLI 诊断标准,几乎所有的同胞也会表现出相同障碍。然而,后续研究对此提出不同看法,有研究估计 DLD/SLI 的遗传率约为 18% ,显示其高度遗传性的结论可能并不绝对。Bishop 与 Hayiou-Thomas 于 2008 年的研究指出,遗传率的估算受研究样本获取方式影响极大:如果是临床招募的双胞胎样本,其遗传率可高达 0.97;而在人群筛查中发现的双胞胎样本中,遗传率几乎为零。这表明语言障碍的遗传图景可能比其他神经发育障碍(如自闭症谱系障碍 ASD 或 注意缺陷/多动障碍 ADHD)更加复杂。值得注意的是,ASD 和 ADHD 的遗传率估算一般约为 80%,但不同研究之间仍存在一定差异,具体数值受评估方式与受试年龄等因素影响。
Stromswold(1998)也发现,若一级亲属中有人患有语言障碍,个体自身罹患语言障碍的风险也会显著升高。Dale 等人(1998) 和 Spinath 等人(2004) 的研究表明,与一般语言能力相比,语言障碍的遗传性更强,暗示在语言障碍与语言能力之间,遗传因素所起的作用可能存在差异。
尽管大量研究支持语言障碍的遗传基础,但现在我们对其具体的遗传机制以及这些遗传变化与环境如何交互的理解仍相对有限。语言障碍的遗传研究通常分为两大类:单基因遗传障碍,即 DNA 中的单一突变即可导致疾病;以及复杂遗传障碍,即多个基因变异共同作用,并受到环境因素进一步影响,导致个体总体患病风险上升。值得一提的是,随着我们对基因变异功能及其与环境交互的分析不断深入,这两类之间的界限也变得日益模糊。
传统上,单基因障碍和复杂遗传障碍的研究方法是截然不同的:前者多顺利获得家系研究进行,而后者则依赖于群体中的遗传关联研究。bbin宝盈基因将对语言障碍领域中,顺利获得这两类方法所取得的关键发现进行综述。
单基因型的言语与语言障碍
现在研究最深入、理解最透彻的语言障碍遗传原因,是由单基因遗传引起的罕见变异所致的障碍。单基因遗传(意为“由一个基因决定”)是指某一特定疾病由一个基因的变异引起,该变异可能以隐性方式(两个拷贝均受影响)或显性方式(一个拷贝受影响即足以致病)遗传。虽然存在显性与隐性的语言障碍实例,但这些情况极其罕见,通常全世界仅有少数人受到某一特定遗传变异影响,且常常是同一基因的不同变异形式。由于这类单基因变异在普通人群中极其稀少,携带者通常不到十万分之一,有些变异甚至是首次在个体中发现的“新发变异”。这些变异会对其所编码的蛋白质产生不良影响,进而在细胞层面引发功能障碍,导致特定的疾病表现。
FOXP2 基因 是最著名的单基因遗传性语言障碍案例之一。在英国 KE 家族中,FOXP2 基因中的一个罕见致病变异导致儿童言语失用症(CAS),这一病症主要表现为言语所需运动编程与计划能力受损。这种障碍被认为是独立于其他语言障碍的特殊类型,属于 DLD(开展性语言障碍)范畴下的一个子类。FOXP2 相关变异的研究已相对成熟,多表现为显性遗传:携带者会表现出症状,而未携带者则不受影响。携带致病 FOXP2 变异的个体通常表现出感知性与表达性语言困难,语言发育迟缓、言语不清晰,但其非语言智力多为正常或偏低水平。尽管存在特定的言语运动障碍,这些个体的整体运动能力,包括大运动与精细运动,通常是正常的。然而,FOXP2 变异极为罕见,仅占儿童言语失用症(CAS)病例的约 2% ,现在并未发现其与其他类型的语言障碍相关。
FOXP2 的发现是语言与言语障碍研究的一个重大突破,为理解言语和语言的生物学基础给予了窗口。FOXP2 是一种转录因子,调控多个在多种生物过程中的关键基因。顺利获得研究 FOXP2 的下游调控网络,研究者进一步发现了如 CNTNAP2 与 FOXP1 等关键作用基因。
近年来,随着测序技术的开展以及人群层面遗传变异数据库的建立,识别致病基因的方法也发生了根本变化。如今,研究者更倾向于使用全外显子组或全基因组测序技术,一次性对所有基因进行全面分析,而不是只集中于候选基因研究。一个典型例子是 Chen 等人(2017)的研究:他们对 43 名诊断为严重 SLI 的个体进行全外显子测序,发现了 ERC1、GRIN2A 和 SRPX2 三个基因中的变异完全可以解释这些个体的语言困难,并首次识别出一系列此前主要与其他神经发育障碍相关的候选基因(详见表1)。
以下是“表 1:单基因型特发性言语障碍(如 CAS)及语言障碍的致病基因概述”的中文翻译及表格呈现
基因 | 突变类型 | 表型 | 基因解码者 |
---|---|---|---|
ATP2C2 | 缺失(del) | DLD(开展性语言障碍) | Smith 等(2015) |
BCL11A | 缺失(del) | CAS(儿童言语失用症) | Peter 等(2014) |
BUD13 | — | SLI(特异性语言障碍) | Andres 等(2022),Soblet 等(2018) |
CDK13 | — | CAS | Hildebrand 等(2020) |
CHD3 | — | DLD/CAS,Snijders Blok-Campeau 综合征 | Eising 等(2018),Snijders Blok 等(2018) |
CNTNAP2 | — | DLD | Worthey 等(2013) |
DDX3X | — | CAS | Hildebrand 等(2020) |
EBF3 | — | CAS | Hildebrand 等(2020) |
ERC1 | — | CAS | Chen 等(2017),Thevenon 等(2013) |
FOXP1 | — | CAS | Hamdan 等(2010),Horn 等(2010),Sollis 等(2015),Srivastava 等(2014),Le Fevre 等(2013) |
FOXP2 | 含缺失(del) | CAS | Lai 等(2001),MacDermot 等(2005),Reuter 等(2017),Moralli 等(2015),Turner 等(2013),Tomblin 等(2009) |
GNAO1 | — | CAS | Hildebrand 等(2020) |
GNB1 | — | CAS | Hildebrand 等(2020) |
GRIN2A | — | DLD 与癫痫(有无智力障碍) | Chen 等(2017),Carvill 等(2013),Endele 等(2010),Turner 等(2015) |
KAT6A | — | CAS | Eising 等(2018) |
KANSL1 | 缺失(del) | CAS | Morgan 等(2017) |
MEIS2 | — | CAS | Hildebrand 等(2020) |
NFXL1 | — | DLD | Villanueva 等(2015) |
POGZ | — | CAS | Hildebrand 等(2020) |
SETBP1 | — | CAS | Eising 等(2018),Hildebrand 等(2020),Kornilov 等(2016),Morgan 等(2021) |
SETD1A | — | CAS | Eising 等(2018) |
SRPX2 | — | DLD,伴有 Rolanic 癫痫 | Chen 等(2017) |
TM4SF20 | 缺失(del) | DLD | Wiszniewski 等(2013) |
TNRC6B | — | CAS | Eising 等(2018) |
UPF2 | — | CAS | Hildebrand 等(2020) |
WDR5 | — | CAS | Hildebrand 等(2020) |
ZFHX4 | — | CAS | Hildebrand 等(2020) |
ZNF142 | — | CAS | Hildebrand 等(2020) |
ZNF277 | 缺失(del) | SLI | Ceroni 等(2014) |
现在,关于特异性语言障碍(SLI,现称开展性语言障碍 DLD)的进一步基因测序研究仍然有限,尽管在严重语音障碍领域,尤其是通常伴随语言障碍发生的儿童言语失用症(CAS)方面,已有更多进展。Eising 等人(2019)对 19 名 CAS 患儿应用了新生突变(de novo)范式进行研究。该范式指患儿携带一个自发产生的显性遗传变异,而该变异未从父母任何一方遗传而来。他们在 CHD3、SETD1A 和 WDR5 基因中检测到了罕见的新生突变变异。
其中,CHD3 基因的重要性已在一项对 34 名携带该基因变异个体的大型研究中得到了确认。该基因的功能缺失性变异会导致伴随大头畸形(macrocephaly)和严重神经发育障碍的语言与言语缺陷,这一综合征被称为 Snijders Blok-Campeau 综合征。已有研究显示 CHD3 可与 FOXP2 蛋白相互作用,表明这些基因可能存在共享的分子通路。正如 FOXP2、CNTNAP2 与 FOXP1 所体现的,研究基因之间的共通机制是发现新致病基因的重要方向。事实上,Eising 等人(2019)正是基于大脑发育中的共享通路,进一步鉴定出另外五个 CAS 候选基因:KAT6A、SETBP1、ZFHX4、TNRC6B 和 MKL2。
更近期,Hildebrand 等人(2020)对 33 名 CAS 儿童(其中包括一对双胞胎)的 DNA 进行研究,在其中 11 名患儿中发现了致病性变异,这些变异涉及 CDK13、EBF3、GNAO1、GNB1、DDX3X、MEIS2、POGZ、SETBP1、UPF2 和 ZNF142 等 10 个基因,以及 5q14.3q21.1 区段的缺失。这意味着,约三分之一的 CAS 儿童可能携带导致其言语障碍的致病性变异。其中 SETBP1 早前已在一个俄国孤立人群中被报道与 SLI 高发相关。在变异罕见且个案稀少的研究背景下,跨研究重复验证结果对于建立某基因在语言障碍中的作用证据至关重要。像 Kornilov 等人(2016)所研究的孤立人群,有助于顺利获得家族聚集现象识别特定表型的起源变异。
最近,Morgan 等人(2021)在一组携带 SETBP1 变异的儿童中采用了反向表型分析方法,验证了该基因与言语及语言功能的相关性,并进一步指出其影响语言的方式不同于对其他技能的影响。尽管 Eising 等人(2019)与 Hildebrand 等人(2020)的研究是基于 CAS 患儿筛选而来,但由于大多数 CAS 儿童同时也存在表达性和/或理解性语言障碍,因此这些研究对探讨语言障碍的遗传机制同样具有重要意义。
另一个使用家族结构成功识别致病变异的优秀例子是 NFXL1 基因的发现。该基因在 鲁滨逊·克鲁索岛人群中的 DLD 患者中被鉴定出来。这类研究顺利获得利用族群历史,选取更可能携带高效应遗传变异的个体群体,从而提高发现几率。
最后,Andres 等人(2021)最近报告称,在多个无亲属关系的加拿大家庭中,BUD13 被鉴定为一种具有大效应量的罕见变异,每个家庭中至少一人符合 SLI 的诊断标准。该基因也被纳入表 1,总结了现在已知的与单基因型 DLD 相关的基因。
此外,还有许多与言语和语言相关的基因被识别出来,但它们通常是更广泛综合征的一部分,或作为非特异性、继发性表型出现。例如一项最新研究发现,在携带 SATB1 致病变异的 42 名个体中,存在包括智力障碍、发育迟缓和运动困难等神经系统症状。尽管该综合征主要归类为智力障碍,但其中 89% 的患者同时存在语言障碍。
拷贝数变异(Copy Number Variants, CNVs)
拷贝数变异(CNVs)指的是基因组中某些区域的缺失或重复,其范围可以从几百个碱基对延伸到整条染色体臂。每个人的基因组中都携带有许多 CNV,其中一些是从父母遗传而来,另一些则是新生突变(de novo)。这些 CNV 中,有些对个体生物学影响甚微,可被人体耐受;而另一些则可能导致疾病。因此,单个 CNV 的具体影响往往较难确定,通常取决于其所影响的基因。
某些 CNV 会产生严重影响,导致明确的遗传疾病。一些微缺失或微重复综合征会影响到整体的神经发育,而另一些则被证实与语言障碍有关。例如,染色体 16p11 的缺失已被证实与一种高外显率(penetrant)的 CAS(儿童言语失用症)有关。
跨越 FOXP2 基因的 CNV 会不可避免地导致 CAS 表型,这是因为它们会破坏该关键基因的功能,其作用机制与前述的单基因变异相似。此外,一些 CNV 在个案研究中被首次报道,进而有助于了新的候选基因的发现,如 BCL11A、ERC1和 SEMA6D,这些基因后续都顺利获得基因测序研究得到了验证。
Morgan 等人(2017)指出,由 17q21.31 区段微缺失或 KANSL1 基因变异导致的 Koolen de Vries 综合征患者通常表现出 CAS 及构音障碍(dysarthria)。绘制缺失和重复区域的位置图是研究开展性语言障碍(DLD)的一种经典基因定位方法。
与稀有变异类似,CNV 也被广泛认为与各种发育性障碍有关,包括自闭症、智力障碍和 注意力缺陷多动障碍(ADHD)。研究发现,CNV 负担(burden)——即个体所携带 CNV 的数量及其在基因组中所覆盖的总长度——在 DLD 中也起到一定作用。Simpson 等人(2015)发现,DLD 个体及其未受影响的亲属中,CNV 负担更高;但他们也指出,最关键的因素是 CNV 所影响的具体基因。Kalnak 等人(2018)的研究也发现,与正常发育儿童相比,DLD 个体携带更多且更大的稀有 CNV。
常见遗传模型
单基因致病机制在语言障碍中的作用仍较为罕见,且无法完全解释 开展性语言障碍(DLD)超过 7% 的患病率。现在普遍认为,常见的遗传风险变异对 DLD 的易感性具有显著影响。这种遗传模式被称为“复杂遗传模型”,其特点是每一个变异对患病风险的贡献较小,但多个变异的累积效应可显著提高患语言障碍的概率。
为识别这种复杂遗传模型中的风险变异,研究通常采用两种主要方法:连锁分析(linkage studies)和全基因组关联研究(GWAS,genome-wide association studies)。
连锁分析顺利获得寻找表型相似的个体(有时为亲属)间共用的染色体区域,从而定位可能的致病基因。相比之下,GWAS 顺利获得检测整个基因组中高密度的遗传标记,识别在病例中显著多见而在健康对照中较少见的变异。两种方法都基于相同的假设:即疾病的发生是由于少数共享变异的影响,且参与研究的个体在遗传上较为相似,通常意味着他们来自相同的族群或种族背景。
连锁分析
在 2000 年代,顺利获得遗传连锁分析识别受影响个体间共用的基因组区域,曾是神经发育遗传学研究的核心方法。作为检测常见变异的主要手段,连锁研究有助于了许多关键发现,有助于揭示复杂疾病的遗传机制。该方法特别适用于检测在超过 10% 人群中存在的、具有中等或较大效应的常见遗传变异。
特异性语言障碍联盟(SLIC)顺利获得连锁分析发现了两个与特异性语言障碍(SLI)高度相关的基因组区域:16q24(命名为 SLI1)和19q13(命名为 SLI2) (见表 2)。对这些区域的进一步精细定位发现了两个具体基因:CMIP(C-mad诱导蛋白)和ATP2C2(钙转运 ATP 酶 2C 型成员 2) 。
研究表明,CMIP 和 ATP2C2 都含有具有中等效应的常见风险变异,此外,在语言障碍的单基因病例中也发现了这两个基因的变异。Newbury 等人(2009)发现,CMIP 与语言、阅读和拼写能力相关,无论是在 SLI 患者群体还是在一般人群中均表现出相关性,这可能意味着 CMIP 对语言能力中的语音技能具有普遍影响。相比之下,ATP2C2 在 SLI 患者中与语音记忆有关,但在普通人群中,仅在语言障碍者中表现出显著关联,这提示其可能对具有语言障碍的个体具有更专一的影响。
最近,Martinelli 等人(2021) 对 ATP2C2 中的一个稀有变异进行了功能分析,进一步揭示了该基因在语言障碍中的作用。
表2:语言障碍全基因组关联研究结果摘要
研究 | 样本数量 | 队列类型 | 相关染色体 |
---|---|---|---|
Luciano 等人 (2013) | 约 6500 | 普通人群 | 21 |
Eicher 等人 (2013) | 约 170 | 精选的阅读和语言障碍者 | 3、4、13 |
Nudel 等人 (2014) | 约 250 | 精选队列(父源效应) | 5、14 |
St Pourcain 等人 (2014) | 约 10,000 | 普通人群 | 3 |
Gialluisi 等人 (2014) | 约 1800 | 精选的阅读和语言障碍者 | 7、21 |
Harlaar 等人 (2014) | 约 2000 | 普通人群 | 2、10 |
Kornilov 等人 (2016) | 约 400 | 隔离人群 | 9、21 |
Eising 等人 (2021) | 33,959 | 精选与普通人群混合;对19个队列的荟萃分析 | 1 |
Doust 等人 (2021) | 51,800 读写障碍病例,1,087,070 对照 | 精选与普通人群混合;基于自报读写障碍的二分类荟萃分析 | 1、2、3、6、7、11、17、X |
Bartlett等(2002)的研究发现,阅读能力特异性指标与染色体区域13q21(SLI3)存在显著关联,而更一般的语言发育迟缓指标则与2p22和17q23区域存在较弱关联。该研究基于五个加拿大大家系的家族连锁分析,这些家系中多名成员被诊断为特异性语言障碍(SLI)。Evans等(2015)顺利获得对147对同胞(至少一人诊断为SLI)的研究,发现10q23.33和13q33.3两个区域与语音记忆功能相关。
需要指出的是,这些研究中大部分尚未明确具体的致病基因及其变异位点。这本质上是连锁研究的固有局限——该方法通常只能定位包含数百个基因的广阔染色体区段,难以实现精细定位。
随着样本量的扩大和群体基因组数据的普及,除大家系或高度同源人群研究外,全基因组关联研究(GWAS)已逐步取代连锁分析。GWAS能给予更高精度的变异检测,更高效地实现致病位点的精细定位。例如Andres等(2019)顺利获得连锁分析,在14个近亲通婚的巴基斯坦家系(共156人)中确定了与SLI相关的2q染色体区域。
连锁研究结果在不同人群中的可重复性较差,各研究间罕有重叠发现。这是因为在无亲缘关系的个体中,语言障碍风险通常由多基因微效变异共同作用,而连锁分析的前提假设是存在少数大效应变异。这种根本差异导致其检测遗传信号的效力不足,必须顺利获得更大样本量和GWAS研究来解决。
全基因组关联研究
当前检测复杂疾病相关基因组变异的金标准方法是全基因组关联研究(GWAS)。该技术利用基因标记技术的进步,可同步评估全基因组超过400万个已知常见变异位点,给予更高分辨率的检测能力。除检测位点数量激增外,研究样本量也提升至数万甚至数十万规模。精神病遗传学领域的里程碑研究曾顺利获得对37,000例精神分裂症患者和113,000名健康对照的分析,鉴定出100多个相关基因组区域。而针对开展性语言障碍(DLD)及语言相关表型的研究,近期才逐步达到相近样本量规模(表2)。现在已召开的多项SLI/DLD相关GWAS研究及其发现的基因组区域汇总于表2。
与前一章节所述连锁研究类似,不同GWAS研究发现的关联基因组区域一致性较低。这一现象部分源于各研究采用的表型评估标准差异——DLD诊断缺乏稳健的共识标准加剧了该问题;另一方面,DLD的遗传病因学本质涉及众多基因中大量微效变异(及环境因素)的协同作用。
最近两项研究顺利获得荟萃分析整合多个GWAS队列数据。这种"meta-GWAS"方法顺利获得合并中等规模队列的GWAS汇总统计量来提升检验效能,是极具成本效益的基因识别策略。Eising等(2021)整合22个队列数据,分析五项指标:单词阅读、非词阅读、拼写、音素意识和非词拼写。在19个队列(33,959人)的子集中发现rs11208009变异与单词阅读相关。该变异位于基因间区,但邻近(并与存在连锁不平衡)三个候选基因:DOCK7、ANGPTL3和USP1。研究进一步证实阅读与语言特征的遗传基础与操作智商存在显著分离。
Doust等(2021)则利用23andMe平台数据,纳入51,800名自报阅读障碍的成人及超百万对照,鉴定出42个与阅读障碍诊断相关的基因组区域。其中17个区域既往被发现与教育程度或认知能力相关,25个为新发现区域。值得注意的是,这些研究在样本量与表型信息精度间存在权衡——诊断仅基于"是/否"自报问卷。
Eising(2021)和Doust(2021)的研究标志着DLD遗传机制认知的重大突破,现有样本量已能检测部分"失踪遗传力"。随着候选基因列表扩展,我们对DLD风险的生物学认知不断深化。顺利获得构建多基因风险评分(整合与表型相关的所有风险等位基因),可捕捉神经发育障碍间的遗传异同。初步研究显示该领域前景广阔:认知能力、教育程度、语言开展和心理社会结局间存在共享遗传效应。随着大型GWAS汇总统计量的持续更新,多基因评分的敏感性与特异性将不断提升。例如教育程度的多基因评分解释率已从最初的2%提升至13%。该方法正在语言障碍和阅读障碍领域推广应用。临床实践表明,多基因风险评分对携带极端风险/保护性变异负荷的群体最具指导价值,即使对中间分布个体区分有限,仍具有临床意义。
遗传力缺失之谜
常见变异模型与单基因遗传模型仅能部分解释语言障碍的遗传机制,这一未解难题被称为"遗传力缺失",反映了当前对遗传差异如何导致语言障碍的认知缺口。以下三个研究方向可能为揭示语言障碍的生物学基础给予突破性进展:
基因-基因互作(上位效应)
当两个独立遗传变异协同作用导致特定表型时,称为基因-基因互作(又称上位效应)。这种互作可视为修饰因子或"二次打击"。虽然现在尚无直接研究证实其在语言障碍中的作用,但已知其在其他神经发育疾病中起关键作用。阅读障碍领域已发现多例基因互作影响阅读相关特征的证据,这为语言障碍可能存在类似机制给予了佐证。
基因-环境互作
该机制指遗传变异与环境因素相互作用产生特定表型。阅读障碍研究已发现典型案例:社会经济地位、母亲吸烟、低出生体重等环境因素与DYX1C1基因存在互作。未来研究可能揭示不同组织类型及发育阶段中差异化的基因-环境互作模式。
表观遗传调控
表观遗传顺利获得DNA甲基化和组蛋白修饰等机制调控基因表达。虽然多个研究团队提出表观遗传可能参与DLD发生,但尚未发现明确关联证据。Marioni等(2018)在普通成年人群中发现INPP5A基因的特定甲基化标记与语言流畅性、逻辑记忆和词汇量相关(但需谨慎解读)。其他领域证据表明,部分产前表观遗传变化可终生持续,其中某些变化可能与早期脑发育相关。
随着特定基因和通路的逐步明确,这三个方向将极大有助于未来研究进展。
开展性语言障碍遗传研究中的表型分析问题
开展性语言障碍(DLD)在命名学上的历史变迁及诊断标准缺乏共识,导致探究该疾病遗传结构的研究采用了多样化的表型分析方法。表3总结了SLI/DLD关键遗传研究中表型纳入标准的主要差异。这种差异性使得不同遗传研究间的结果比较与重复验证面临挑战,同时也阻碍了研究队列的合并以扩大样本量,从而难以召开具有足够统计效力的荟萃分析。
明确定义的语言障碍诊断标准是DLD遗传研究方法学设计中的关键环节。下文将详细阐述该领域迄今采用的遗传分析方法。
表3. DLD/SLI关键研究的表型纳入标准汇总
作者及年份 | 研究类型 | 诊断术语 | 纳入标准 | 排除标准 |
---|---|---|---|---|
Bishop等 (1995) | 双生子研究 | SLI |
语言:DSR-III-R标准:语言测量标准分≤80;四项语言测量中至少一项显著受损 认知:非言语IQ与语言测量分差≥20分 |
智力残疾;自闭症谱系障碍(ASD);感音神经性耳聋(SNHL);构音器官结构异常;严重视力障碍;医学综合征;英语非母语者(EAL) |
Bartlett等 (2002) | 连锁分析 | SLI |
语言:口语商数(SLQ)标准分≤85 认知:操作IQ≥80且操作IQ≥SLQ |
听力障碍;影响言语或非言语构音运动的运动障碍或口腔结构异常;ASD、精神分裂症、精神病或神经系统疾病诊断 |
Falcaro等 (2008) | 连锁分析 | SLI |
语言:纵向研究中至少一个时间点语言标准分≤1SD+在英国语言治疗组织接受治疗 认知:操作IQ≥80 |
感音神经性耳聋;英语非母语者;可能影响语言的医学状况;ASD诊断 |
Newbury等 (2009) | 连锁分析 | SLI |
语言:CELF-R表达或接受分≥1.5SD低于常模均值 认知:操作IQ≥80 |
单卵双生;需多次住院治疗的慢性疾病;耳聋;ICD-10/DSM-IV儿童自闭症诊断;英语非母语者;地方政府监护;已知神经系统疾病 |
Villanueva等 (2011) | GWAS | SLI |
语言:语音、表达和接受形态句法在TEPROSIF或多伦多西班牙语语法探索测试中≥2SD低于人群均值 认知:操作IQ>80百分位 |
听力障碍;口腔运动或结构异常;ASD、情绪障碍或神经系统疾病 |
Luciano等 (2013) | GWAS(人群) | 人群语言定量 |
语言:基于非词重复任务确定低语言能力人群 认知:- |
- |
Eicher等 (2013) | GWAS | 语言障碍(±阅读障碍) |
语言:三项语言任务(音素删除、言语理解、非词重复)中≥两项z分数≤-1 认知:IQ≥76 |
- |
Gialluisi等 (2014) | GWAS | 语言障碍(±阅读障碍) |
语言:三个队列不同标准:1.SLIC队列CELF-R表达或接受分≥1.5SD;2.英国阅读障碍诊断;3.科罗拉多学习障碍研究中心两个数据集(基于阅读障碍或ADHD诊断),语言分≥3SD样本均值 认知:1.操作IQ≥80;2.阅读IQ差异和/或IQ>90;3.全量表IQ≥70 |
1.单卵双生等(同Newbury);2-3.≥3项标准分≥3SD |
Harlaar等 (2014) | GWAS(人群) | 人群语言定量 |
语言:基于认知测试中的接受性语言测量确定低语言能力 认知:- |
- |
St Pourcain等 (2014) | GWAS | 人群语言定量 |
语言:基于MCDI确定低语言能力 认知:- |
- |
Nudel等 (2014) | GWAS | SLI |
语言:CELF-R表达或接受分≥1.5SD 认知:操作IQ≥80 |
同Newbury标准 |
Evans等 (2015) | 连锁分析 | 语言能力低下 |
语言:来自纵向语言研究,基于综合语言、词汇和句子使用三项得分计算总语言分 认知:操作IQ>70 |
- |
Kornilov等 (2016) | GWAS(隔离人群) | DLD |
语言:半结构化言语样本分析中≥两项定量表型z分数<-1 认知:- |
接受特殊教育的儿童 |
Devanna等 (2018) | 测序研究 | SLI |
语言:CELF-R表达或接受分≥1.5SD 认知:操作IQ≥80 |
同Newbury标准 |
Chen等 (2017) | 测序研究(SLIC队列) | 重度SLI |
语言:CELF-R表达或接受分≥1.5SD 认知:操作IQ≥80 |
同Newbury标准 |
Andres等 (2019) | 连锁分析与纯合性定位 | SLI |
语言:PPVT-4标准分≤80+教师报告的SLI 认知:- |
已知发育障碍、听力障碍、神经系统疾病 |
Andres等 (2022) | 测序研究 | SLI |
语言:年龄适配语言测试≥1.0SD低于均值 认知:3.6-6.11岁哥伦比亚心理成熟量表>85或儿童/成人韦氏智力测验>85 |
已知发育障碍、听力障碍、神经系统疾病 |
注:标研究使用SLIC队列标准;ADHD=注意缺陷多动障碍;ASD=自闭症谱系障碍;EAL=英语非母语者;HI=听力障碍;IQ=智商;MCDI=麦克阿瑟-贝茨沟通开展量表;RD=阅读障碍;SD=标准差;SNHL=感音神经性耳聋;SS=标准分*
bbin宝盈基因观点
本文系统综述了开展性语言障碍(DLD)及其遗传病因学研究进展。遗传关联研究近期取得的突破性进展——主要得益于样本量的大幅提升和荟萃分析方法的运用——标志着我们在解析DLD遗传结构方面取得了实质性突破。现代遗传分析技术的进步使得更深入的基因通路研究成为可能。
研究现状与挑战
既往研究采用的纳入标准存在显著差异,这反映了SLI/DLD领域长期缺乏统一的定义和分类体系。为确保研究结果的可重复性,未来遗传研究必须采用统一、精细化的表型分析标准。顺利获得语言、言语和认知能力的多维深度表型分析,将有助于揭示候选基因与表型间的复杂交互机制。
未来研究方向
表观遗传调控、基因-基因互作及基因-环境交互作用极可能是导致DLD表型变异的关键因素,这将成为重点研究领域。值得注意的是:
-
表观遗传机制可能介导环境因素对语言发育的影响
-
多基因微效变异协同作用模式有待阐明
-
关键发育窗口期的环境暴露影响需纵向研究验证
临床转化价值
深化DLD生物学机制认知具有重要临床意义:
-
为早期诊断和遗传咨询给予科学依据
-
指导个体化干预方案的制定
-
有助于靶向治疗药物的研发
-
最终改善DLD患者的长期预后
(责任编辑:bbin宝盈基因)