本篇是边翻译,变阅读,边做笔记。
当科学家们打开人类基因组时,他们期望找到共同特征和疾病的遗传成分。但他们却不见踪影。布伦丹·马赫(Brendan Maher)指出了六个可能藏匿失踪赃物的地方
如果你想预测你的孩子有一天会有多高,最好的办法就是照照镜子,看看你的伴侣。近一个世纪前的研究估计,身高有80% - 90%是遗传的。因此,如果人群中最高的5%和最矮的5%之间的距离为29厘米,相关基因就会导致其中多达27个。
身高的遗传力大致在0.8~0.9左右,相关挖掘的基因有27个。
三组研究人员仔细研究了大量人群的基因组(最大的一项研究调查了3万多人),寻找与身高差异相关的基因变异。超过40人到场。但有一个问题:变异的影响很小。总的来说,它们占了身高遗传力的5%多一点——根据上面的计算,只有6厘米。
发现挖掘的基因,只能解释5%的变异,也就是29cm的5%,在6cm左右。
尽管这些全基因组关联研究(GW AS)发现了数十种变异,但它们“所做的预测,几乎没有你仅仅通过询问人们父母的身高就能得出的结果”,领导其中一项研究的马萨诸塞州剑桥布罗德研究所的乔尔·赫施霍恩说。身高不是基因缺失的唯一特征,也不是最重要的。通过研究同卵双胞胎和异卵双胞胎之间的相似性,估计自闭症的遗传率超过90%,精神分裂症的遗传率超过80%。基因对肥胖、糖尿病和心脏病等疾病也有重要影响。GW AS是过去五年来最著名的技术之一,它承诺将传递许多相关基因(参见“奖励在哪里?”,第20页)。在某种程度上,他们确实做到了,发现了400多个基因变异,这些基因变异导致了多种特征和常见疾病。但是,即使有几十个基因与一种性状相关联,个体和累积的影响都小得令人失望,远远不足以解释早期对遗传力的估计。马里兰州贝塞斯达的国家人类基因组研究所(NHGRI)前所长弗朗西斯·柯林斯(Francis Collins)说:“这是目前常见疾病遗传学中的一个大话题。”意想不到的结果让研究人员陷入了“我们都不得不挠头说,‘嗯?’”他说。
很多性状遗传力很高,但是挖掘的位点解释的很低,这之间的差异,就是消失的遗传力。
尽管遗传学家对这种缺失的遗传性感到困惑,但他们仍然乐观地认为,他们可以找到更多的遗传基因。“这些都是非常早期的阶段,在未来一两年有一些可行的事情可以很好地解释另一个相当大的遗传因素,”赫施霍恩说。那么它可能藏在哪里呢?
就在每个人的鼻子底下,无法找到一些基因可以解释为GW AS的局限性。这些研究已经在DNA中发现了大量被称为单核苷酸多态性(SNPs)的单字母变异,它们与数千人的一种疾病或其他特征同时发生。
但是一个特定的SNP代表了一个更大的遗传物质块。因此,例如,如果两个人在一个关键位置上有一个这种变异,两个人可能被评为在该区域拥有相同版本的与身高有关的基因,即使其中一个人实际上有一个相对罕见的突变,对身高有巨大的影响。NHGRI的人口基因组学办公室主任Teri Manolio说,这项关联研究可能会发现导致身高差异的变异,但对数百人进行平均研究可能会让人觉得它的影响相当微弱。“它将被稀释,”她说。
从概念上讲,找到这种缺失的遗传性是很容易的,因为这涉及到对现有基因的更仔细的检查。Hirschhorn说:“只是以一种非常密集的方式探索,已经发现的基因位点上的遗传变异可能会[解释]另一种缺失的遗传性。”
其他变种,GW AS甚至还没有开始提供线索,将被证明更难找到。过去,对遗传性疾病(如囊性纤维化)的传统遗传学研究发现了罕见的、突变的基因,这些基因的外显率很高,这意味着该基因对几乎所有携带该基因的人都有影响。但很快就发现,高外显率变异不会是大多数常见疾病的基础,因为进化在很大程度上抑制了它们。
推动全基因组关联的是一种假设,即当有足够多的普通低外显率变异出现在同一个不幸的人身上时,常见疾病将由常见的低外显率变异引起。现在,这一假设受到了质疑。北卡罗莱纳州达勒姆市杜克大学遗传学教授大卫·戈尔茨坦说:“很多人都认识到,对常见变异的筛选效果不如我们的预期。”
但是,在那些像大拇指一样突出的变种和那些足够常见,可以被GW AS的大网挖出来的变种之间,还有一个潜在的中间地带,这些变种具有中等渗透能力,但足够罕见,以至于被网漏掉了。还有一种可能性是,有许多更常见的变体具有如此低的笔-
如果罕见的、中度渗透或常见的、弱渗透的变异是罪魁祸首,那么在现有的关联研究中增加人数可能有助于发现之前遗漏的基因关联。位于澳大利亚布里斯班的昆士兰医学研究所的Peter Visscher说,一项涵盖大约10万人的身高研究的元分析正在进行中。降低关联的严格程度可能会拖得更久,但对命中的信心会下降。
在某种程度上,停止使用snp,并开始对整个基因组进行测序可能是有意义的。柯林斯表示,NHGRI的1000个基因组计划,旨在对来自世界各地的至少1000人的基因组进行测序,在寻找隐藏的遗传力方面可能有很大的进展,随着测序价格的下降,更多的基因组可能成为可能。并非所有人都支持全面的测序冲击。
遗传缺失比学业满意度更重要。通过发现与常见疾病相关的变异,全基因组协会研究承诺提供有意义的医学信息,并证明花在人类基因组上的30亿美元和数百万美元绘制人类变异图的努力是合理的。俄亥俄州克利夫兰凯斯西储大学的遗传学家约瑟夫·纳多说:“花这么多钱的原因是要发现大部分的遗传性。”
通过基因来预测一个人的身高,这可能是一个非常微不足道的狂欢把戏,但它代表了对生命语言的精通,可能会渗透到大多数医学领域。然而,除了一些令人惊讶的事情,比如免疫系统基因突变与一种叫做老年性黄斑变性的眼部疾病有关,许多被发现的变异对人类特征的影响并不大。目前,遗传学很少能比良好的家族史提供更明确的预测答案。北卡罗来纳州达勒姆市杜克大学的大卫·戈尔茨坦说,治疗之路并不简单。他说:“这是关于使用遗传学对大多数常见疾病进行个性化风险分析的演讲,这是关于大量新药靶点的演讲。我认为这显然是一厢情愿的想法。”位于马里兰州贝塞斯达的国家人类基因组研究所前所长弗朗西斯·柯林斯(Francis Collins)也认为,疾病预测的前景仍然黯淡,但对治疗干预仍持乐观态度。他说,通过全基因组关联发现的大多数基因变异“对风险的贡献相对较小,但这绝不意味着基因不重要。”“这里的治疗机会是惊人的。”位于澳大利亚布里斯班的昆士兰医学研究所的遗传学家Peter Visscher对此表示赞同。“人们很容易抨击(全基因组关联研究),说一切都是承诺的,但什么都没有兑现。但在识别疾病的基因和途径方面,它是非常成功的。
我觉得它极大地推动了这个领域的发展。”最终,全基因组关联研究发现的变异的临床价值可能因疾病而异。尽管如此,一些人认为该领域过于专注于临床应用,无论是通过预测、个性化还是确定药物靶点。加州大学旧金山分校的罗伯特·努斯鲍姆(Robert Nussbaum)直言不讳地说:“人类遗传学研究总是过快地假定它必须是可转化的。他们在做基础研究。”
结构变异(copy number variations)
在结构方面,一些研究人员现在正把注意力集中在拷贝数变异(CNVs)上,这是一种在个体之间被删除或复制的长达数十或数百个碱基对的DNA延伸。这些特征的变异可以开始解释精神分裂症和自闭症等疾病的遗传性缺失,而GW as几乎没有发现这些疾病。最近的两项研究观察了正常人和精神分裂症患者的数百个CNVs,发现疾病与几种CNVs8和9之间存在很强的关联。它们通常在没有任何突变家族史的个体中从头发生。
这些结构变异可能解释了很多人与人之间的基因变异,也可能解释了一些罕见的“隐形”突变,具有中度外显率,而GW AS无法检测到。许多CNVs没有被检测到,因为它们不会改变SNP序列。重复的区域也很难排序。
发现CNVs的一种标准技术是阵列比较基因组杂交,科学家通过这种技术来检测来自不同个体的遗传物质如何杂交到一个微阵列中。如果阵列上的某些点接收到或多或少的DNA,就可能表明存在CNV。英国剑桥的威康基金会桑格研究所下属的一个名为“拷贝号V变异项目”的财团正在测试这项技术和其他一些技术。该联盟致力于描述尽可能多的CNVs,以便在它们与疾病之间建立联系。McCarthy说,隐藏的cnv在遗传力中的作用“应该在未来6个月到1年内发挥出来”。但Goldstein认为,目前的技术将错过许多较小的cnv,从50个碱基对到只有两个碱基的重复。“我们所能验证的只是可识别的巨大的cnv,它们显然不能解释丢失的遗传力。
在地下网络中,大多数基因与密切的伙伴一起工作,在不知道其他基因的影响的情况下,有可能无法发现一个基因对遗传力的影响。这是上位性的一个例子,在这种情况下,一个基因掩盖了另一个基因的影响,或者几个基因一起工作。
例如,两个基因各自可以使身高增加1厘米,但加在一起可以增加5厘米。GW AS不能很好地处理上位性,要想找到这些相互作用,通常需要对相互作用伙伴进行良好的预先猜测。
俄亥俄州克利夫兰凯斯西储大学(Case Western Reserve University)的遗传学家约瑟夫·纳多(Joseph Nadeau)说,“修饰基因”甚至在一些直接的单基因疾病中也起作用。“这是一种简单的上位现象,”他说。例如,囊性纤维化通常是由CFTR基因突变引起的,但症状和严重程度可能有很大差异。人们一直怀疑修饰基因是导致这种变异的原因之一。
但尽管经过了多年的研究,研究人员仍然难以确定这些基因。费城宾夕法尼亚大学的人口遗传学家萨拉·提什科夫说:“人们还没有真正模拟出上性效应的影响。”
遗传学比一个基因,一种表现型,甚至几个基因,一种表现型要复杂得多,这并不奇怪,但意识到复杂得多却让人感到羞愧,在一项经典的研究中,克鲁格拉克和他的同事们发现,大多数酵母基因的表达受几种变异控制,通常超过五种。
为了填补所有遗传力的空白,研究人员可能需要更好、更多样化的整个基因网络和调节序列模型,以及它们如何共同作用产生表现型。在某种程度上,这一过程开始看起来更像系统生物学,研究人员已经将系统方法应用于人类和其他生物(见第26页)。“我们从这些研究中学到的是,我们需要考虑复杂模型中更复杂的部分,而不是复杂模型中更简单的部分,”Kruglyak说
如果遗传力的估计一开始就错了呢?身高的遗传力最初是通过取父母的平均身高,并将其值与后代的成年身高进行比较来衡量的。研究人员发现,随着父母平均身高的增加,他们孩子的平均身高也会增加,因此计算出了80-90%的遗传率。
环境,尤其是在重要生长阶段的营养或毒素等因素,会对一个种群的平均身高产生很大影响——但研究人员在估计遗传力时已经控制了环境因素,例如,通过比较一起抚养和分开抚养的基因相同的双胞胎。大多数研究人员相信,遗传力的估计是可靠的。克鲁格拉克说:“我认为没有人会说身高的遗传率是10%,然后让环境让你更接近答案。”“我认为你解释不了。”但是,对于遗传力研究中如何精确地考虑到环境因素,仍然存在着疑问。英国南安普顿大学的大卫·巴克说,子宫内的不良经历可能会导致终生的健康差异,但共享子宫是环境的一个方面,这类研究不会将其考虑在内。
马诺里奥说:“遗传力的估计基本上是家庭中的群体和家庭中的环境群体。”
表观遗传学是指基因表达的变化是遗传的,但不是由基因序列的变化引起的,它使事情更加混乱。例如,给一只老鼠喂食某种食物,不仅会改变幼鼠的皮毛颜色,还会改变幼鼠后代的皮毛颜色。在这里,一种被称为甲基化的DNA修饰控制了一种皮毛颜色基因的表达,但还不完全清楚甲基化模式是如何被下一代“记住”的。
祖母所处的环境会影响后代的观点是有争议的——这种影响应该包括在通常归因于基因的遗传力中。
“这让一切变得复杂,”纳多说。“我们如何分辨曾祖父和曾祖母在小时候和有孩子的时候接触了什么?”模型生物可能会有所帮助。
纳多研究了小鼠的睾丸生殖细胞肿瘤,这种肿瘤类似于人类的一种高度遗传的癌症。他的研究小组发现,一种弱的、促进癌症的基因Dnd1Ter的效果会被其他几种基因变体大大增强,即使导致这种增强的效果的基因没有被增强,这种增强的效果也会被传递下去。
纳多说:“它大概是在以某种表观遗传的方式传递它的存在。”
然而,表观遗传可能起作用的机制仍然存在争议;在一个人的生命中直接基因表达的标记,如甲基化,似乎在一个新的胚胎中被清除了。
他说,对纳多的观察结果的一个可能解释是,RNA是通过精子或卵子与DNA一起遗传的。
柯林斯不相信表观遗传学将在人类遗传性缺失中发挥重要作用。“除了一两个例子之外,似乎不太可能表明情况是这样的。”Nadeau不同意。他说:“很难想象所有其他生物都以一种方式工作,而人类是例外。”
在研究人员寻找遗传性的过程中,有一种挥之不去的担忧:常见疾病实际上可能并不常见。
医学试图把一系列复杂的症状混为一谈,称之为疾病。但是,如果数千种罕见的基因变异导致了一种疾病,而基因基础对不同的人可能有根本的不同,这有多普遍呢?这些实际上是不同的疾病吗?GW AS实际上可能被证明如此困难,因为研究人员正在一群可能共享很少(如果有的话)的人中寻找共享的易感基因。然而,如果对遗传学没有更深入的了解,就不可能对它们进行更好的分类。“这可能是罕见的变异,常见的疾病。这对人们来说有点可怕,因为很难找到这些东西。”蒂什科夫说。
对于未解释的遗传性,可能还有更可怕、更棘手的原因,甚至还没有被讨论过。克鲁格拉克说:“有一种可能性是,有些东西我们还没有从根本上理解。”“这和我们现在想的太不一样了,所以我们还没想过。”尽管如此,这个谜团仍在继续吸引着它的侦探,不论是对克鲁格拉克还是对许多其他基础研究科学家。他说:“你会看到这种清晰、有形的现象,孩子和父母很像。”“尽管学生们在小学科学课上被告知了什么,但我们就是不知道这是如何起作用的。■布兰登·马赫(Brendan Maher)是《自然》杂志的专题编辑。