“原子”、“字节”、“基因”这三个概念,对应着“物质”、“信息”与“生物”三大领域,在20世纪取得了快速发展。人类基因组大约包括21000至23000个基因,它们在人体生长发育、细胞修复以及功能维持方面起着决定作用。诗人华莱士曾写道“化零为整,化整为零”。因此只要我们理解最小单元组成就可以把握整体情况。
本书《基因传》,讲述了人们对基因认知更新的历史,是一本视角独特的基因科学史。光量荐书2018年第4期,推荐《基因传:众生之源》,作者印度裔美国医生、肿瘤专家悉达多·穆克吉(Siddhartha Mukherjee),译者马向涛博士。
一、孟德尔的豌豆:基因研究的真正开始
早期人们对基因与遗传的认识是模糊的。像“微缩人”的概念,以及亚里士多德提出的父母对胎儿的贡献分别是“信息”和“材料”等观点,都只是古人的大胆想象。虽然彼时已经认识到“生命起源,始于创造”,但在过去的两千年中,遗传学并无实质性进展。即使是达尔文,也仅仅是提出了“泛子微粒”的概念。直到孟德尔的发现,才开启了基因研究的正确方法。
1843年,孟德尔来到了位于布尔诺的圣托马斯修道院,并在1847年被任命为神父,并获得新的教名:格雷戈尔·约翰·孟德尔(Gregor Johann Mendel)。孟德尔在修道院期间一直对生物科学保持着极大的热情,于是在当地的学校兼职做老师。可惜他一直都没有通过教师资格考核,只能做代课老师。在修道院的资助下,孟德尔去维也纳读了大学。并有幸上了多普勒教授(就是发现多普勒效应的那位科学家)的物理课。多普勒成了孟德尔的学术偶像。
1853年孟德尔从周边农场收集到了34个品系的豌豆进行培育,希望能筛选出纯种品系。孟德尔发现了反映纯育的不同性状,比如:种子形状(圆粒与皱粒)、种子颜色(黄色与绿色)、豌豆花颜色(白色与紫色)、植株高度(高茎与矮茎)等。后来,生物学家们将这些性状序列定义为“等位基因”。
孟德尔牧师与他的豌豆杂交实验
1857年,孟德尔开始对杂交出来的豌豆进行再杂交,构建了“杂合体的杂合体”,整个实验进行了8年。1866年,孟德尔将他的研究整理成了一篇题为《植物杂交实验》,仅44页的文章,发表在了《布尔诺自然科学协会学报》上。等待这篇划时代意义论文的命运却是沉默。从1866年到1900年期间,这篇文章仅仅被引用了4次。后来孟德尔升任了修道院的院长,他科学上的才华被越来越多的行政事务给淹没了,直至于1884年辞世。
幸运的是,1900年,英国生物学家威廉·贝特森发现了孟德尔的论文,大受震惊,立刻就被征服了,并以传播孟德尔定律为己任。1905年,贝特森自己创造了一个新名词“Genetics”,也就是遗传学(其词根来源于希腊语“genno”(诞生))。贝特森认识到,如果基因确实是独立的信息微粒,那么我们就有可能实现定向选择、纯化以及操纵这些微粒。我们就可以对优良的基因进行选择或者扩增,并清除不良基因。
同时,贝特森也认识到“人们会自然而然的服从权利的意志,不久之后遗传学将会为人类社会变革提供强大的推动力。”后来席卷欧美的优生学,残害了不少人的性命,包括美国优生学运动中被无辜关进了精神病院并被法院强制执行了绝育手术的卡丽·巴克和纳粹德国执行的种族清洗计划中受害的人。优生学的提出,让众生之间在生物学意义上不再平等。
(另推荐电影《千钧一发》,可以了解基因改性人与普通人在伦理上的冲突)
二、定位基因
1907年,哥伦比亚大学的动物学教授托马斯·摩尔根被来访美国的贝特森宣讲的孟德尔的理论所征服。随后的1910年到1912年,摩尔根与他的学生对数以万计的果蝇进行了杂交实验。摩尔根发现一种惊人的模式,某些基因看起来就像是彼此相互“连接”在一起。例如控制白眼的基因与Y染色体如影随形,密不可分。某种黑体基因与某种特定形状的翅膀基因紧密相关。摩尔根提出,基因不会单独旅行,相反总是结伴而出。并且,摩尔根将基因定位在了染色体上。如果把染色体比作一根绳,那么基因就像是穿在上面的一粒粒的珠子。
狄奥多西·多布然斯基是一位乌克兰裔美国生物学家。多布然斯基通过捕捉野生的果蝇并在实验室不同环境下培养,发现调控温度可以改变原有基因出现的频率。于是提出了基因型和表现型的概念。而变异显然是一种常态,是生物体的某种重要储备,以备适应环境的变化。而每种变异并无优越性可言,只是适应不同环境而已。
然而席卷欧美的优生学和种族主义,其判断优越性的标准又是什么呢?真正的优生学不可能在社会平等出现之前而出现。毕竟流浪、贫困只是社会不公的体现,而不是生物上的遗传病。让人耻辱的优生学运动在二战后才慢慢结束。
1940年,62岁的奥斯瓦尔德·埃弗里确认了,光滑型有毒肺炎球菌分离出的细胞碎片可以将无毒的粗糙型肺炎球菌转染成有毒的光滑型。随后在科林·麦克劳德和麦克林恩·麦卡蒂的协助下,三人分离提纯感染了光滑型有毒肺炎球菌的细胞碎片。他们发现,就是DNA(脱氧核糖核酸)携带了遗传信息,将无毒的粗糙型肺炎球菌变成了有毒的光滑型肺炎球菌。1944年,埃弗里关于DNA的论文正式发表,遗传物质基因就位于DNA上。可惜,埃弗里的发现因受瑞典化学家艾纳·哈马斯登的排斥而未获得诺贝尔奖。
遗传信息被证实存在于DNA上之后,全球的相关科学家都将注意力放在了破译DNA结构上。最终的胜利者是属于伦敦国王学院的女权主义科学家罗莎琳德·富兰克林、莫里斯·威尔金斯(新西兰人)和剑桥大学的23岁的詹姆斯·沃森、35岁还没博士毕业的弗兰西斯·克里克。富兰克林擅长拍摄DNA的衍射照片,重点研究A型DNA(含水量低)。威尔金斯擅长理论却不擅长DNA合成,重点研究B型DNA(含水量高)。富兰克林和威尔金斯几乎在敌对状态下开展着各自的工作。年轻的沃森和克里克像玩积木一样,尝试凭借自己想象和计算,搭建出DNA的模型。最终,沃森和克里克在富兰克林的DNA衍射照片启示下,天才般的拼积木似的构建出了DNA的双螺旋模型:两股DNA链缠绕在一起构建成了双螺旋结构,直径23埃,A(腺嘌呤)与T(胸腺嘧啶)配对,C(鸟嘌呤)与G(胞嘧啶)配对。
沃森、克里克与他们的DNA模型
1953年,沃森与克里克在《自然》上发表了《核酸分子结构:脱氧核糖核算结构》,随后富兰克林与戈斯林合作撰文,提供了晶体学证据。威尔金斯又从晶体实验获得的数据进一步印证了该模型的正确性。1962年,沃森、克里克、威尔金斯因此而获得了诺贝尔奖。而年仅37岁的富兰克林不幸于1958年因卵巢癌扩散而去世,未能获奖。
1945年,乔治·比德尔发现基因可以指导蛋白质分子折叠成最终的构象,并因此获得了1958年的诺贝尔奖。此时,从DNA到蛋白质之间的具体过程却还不清楚。弗朗索瓦·雅各布与弗朗西斯·克里克及悉尼·布伦纳三人共同认为在DNA与蛋白质之间存在一定的信使,传递翻译遗传信息。后来他们证明这位信使就是RNA(核糖核酸)。RNA是单链,由A、G、C、U组成。
可是遗传信息或遗传密码究竟是什么?在沃森与克里克看来,单个的碱基(A、C、T、U)所能传递的信息有限。生物体内的蛋白质则由20种氨基酸构成。随后科学家们破译出,由三个碱基组成一个“三联体”指向一个氨基酸。克里克称这种遗传信息流从DNA到RNA,再到蛋白质的流程为“中心法则”,遗传信息不逆流,只能沿此路径正向流动。当然后来证明,也有可以逆流的特例。
至此,基因的秘密似乎越来越清晰了。
三、重组DNA与基因泰克公司的故事
1970年,斯坦福大学的保罗·伯格和他的学生戴维·杰克逊,成功地将一段来自细菌病毒和三个来自大肠杆菌的基因连接到了完整的SV40病毒上。虽然DNA之间的拼接效率极低,但不同物种之间的DNA实现了连接,却是重大突破。伯格将这种杂合体称为“重组DNA”。
加州大学旧金山分校的赫伯特·博耶和斯坦福大学斯坦利·科恩教授同样关注到了重组DNA。博耶通过纯化酶使制备基因杂合体的效率得到了大幅提升,而科恩则分离出了可以轻易地在细菌中进行选择与扩增的质粒。1973年2月,博耶与科恩用限制性酶切开两个细菌质粒,并交换遗传物质,再用连接酶将DNA杂合体封闭,再植入培养皿中的细菌快速繁殖。改造后的DNA得到了表达及快速复制,基因克隆实现了。
基因泰克公司
1975年的冬天,28岁的风险投资人罗布特·斯旺森(之前投资的项目全军覆没,已经失业)找到了博耶,原本计划聊10分钟的会谈,变成了马拉松式的长谈。两人约定就DNA技术成立公司。各自投入500美元,用于创建公司的法律费用。随后斯旺森写了6页的商业计划书向老东家凯鹏华盈融了10万美金。全球第一家生物技术公司基因泰克成立了。他们推出的第一款产品就是利用重组DNA技术快速生产胰岛素,代替当时从动物中提取的低效方式。基因泰克公司大获成功。现在基因泰克公司(已被罗氏制药收购)已经成为世界上最大的生物技术研究体。
四、人类基因组计划
渡过了早期优生学的错误之后,随着人们对基因认知的提升,人们开始针对基因导致的疾病展开系统性科学研究。像1960年代首次报道的唐氏综合征,就是因为多了一条由300多个基因组成的额外的21号染色体。亨廷顿病是因为显性亨廷顿基因导致,病人会手舞足蹈直至死于营养不良、痴呆或感染。基因突变是统计学上的概念,无关病理或道德层面。但在常规评判标准下,很多疾病发生的源头都是基因。人类需要对基因进行普查。
1989年,美国国立卫生研究院牵头的人类基因组计划启动了。人类基因组计划采用逐步克隆法,一点一点一段一段的对基因进行测序。这样可以保证不遗漏,不搞错顺序,当然效率是低下的,成本是高昂的。名不见经传的生物学家克雷格·文特尔厌倦了效率低下的测序方式和权力斗争,离开了国立研究院,成立了自己的私人基因测序机构The Institute for Genomic Research,简称TIGR。随后文特尔又成立了Celera公司。文特尔采用鸟枪测序法,将DNA打断成片段,同时对不同的片段进行测序,之后再将之按顺序拼接起来。这种方法效率明显比逐步克隆法要高很多,当然出错的概率也要高。但在认知基因组的早期阶段,鸟枪测序法还是取得了巨大成功。
2000年6月26日,克林顿总统在白宫接见了文特尔和柯林斯(当时的人类基因组计划领导者),并对外宣布人类基因组初步测序首战告捷。事实上无论是Celera公司还是人类基因组计划当时都没有真正完成测序。
五、基因调控、基因治疗、基因诊断、基因编辑
虽然现在我们已经完成了基因组测序,但我们对基因的认知及其作用机制还是不清晰的。比如某些基因的开启与关闭,如SRY基因调控人的性别的基因。荷兰二战期间冬日饥荒中怀孕生出来的小孩,长大后具有较高的配胖综合症和心脏病发病率。基因似乎具有记忆等问题。
基因治疗,就是将基因导入人体或细胞用来矫正遗传缺陷,特别是单基因决定的疾病。基因治疗是作用强大的全新医疗技术手段,但道路依然是坎坷的。1999年,患有OTC基因缺陷(OTC基因突变后,导致分解蛋白质的鸟氨酸氨甲酰基转移酶的缺失)的杰西接受了基因治疗,然而当携带着OTC基因的病毒载体涌入杰西的肝脏后,引发了过免疫反应,四天后杰西被宣布脑死亡。
基因诊断,即通过测序基因去预测一个人临涣疾病的风险,甚至预估寿命。似乎也遇到了技术和伦理上的挑战。即使存在某种致病基因,并不一定会导致某种疾病的发生。此时,需要我们做出选择是否要做一个预生存者,即在知道生命评估预期的情况下生存。
而近几年兴起的基因编辑,特别是以加州大学伯克利分校的珍妮弗·杜德娜教授与伊曼纽尔·卡彭蒂耶提出的CRISPR基因编辑方法,似乎为改造基因提供了切实可行的工具。但此时出现了伦理问题。2015年春季,包括珍妮弗·杜德娜在内的众多科学家在人类基因编辑国际峰会上签署了一项联合声明,他们呼吁暂停基因编辑与基因改造技术在临床领域,特别是在人类胚胎干细胞中应用。问题的症结在于不是基因解放(摆脱疾病)而是基因增强(摆脱人类基因组编码的形式与命运)。
加州大学伯克利分校Enbo Ma教授
(光量资本在4月份于硅谷举办的硅谷深科技与亚洲市场论坛上,有幸邀请到了杜德娜教授实验室的Enbo Ma教授为我们分享了CRISPR基因编辑技术)
六、人类遗传学的三大挑战
现在人类遗传学还面临着三项挑战。其中第一项就是辨识人类基因组中信息编码的确切本质。人类基因组中有32亿个碱基对,其中参与蛋白质编码的基因只有不到3%,剩余的基因包括可以构建成成千上万的RNA的碱基对,他们的功能到底是什么呢?第二项挑战就是基因组中各个元件的作用机制,在时间、空间上,在人类胚胎发育、生理功能、生物属性上是如何调控的。就像我们发现了一堆的数字,但是我们还不知道乘法口诀一样。第三项挑战就是如何定向的改变基因组的能力,局部的改变会不会引起蝴蝶效应,甚至系统性崩塌。这即受制于我们的生物技术本身,也受制于伦理。
笔者在阅读完此书后,有幸与本书的中文译者马向涛博士取得了联系。马博士认为基因技术是未来发展的重要方向,但在临床应用上,还要遵循临床的科学规律,不是一蹴而就的。
光量荐书,2018年第4期推荐《基因传:众生之源》给大家,愿大家可以通过此书了解基因,了解生命的本质。