基因编辑系列1-生命及其底层代码

发布于: 雪球转发:0回复:0喜欢:3

一、序言

周末去看了场《海王2》电影,电影一般般,结尾更让我一脸问号,比较印象深刻的就是海王的侦察兵,一个名叫托波的章鱼,能力出众,可以隐身、潜行、阻敌等等。那么为什么一只章鱼能这么厉害呢,据海王的母亲透露,是因为它使用了基因工程技术,也就是说通过对托波的底层代码DNA的改变获得了各种能力。

如今出现在超级英雄电影中的技术,终于有希望照进现实。当地时间2023年12月8日,美国食品药物管理局(FDA)批准了两种治疗镰状细胞病( SCD)的基因疗法“Casgevy”(Vertex Pharmaceuticals和CRISPR Therapeutics公司联合开发)和“Lyfgenia”(bluebird bio公司开发)上市。标志着基因编辑药物的正式上市。

其实在稍早时候,当地时间11月16日,英国药品和医疗保健产品监管局(MHRA)已经宣布授权CRISPR/Cas9基因编辑疗法Casgevy(exa-cel)有条件上市,用于治疗镰状细胞病(SCD)和输血依赖性β地中海贫血(TDT)。此外,当地时间12月15日,欧洲药品管理局(EMA)也批准Casgevy上市,用于治疗SCD和TDT。

基因编辑药物的首次上市,将对人们的生活产生重大影响,资本市场也基本给予了正面反应。对于我们来说,自然而然会产生一些重要的问题,如什么是基因编辑?其工作原理和发展历程是什么样的?与其他常见的疗法有何不同?主要公司有哪些,各有哪些优劣?如何看待和应对基因编辑的投资机会?我们将通过一个系列文章对这些问题谈一谈我们的看法,本文作为开篇,我们首先对基因编辑背后的大图景,即生命演化及其底层代码DNA进行简单的介绍。

二、生命的演化及人类认知的进步

生命,这一具有能量代谢、回应刺激、进行繁殖的开放系统,从诞生之始就无时无刻不在处于演化和运动之中。

38亿年前,某个深海岩浆附近的高温区域处,作为现代生命起源的生命始祖LUCA(Last Universal Common Ancestor,LUCA)在众多生命形式中脱颖而出,确立了生命最底层的DNA代码系统并最终进化形成了三界生命,即真核生物、原核生物和古细菌。

38亿年后,经历了漫长的风风雨雨,跨过进化史上一幕幕壮丽的画面之后,达尔文(Charles Robert Darwin)、孟德尔(Gregor Johann Mendel)、克里克(Francis Harry Compton Crick)、沃森(James Dewey Watson)、卡彭蒂耶(Emmanuelle Charpentier)、杜德纳(Jennifer Doudna)、张锋等群星闪耀,蒙在生命及其底层代码之上的面纱被一个个揭开,宣告一种能够理解这个代码乃至操控这个代码的崭新生物终于在这个底层代码之上被构建出来。

纵观历史,人类对生命及其底层代码的认识是层层递进的。这其中最具标志性的事件是自然选择学说和物种进化论的提出。

19世纪中叶,达尔文提出这一学说揭示了生命起源和演化历程,目前已经成为现代社会的常识之一。

此后人们开始对遗传学及DNA进行研究,对DNA的机制、模型有了深入认识。

19世纪末,孟德尔对豌豆杂交试验的后代进行观察和统计分析,发现了基因的分离定律和自由组合定律,开创了遗传学。

20世纪初,摩根(Thomas Hunt Morgan)等人通过果蝇杂交实验确定了基因在染色体上的分布规律,发现了基因间存在着连锁和交换现象也就是遗传学第三定律。

1915年,经科学界严格论证后,《孟德尔遗传论的机制》一书横空出世,首次以染色体理论阐释遗传现象。

1941年,比德尔(George Wells Beadle)提出了“一基因一酶”假说,该理论认为每个基因直接产生一种酶来影响新陈代谢过程中的一个步骤。

1944年,艾弗里(Oswald Avery)等人通过肺炎链球菌的转化实验,证明了遗传物质是DNA。

1953年,沃森和克里克提出了DNA分子的双螺旋结构模型。

而后,在对DNA认识的基础上,人们开始试图对这一底层代码进行控制的研究。

1979年,利用酵母等内源重组效率高的单细胞生物实现基因替换,原始的基因编辑(Gene editing)登上历史舞台。

1984年,我国科学家朱作言领导的团队培育出世界上第一条转基因鱼。

1990年,人类基因组计划启动,2003年该计划的测序任务顺利完成,人类拥有了对自身基因的图谱。

2012年卡彭蒂耶和杜德纳发明了第三代基因编辑工具CRISPR(Clustered regularly interspacedshort palindromic repeats,成簇规律间隔短回文重复)。

2013年,华人科学家张锋及其团队首次报道利用CRISPR技术编辑了哺乳动物基因组,标志着我们对生命底层代码的理解和应用进入了新的时代。

三、生命底层代码的作用及影响

在进一步介绍我们的主角基因编辑之前,我们有必要对几个问题进行梳理:一是对DNA、染色体、基因、基因组这四组概念做一个区分;二是对DNA在生命体中的作用做一个简单的回顾;三是对DNA与基因疾病和遗传性疾病的关系做一个简单的介绍。

首先,DNA(DeoxyriboNucleic Acid,脱氧核糖核酸)是一种由脱氧核糖核苷酸组成的大分子聚合物。脱氧核苷酸由碱基、脱氧核糖和磷酸构成。其中碱基有4种:腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。

DNA分子结构中,两条脱氧核苷酸链反向互补,通过碱基间的氢键形成的碱基配对(base pairing)相连,围绕一个共同的中心轴盘绕,构成双螺旋结构。脱氧核糖-磷酸链在螺旋结构的外面,碱基朝向里面进行配对(A与T配对,C与G配对)。

其次,染色体是细胞核内由DNA和蛋白质组成、能用碱性染料染色、有结构的线状体,是遗传物质基因的载体。

再者,基因是DNA的一个独特部分,或者说带有遗传讯息的DNA片段称为基因。基因是制造身体所需一切物质(尤其是蛋白质)的编码指令。最后,基因组则是指生物体所有遗传物质的总和,包括编码DNA和非编码DNA、线粒体DNA和叶绿体DNA等。

DNA通过蛋白控制影响着生命的活动和表征。DNA转化为蛋白质的过程分为两大步,第一步是DNA转录(transcription)为mRNA(messenger RNA,信使RNA,是DNA转化为蛋白质的中间体),发生在细胞核内;第二步是mRNA转译(translation)为蛋白质,发生在细胞质中。这一条转录转译链被称为生物学“中心法则”(The Central Dogma)。

通俗来讲,DNA类似于底稿文件,其发生的改变会一直存在于体内,由此细胞分裂新产生的细胞也会继承这些改变,因此DNA的改变有很大概率会伴随一生,其中性细胞中DNA的变化甚至能够遗传至下一代。

mRNA类似于说明书,能够指导自身细胞生产出特定的蛋白。蛋白则是最终生产得到的工具,对生物个体的各项指标直接产生作用。mRNA或蛋白的变化不会被继承或遗传。

除了通过蛋白质影响生命外,大部分DNA序列更类似于一些管理文件,起着调节、控制、调度的作用,比如决定在什么时候调用哪个DNA程序,如何为这些DNA程序分配资源等等。

拿人类来说,我们的基因组包含约30亿个DNA碱基对,所有的遗传秘密都蕴藏其中,而作为人类遗传物质存储载体的DNA则深藏在细胞核中。正是因为它太重要了,受到细胞结构和人体免疫机制的层层保护,不易发生改变。

另一方面,一旦DNA发生改变出现基因异常时,常常导致基因疾病,且DNA异常通常会伴随患者一生,且有很大概率遗传至后代,形成遗传性疾病,传统医学往往对此束手无策。此外,许多罕见病是由基因缺陷造成的。大部分具有缺陷的基因,会导致基因的携带者难以生存。患者负担大,缺乏有效的治疗手段,因此许多基因疾病/遗传疾病都属于未被满足的医疗需求。

基因编辑的出现则为这类未满足的需求带来了曙光,它在基因治疗中拥有巨大的发展前景,为单基因遗传病、癌症等疾病提供新的治疗方法。

除此之外,基因编辑还可以被用于进行表达调控和基因功能的研究、细胞动物模型的构建、癌基因和药物靶点的筛选、农作物的改良、生物能源的生产,等等。如上所述,MHRA、FDA和EMA依次批准了基因编辑药物的上市。这标志着,尽管仍面临这样那样的问题(如安全问题、伦理问题等),但是基因编辑这一新次元的大门已经轰然打开,一个新时代正在向我们缓缓走来。