行研 | 20余载坐热“冷板凳”,合成生物学风云启示录(系列一)

前言

未来十年,合成生物学将会彻底变革农业、饮食和医疗等领域。2021年,多家合成生物学公司以超过10亿美元的估值上市,基因组工程已渗透到生物科学研究的各个领域,DNA合成、编辑和重新编码正在帮助解决疑难杂症。

合成生物学的本质是Programming life,让细胞为人类工作产生想要的物质,相比于传统化学合成,生物合成具有微型化、可循环、更安全的特点。因此,合成生物学是一个“坡长雪厚”的赛道。据McKinsey统计,全球60%以上的化学方法制造的产品都可以通过生物技术制造,预计未来10到20年,在其已统计的400余个应用场景里面,生物技术应用每年将直接带动4万亿美元的经济体量。

很多人把合成生物学比作21世纪的“天工开物”,那么什么是合成生物学的本质?驱动产业进入蓬勃发展的底层逻辑是什么?产业链上有哪些机会?本文重点解决这三个问题。


一、一个长坡厚雪的赛道——合成生物学

合成生物学的本质是“编码生命”,而生命的本质就是一个信息系统。如果把生物体看作由AGCT编码的信息系统,那么合成生物就是通过编程代码,设计并制造新物种,使其能够行使既定功能。

层层拆解来看,在生物信息系统中,细胞就好比“计算机”,是保障系统运行的物理装置;ATCG碱基就好比“0101二进制运算符”,把信息转化为人类可读的语言指令;DNA则类比为硬盘起到存储代码的作用;mRNA好比Windows系统;蛋白质则为应用软件,最终实现不同的功能。在整个生物信息系统中,通过编码生命实现合成生物,下游则可以应用到生物制造、医疗制药、碳中和、DNA存储等创新应用中。

图 生物学类比计算机如何实现编码生命

其实在人类文明的长河中,在关系到自身命运的问题上,人们一直在追求违背自然法则。工业革命之后,对化石能源的疯狂消耗释放了大量二氧化碳、制造无尽的垃圾和污染,进入21世纪以来,人们一直在追求找到一种方法让人类文明与自然系统重新融合,合成生物学恰好能够在这两个方向上同时满足人类的需求。

2000年-2003年是合成生物学的理论创建时期,基因线路在代谢工程领域的应用是这一时期的代表,2002年人类首次合成了病毒,2003年在大肠杆菌中实现了青蒿素前体途径的工程化。

2004年-2007年是合成生物学的扩张期和发展期,这一阶段基础研究快速发展,工程化理念日益深入,2004年MIT举行了第一届IGEM(国际基因工程机器大赛),虽然合成生物学的应用领域扩大,但总体工程技术进展缓慢。

2008年-2013年,基因编辑效率大幅提升,新技术和工程手段涌现,应用从生物基化学品、生物能源拓展至疾病诊断、药物和疫苗开发、作物育种、环境监测、生物新材料等领域。2010年5月,美国生物学家克莱格·文特尔(Craig Venter)教授和他的团队就合成了一种原核生物——丝状支原体。

2014年之后,生物技术与信息数据融合的发展特点更加明显,半导体合成生物学、工程生物学等理念相继提出。

图 合成生物学的发展历史

从产业视角来看,合成生物学的第一个十年(2000-2010)主要发展了学科理论基础,从第二个十年(2011-2020)开始,随着工程化理念日渐深入,技术平台得到重视,工程方法和工具不断积淀,合成生物学产业化加速2015年以来全球合成生物学相关的论文发表量呈现“井喷式”增长,2020年一年全球相关论文发表量超过2000篇,而全球合成生物学企业融资事件数量和金额均创下历史记录,分别为189起和56.6亿美元

图 近十年合成生物学产学研井喷式增长

时至今日,合成生物学已经走出实验室,在各个方向实现产业化。正因如此,学术带头人或将决定合成生物学的发展方向。国内的合成生物学产学研圈也呈现出学术背景聚集的特点,比如中国科学院深圳先进技术研究院、清华大学、上海交通大学、北京大学、中国科学院、南京农业大学、西北大学、中国农业大学等在合成生物学领域比较突出。

图 全球合成生物学领军人物关系谱

二、合成生物学如何实现编码生命?

合成生物学如何实现编码生命呢?以人造肉龙头公司Impossible Foods为例,要经历创意产生——产品设计——细胞编码——产品商业化几个阶段。

首先第一个环节是创意产生,人们为什么需要人造肉?并不是为了单纯满足素食主义者的需求,而是传统肉类生产方式存在很多问题,面临可持续性的挑战,比如美国人对牛肉的需求量极大(美国每年消费的所有肉类里,碎牛肉占了60%),饲养牛对土地、饲料、水的消耗量极大(生产1公斤牛肉,需要消耗16公斤谷物和1.5万升水),牛肉生产对环境影响也很大(现在全球温室气体排放中,有15%是因为养牛造成的)。

第二个环节就是产品设计,人造牛肉怎么做?牛肉的成分中除了蛋白质、脂肪、水以外,还有一个重要成分“血红素”,这是一种在所有动植物中发现的蛋白质,是赋予肉以标志性味道的成分。

第三个环节就是细胞编码,也是合成生物学的核心步骤。Impossible Foods通过测试各种血红素蛋白,最终决定使用一种大豆生产的蛋白质血红蛋白,把血红素的基因元件放进酵母里,用酵母合成,再加入肉饼之中。在整个细胞编码的过程中,需要经历设计-构建-测试-学习的循环,以确定最佳的生物合成途径。

第四个环节就是产品商业化,常使用生物发酵进行生产。比如Impossible Foods在奥克兰建立生产基地,部分生产外包给OSI集团。

图 以Impossible Foods为例,合成生物学如何实现编码生命

从上述人造肉的例子中可以看到,合成生物学涉及两大要素:一是生物技术本身,二是自动化和数据科技。现在大多数常温常压下的有机物质,基本都可以拿生物来合成,其中的区别在于是否能实现经济性。

驱动合成生物学大发展的原理有三大底层逻辑,分别是工程思维、数据驱动、加速进化。而跨学科结合则是合成生物学的“灵魂”。

工程思维的核心就是“模块化”和“标准化”。我们在开头提到过,生命的本质就是一个生物信息系统,那么这套系统中的生物元件就是具有单一且明确功能的DNA片段,包括启动子、中止子以及其他基础功能序列。这些生物元件组合装配形成生化反应,再通过生物装置连接组成的线路和调控网络就形成生物系统。

生物元件的标准化大大推动了合成生物学的产业应用。而解决标准化问题的是几位哈佛和MIT的工程师,以Tom-Knight和Drew Endy教授为代表,他们建立了一个数据库,叫“标准生物学组件登记库(Registry of Standard Biological Parts)”。这个数据库里有各种各样的基因元件,截至目前已经累积了2万多个。而且还设计了一套标准的组装流程,这样就能像拼乐高一样拼这些基因元件。

模块化和标准化奠定了合成生物学的基础,也推动了这个行业的横向分工,一部分人专门去解析基因元件的功能继续做科研,另一部分人用这些基因元件去组装新的生命系统。

图 合成生物学底层逻辑之“工程思维”

因为工程思维的引入,我们可以像拼乐高一样组装生命,但是因为合成生命对精准度的要求极高,导致最终成功率很低。解决这一问题最简单的办法就是多实验、多测试,但这无疑加大了工作量而且也不够精准。想要提高合成生命的成功率,就需要结合计算机科学,通过数据驱动,用计算机来模拟生命,这也是合成生物学的第二个底层逻辑。

如果我们要合成的生命功能自然界根本没有,那么就需要合成生物学的第三个底层逻辑,即“加速进化”。生物的进化需要两个条件,一是“基因突变”,二是“自然选择”,而加速进化就是人为改变这两个条件。

对于合成生物学而言,加速进化的方法从随机逐渐走向理性设计。过去获得新菌种主要依靠诱变育种,这项技术本质上是制造大量随机突变后进行筛选。好处是操作简单、适用范围广,但缺点在于突变随机性高、而且突变频率难以控制。

后来逐步发展出了经典代谢工程和系统代谢工程,这两种策略对已知功能的基因片段进行理性/半理性的改造。相比随机突变,理性/半理性设计大大提高了开发菌种的效率,但受限于构建、测试通量以及对生物基因组功能的认识。

随着数据科学的发展,基因测序技术提供了海量的基因组信息,利用大量的生物学数据,有望建立起“序列-功能”的黑箱模型,从而绕开现有理论的知识瓶颈,实现全基因组层面的细胞工程设计,将未知功能基因的发现和改造相结合。

图 合成生物学底层逻辑之“加速进化”

三、产业浪潮来临,哪些行业将迎来巨大机会?

新技术的诞生涌现出了一批为合成生物学相关公司提供基础产品和服务的公司,如DNA/RNA设计和合成、相关软件和生物体设计与自动化平台等领域的公司。典型代表如Twist,已经建立了高通量、低成本的新一代硅基DNA合成平台,可以大量合成高质量的DNA片段及基因,用于药物开发实验和临床诊断等场景。

而在产业链中游,也涌现出一些在生物体设计与自动化平台领域的公司。他们借助软件和硬件解决方案的结合,使得人们可以快速高通量地设计、构建、测试和优化生命体。典型代表如Ginkgo Bioworks,其定位于平台,更专注于合成生物学价值链的设计环节。其通过建立规模庞大的宏基因组数据库,绘制基因、蛋白质和代谢途径,并借助生物铸造厂和机器学习来不断地运行DBTL周期,以设计适合生产目标产物的微生物,为下游合作伙伴提供模块化的解决方案。

图 合成生物学产业链

而在下游,合成生物学则可以在人类衣食住行方方面面进行应用开发和产品落地。合成生物学在医疗健康领域的应用广泛,涉及细胞免疫疗法、RNA药物、微生态疗法、基因编辑相关应用、体外检测、医疗耗材、药物成分生产和制药用酶等多方面。

从下游应用的行业空间来看,合成生物学下游产品市场2024年将超过180亿美元,其中医疗健康板块占据主导地位,市场空间超过50亿美金,CAGR达19%。

图 合成生物学市场空间

合成生物学的发展要归功于多种技术的融合,包括DNA/RNA设计和合成、基因测序和基因编辑等基础技术,以及一系列不断扩展的技术,如计算、生物信息学、多组学、人工智能、自动化、3D 生物打印和精密发酵等。

基因编辑、基因合成、基因测序,这些都是底层生物技术。过去十年间,人们对DNA进行读、改、写的技术发展速度超过了摩尔定律,技术成本降低了1000倍以上。现在考验生物技术企业的核心竞争力不是能否实现的问题,而是是否能做更高的通量,获得更高质量的数据,这就需要借助自动化和数据科学。

图 技术构建成本降低,效率提升

另外,对经济效用的追求也是驱动合成生物学大发展的主要原因。以青蒿素为例,青蒿素是治疗疟疾的重要药物,屠呦呦因发现青蒿素在2015年获得诺贝尔生理或医学奖。而传统的青蒿素获得方法需要从种植的青蒿中提取,占用大量的土地,产量受气候等外部因素的影响不稳定,成本高昂(美元级)。而Amyris的创始人Jay D Keasling教授利用合成生物学方法编程酵母合成青蒿素,并实现工业化生产,不受气候等外部因素影响,产量大,成本低(美分级),节约大量土地。

合成生物学显现出的巨大的ESG价值已经引起全球各国的关注。OECD对6个发达国家进行分析的结果表明:生物制造技术的应用可以降低工业能耗15-80%,原料消耗35-75%,空气污染50-90%,水污染33-80%,生产成本降低9-90%。世界基因委员会预测,到2030年,工业生物技术每年将可降低25亿吨的二氧化碳排放。

近年来合成生物学不断获得政策支持,在“十四五”规划中,合成生物学应用被列入“发展壮大战略性新兴产业”,“加快发展生物医药、生物育种、生物材料、生物能源等产业,做大做强生物经济”。各地也相继出台产业扶持政策,天津建设国家合成生物技术创新中心,打造“细胞谷”、“生物制造谷”等特色园区;广东建立合成生物研究重大科技基础设施,深圳光明科学城重点发展合成生物学等细分领域,支持合成生物创新链产业链融合;山西打造全国领先的生物基新材料产业制造基地,阳曲片区重点发展合成生物全产业链。


结语

随着2021年多家合成生物学公司在美股上市,国内投资界也掀起了一股“投资热”,但正如巴菲特所说,“只有当潮水退去时,你才会知道谁一直在裸泳”。本文是我们合成生物学系列行研的上篇,下一篇文章中,我们将重点分析如何去伪存真鉴别真正的合成生物学公司?以及在这股浪潮中,上游企业如何赋能整个生态?中游平台型企业到底做对了什么能够脱颖而出?以及通过哪些维度来筛选优质的下游项目?敬请期待。


免责声明

相关内容基于已公开的资料或信息撰写,但本公司不保证该等信息及资料的完整性、准确性,所含信息及资料保持在最新状态。同时,本公司有权对本报告所含信息在不发出通知的情形下做出修改,阅读者应当自行关注相应的更新或修改。

在任何情况下,本篇文章中的信息或所表述的意见均不构成对任何人的投资建议,无论是否已经明示或暗示,本报告不能作为道义的、责任的和法律的依据或者凭证。在任何情况下,本公司亦不对任何人因使用本文章中的任何内容所引致的任何损失负任何责任。本文章仅为本公司所有,未经事先书面许可,任何机构和个人不得以任何形式翻版、复制、发表、转发或引用本报告的任何部分。