行研 | 2020变构药物爆发元年,AI+变构技术重塑难成药靶点的新药研发

前言


2020年是变构药物研发企业的上市元年:

1 月

Black Diamond Therapeutics在纳斯达克上市,成为业内第一家变构药物研发上市公司,历史投资人包括Boxer Capital,NEA恩颐投资等,目前市值约10.1亿美元

2 月

变构药物研发公司Revolution Medicines在纳斯达克上市,历史投资人包括Boxer Capital,Vivo Capital,Fidelity等,目前市值约32.05亿美元

7 月

基于计算技术的AI+变构药物研发公司Relay Therapeutics在纳斯达克上市,历史投资人包括软银愿景基金,GGV纪源资本,Google Ventures等,目前市值约39.61亿美元

12月

国内变构药物研发公司加科思在港股上市,历史投资人包括礼来亚洲,高瓴资本,启明创投等,目前市值154.3亿港币

同时,2020年AI+变构赛道融资也十分火热:

5 月

HotSpot获得SR One领投,Tekla Capital Management等跟投的6500万美金B轮融资

“孙子兵法云:凡用兵者,以正合,以奇胜”

目前常规靶点的正位小分子药物开发赛道已极为拥挤,与此同时,为数众多的难成药靶点却仍是小分子领域的一片蓝海,而专注于克服难成药靶点的变构机制药物成为了闪亮的新星。

 

将人工智能和数字化技术应用于变构药物研发,可有效解决变构药物由来已久的位点发现与先导化合物发现/优化问题,完成变构药物研发从0到1和加速成药(从1到10)的突破,大大拓宽了人类新药研发的边界。

1. 人工智能可提高新药研发成功率,为全球生物制药行业节省数百亿研发成本

如同已有数千年历史的围棋以及流传于世的半本棋谱一样,传统的新药研发往往高度依赖大师(资深专家)以及各个研究小组长期积累的不传之秘(know-how)。而在AlphaGo出现之后,曾经的灵光一现成为了机器的计算结果,曾经身经百战的大师不得不弃子认输。

人工智能正在重构一个又一个行业,从搜索引擎到自动驾驶,从语言翻译到疾病诊断,不断改变着人类的生活。如今,面对人口老龄化及不断增长的肿瘤发病率,许多疾病仍然缺乏有效的治疗方法,人类对新药的需求比以往任何时候都高。将人工智能技术引入新药研发,可以帮助我们基于数据及算法建立对药物开发的全新洞见,从而最终重塑药物研发行业。

1.1 新药研发痛点:推向市场的周期长,成功率低,费用高

新药研发面临着研发周期长,成功率低,费用高的问题,提升投入产出比是当前药企发展的重要议题,AI技术的引入将会是一个强有力的突破点,因此,近年在AI制药领域诞生了数百家创业公司。

传统的药物研发从发现到上市周期长(平均14年),成功率低(低于10%),费用高:包括3-6年的研发和临床前工作,平均需花费超过5亿美金推进到IND阶段,再进行6-7年的临床试验,通过数百至数千名志愿者的参与,平均需花费超过4亿美金推进到上市阶段。

 

(图:新药研发的支出越来越高,而FDA批准的新药上市数量呈下降趋势)

1.2 解决方案:人工智能重构新药研发

一颗新药从最初的想法到最终实现商业化销售,需要经历“药物发现、临床前研究、临床试验、审批上市”四大阶段,目前的“AI+新药研发”技术可以应用于上述阶段的不同场景,包括靶标发现及验证、苗头化合物发现、先导化合物优化、晶型预测、患者招募、优化临床试验设计、药物重定向等等。

其中,临床前的现代药物发现在技术上可以分为四个阶段,即靶标发现与验证、苗头化合物发现、先导化合物优化,临床候选分子确定,分别对应四种研发状态:Target靶点发现与验证->Hit苗头化合物发现->Lead先导化合物优化->PCC(Preclinical candidate compound)临床前候选分子确定。

1.2.1 靶标(Target)发现与验证

选择药物作用的靶点蛋白是药物研发过程的第一步,比如有名的ALK,EGFR等靶点,它们在癌症里突变率高,患者多,是非常有市场的靶点。AI可以依托自然语言处理技术(NLP),通过学习文献、组学数据、功能实验数据等海量医学相关资料,在短时内发现药物和疾病之间的千万种作用关系,输出机体细胞上药物能够发挥作用的候选受体结合点(靶点);相比而言,传统人工通过阅读科研文献和个人经验去推测潜在的药物靶点并收集分析流行病学数据作为证据,需要耗时2-3年。

1.2.2 苗头化合物(Hit)发现

Hit是指对特定药物靶标具有初步活性的化合物。大规模跨国药企一般都会有50-300万数量不等的化合物储备,高通量筛选方式由实验机器人进行数以百万计的试验,因此成本非常高昂。现在,有些AI+Drug企业的化合物数据库达到16B+,远超过传统药企的实体库可覆盖的化学空间;同时学者们已经纷纷倡导利用AI/ML开发有效和准确的虚拟筛选方法,以取代昂贵且耗时的高通量筛选过程,常见的有两种,一种是利用深度学习开发虚拟筛选技术以取代高通量筛选,另一种是利用人工智能图像识别技术优化高通量筛选过程。

1.2.3 先导化合物优化(Lead Optimization)至临床前候选分子(PCC molecule)

Lead是具有较好生物活性和可成药化学结构的化合物,用于进一步的结构改造和修饰以使得分子可以满足进入临床试验的需求。得到Hit后,寻找Lead是新药研发中的关键一步(Hit-to-Lead)。该过程通过采用骨架跃迁、基团替换、结构简化、分子杂交等方法对苗头化合物的化学结构进行修饰,使Hit的生物活性和选择性提高,同时物理化学性质、药代动力学和毒理学性质得到改善,最终优化产生一个或多个有开发价值的Lead。

通过对先导化合物化学结构的修饰,在保持其生物活性的前提下,进一步改善其选择性、物化性质、药代动力学和毒理学性质,最终优化得到一个安全有效、具有开发价值的临床前候选药物(PCC)。不论是me too/me-better类新药,或者是first-in-class类新药,其研发过程一般都需要耗费大量的资源和时间。当代药物发现有时可能有20~30个指标需要同时优化,而分子改造牵一发而动全身,因此非常有必要引入高效的优化方法。借助AI,能够以直观的方式定性推测物质结构与活性的关系,进而推测活性位点的结构和设计新的活性物质结构,进一步提升药物的构效关系分析的速度,快速挑选最具安全性的化合物。

1.3 AI+药物开发已在海内外获得了初步成功

许多投资者和大药企已经布局AI+药物开发,不少企业已经取得了初步的成功。

经过持续10年跟踪制药巨头与AI公司合作情况来看,“AI+新药研发”可为“药物发现和临床前研究阶段”及“临床研究阶段”各节约50%左右的研发周期:

表:“AI+新药研发”所节约时间及费用情况

由于“AI+新药研发”可助力缩短新药发现的周期、减少新药发现的花费,为全球新药发现成本每年节约30%左右


2. 变构机制药物是小分子药物研发领域的蓝海

目前已上市药物中95%为正构药物,而未开发的靶点大都是难度很高或难以成药的靶点,未来小分子新药研发重点在变构药物(Allosteric Drug)和靶向蛋白降解技术(PROTAC)。由于变构机制药物具有常规小分子药物在合成和成药性等方面的优势,因此变构机制药物将极有可能撬动整个小分子市场。过去的2020年是变构药物爆发元年,随着Black Diamond,Relay等多家公司上市,可以预期未来市场将出现大量变构新药研发公司。

2.1 小分子新药研发痛点:可开发靶点即将耗尽,常规靶点赛道极为拥挤

人类蛋白质组中易成药靶点已接近于开发殆尽,而剩下占比85%的难成药靶点需要投入更多的时间和经济成本才可能成功。变构技术和PROTAC技术已被公认为是在目前新药研发中找到增量的最佳方案。

常规靶点的正构药物赛道极为拥挤、竞品众多,而其可开发空间即将迫近极限,亟需从全新角度开发变构机制药物。以热门靶点ALK为例,FDA自批准第一代正构药物后,因耐药和副作用等原因,各大药厂迅速研究迭代药物,但由于正构位点空间有限,目前正构位点开发已陷入瓶颈,化学空间已接近耗尽。而变构药物的开发位点不同,提供了全新的开发空间,同时可有效解决正构药物的耐药问题,是各大药厂积极跟进的全新方向。

2.2 解决方案:变构技术是解决难成药靶点成药问题的热门技术

CRISPR,蛋白质降解和RNA靶向技术的出现,让整个行业为之激动,因为这些技术为人类提供了从根本上用其他方法无法实现的发现新药的机会,变构技术在小分子领域也是如此。

2.2.1 96%的人类基因尚未有靶向药物

人类有2万多个可编码蛋白的基因,其中10%-15%与疾病相关,FDA批准的小分子药物靶点只有750多种,约有2-3千个小分子或生物制剂正在开发中,容易的靶点已经开发殆尽,剩下的都是难度很高的或者难以成药的靶点,使用传统的正构手段需要投入更多的时间和经济成本才可能成功,而变构无疑是其中一种解决方案。2.2.2 具有疾病证据的4000个基因可潜在地用于药物开发大约有4000个基因已具备与人类疾病关联的实验证据,但由于各种原因尚未开始开发。这些潜在靶点已准备好使用AI+变构技术从头开始发现药物,这意味着与现有的FDA批准的可用药物总数相比,增加了至少4倍。

2.2.3 从未发现过新药的1.5k个基因有机会用变构解锁

新的人类基因靶标代表着新的生物学,并包含了制药和人类健康最具挑战性和最有希望的未来靶标。AI+变构技术可以解锁现有靶标的新位点和原本无法成药的新靶标,为药物发现开辟了新途径。

2.3 药物开发原理是“锁钥关系”,而正构药物存在局限性

在生命科学中,当已知蛋白质在疾病中起重要作用时,我们称其为“靶标”。药物靶标的例子包括引起炎症的蛋白质,有助于肿瘤生长的蛋白质,病毒攻击并感染人类细胞的蛋白质等。在药物研究中,我们的目标是发现与这些靶标有强烈相互作用,并降低(或增强)其功能的分子
在靶向药物的设计中,药物与蛋白的结合就像钥匙与锁孔的关系。蛋白是锁正构位点(Orthosteric site)是蛋白“锁”上能轻易看到的锁孔变构位点(Allosteric site)是蛋白“锁”上隐藏的新锁孔小分子药物是靶向蛋白构型的钥匙,因此问题就在于找到“锁孔”(Site)并快速匹配“钥匙”(Hit)。
对于正构机制,我们可以想象这些蛋白质通过锁钥原理起作用:分子“钥匙”(底物竞争性分子)紧密地嵌入蛋白质上能轻易看到的老锁孔(结合口袋,活性位点)中,使人体内原本要结合到老锁孔的内源性分子无法结合,从而抑制了蛋白功能。

 

过去,制药行业将其药物发现工作的重点放在通过直接与活性或配体结合位点结合并与天然配体竞争的正构药物上(给老锁孔配钥匙)。

高度成功的正构药物的一个经典例子是格列卫(Gleevec),它是一种酪氨酸激酶抑制剂,于2001年被批准用于治疗含有组成性活性激酶和癌蛋白BCR-ABL1的慢性骨髓性和急性淋巴细胞性白血病(CML和ALL)。格列卫占据了BCR-ABL1的ATP结合口袋(活性位点),阻止了其磷酸化下游底物并最终阻止细胞分裂的能力。

 

正构药物开发存在一些由于其机制带来的限制,而这些限制可以通过开发变构机制的药物解决。

第一,由于正构药物的作用机制(占据老锁孔使人体内原本要结合的分子无法结合),正构技术只能开发蛋白的抑制剂,难以开发激活蛋白功能的激动剂,无法解决一些需要精细调控或者激活功能的靶点。第二,对于某些酶类靶点,不同靶点间的正构位点结构十分相似,因此传统正构方式难以开发高选择性分子,低选择性带来更多的副作用(一把钥匙开好几个锁,其中有些锁是不应该被打开的)。格列卫有脱靶现象,同时抑制激酶c-Kit,PDGFR, ABL2和DDR1

第三,正构位点单独用药容易发生耐药突变(老锁孔的内部结构变化导致原本的钥匙打不开锁)。三年来接受格列卫治疗的患者中约有15-20%会获得耐药性突变,这种突变通常发生在活性部位并干扰格列卫的结合。已经开发了靶向BCR-ABL1突变形式的其他正构药物(老锁孔新配的钥匙)来克服耐药性,但是它们仅在发生耐药突变的病人中起作用。

2.4 变构药物前景广阔,可以开发上调靶点功能的激动剂、高选择性抑制剂,以及与正构药物联用延缓耐药发生

变构调节是一种更为巧妙的“开锁”方式:小分子“钥匙”在远离蛋白活性位点(远离老锁孔)的其他位置结合上了“锁”,通过蛋白质远距离构象变化间接影响蛋白功能。

由诺华研发的BCR-ABL1变构药物ABL001(新锁孔的钥匙),通过结合在位置上不同于活性位点的变构调节位点(新锁孔)来调节蛋白质功能,目前正在3期临床试验中,其与正构药物联用可以有效延缓病人耐药的发生,对疾病有部分治愈的疗效。

变构意味着蛋白质“锁”上拥有别的难以发现的锁孔(变构位点)可以与远距离的另一个区域的运动/能量相协同,并传递蛋白内信号(变构通路/Allosteric pathway)。通常,变构信号从变构位点到具有功能的正构位点(老锁孔)的传播是由变构位点的扰动引起的,这种扰动包括调节剂(离子、小分子、蛋白质、DNA和RNA)结合,点突变和翻译后修饰。
变构调节在生理状态下通过变构位点影响生物大分子的功能,进而实现对无数生物过程的精准调控,包括从酶催化,基因表达,细胞分化到新陈代谢与机体平衡。由于对机体生命过程的变构控制无处不在,变构调节被认为是生命的第二秘密,成为洞察细胞生理和病理命运的重要方式。

 

从创新药物研发的角度来看,蛋白变构为靶标新型药物的出现提供了极具吸引力的前景。

第一,变构可以开发激动剂。由于变构位点和正构位点不处在同一位置(新老锁孔不重合),变构调节剂结合变构位点可精细调控蛋白功能,并不和保守正构位点上的内源配体竞争(新锁孔的钥匙不会和老锁孔的原装钥匙竞争),这一特点提供了激动型药物的普适开发方式。

第二,变构可以开发高选择性抑制剂。相对于高度保守的正构位点,多样化的变构位点赋予了变构药物更好的选择性和更低的毒性。

第三,蛋白中的变构抑制剂和正构抑制剂联用还可以对蛋白功能进行协同抑制,来降低药物耐药突变产生的可能,或延长发生耐药突变的时间。

 


3. 人工智能和机器学习助力变构技术快速发展

传统的变构药物开发主要依靠实验随机发现,随着首个变构数据库ASD(Allosteric Database)的出现和发展,我们已经积累了大量的关于变构蛋白、小分子及位点等的标准化数据,基于数据建立模型同时结合第一原理计算等方法,使得以计算平台为基础对变构药物进行开发成为可能。

3.1 变构药物开发面临的挑战

目前变构面临的挑战有三点,第一,难以识别可成药的变构位点。正构位点往往极为保守,在蛋白上一眼可见,而变构位点则变化多端,甚至隐藏在蛋白结构的动态变化过程中。

第二,难以发现具有变构效应的苗头小分子。变构效应的产生远不止亲和力那么简单,我们可以使用DEL计算靶标与化合物的亲和力。但有些小分子在结构上虽然与天然配体相似,亲和力足够结合蛋白,然而它们的结合并不能影响蛋白的功能,它们就像是假的钥匙,适合孔的大小,但无法转动锁。变构调节除了小分子可以与位点口袋结合外,还需要其能远距离调控蛋白的功能位点。

第三,难以有效优化具有变构效应的小分子。传统的变构药物技术主要依赖实验,但现有实验技术无法从原子水平揭示蛋白的变构过程,因此传统开发往往缺乏对变构药物先导化合物及其对蛋白靶标分子作用机制的理解,使得其开发周期长,成功率低,费用高。

(部分FDA批准的变构药物及发现方法)

3.2 标准化数据的积累是AI+变构药物研发成功的主要动力

每日电讯(The Daily Telegraph)2021年1月对Exscientia的CEO Andrew Hopkins采访栏目中写道:十年后,所有药物都将使用人工智能进行设计。要实现这样的目标需要强大的数据库和人工智能技术的支撑。

3.2.1 药物研发大数据

与社会网络分析等IT领域的应用相比,用于药物发现研究的数据集相对较小。当前与药物发现和开发有关的公开可用数据,根据其在药物发现和开发不同阶段的应用和相关性,可分为5类:

专注于海量化合物的数据库(例如Enamine REAL数据库,PubChem和ChEMBL);

专注于某类药物研发所构建的整合型数据库(例如ASD,PROTAC-DB等);

专注于药物靶点-小分子结合的数据库(例如BindingDB,Supertarget和Ligand Expo);

专注于药物安全和毒性的数据库(例如DrugMatrix,SIDER和LTKB基准数据集);

专注于临床的数据库(例如ClinicalTrials.gov,PharmaGKB和EORTC临床试验数据库)。

3.2.2 可用于变构药物开发的方法与算法正在增加

随着Allosteric Database(ASD)变构数据库的建立,我们积累了大量与变构有关的标准化数据,有关变构蛋白、变构位点及其调节剂的数据可用性与日俱增,为建立使用AI合理识别变构位点并筛选变构机制药物发现方法的发展提供了可能。

近10年来,随着相关方法的建立和不断完善,面向新靶标从头结合药物设计方法和实验方法发现变构调节剂的开发已经出现,这也是变构赛道的机遇。变构平台ASD的建成是人工智能辅助变构药物设计的里程碑事件,它是全球范围内最大、最完整的变构数据库,集合了1937年至今所有的变构领域的公开信息。同时围绕该数据库,已经构建了许多与变构机制药物开发相关的算法,如专注于变构靶点发现的算法AlloDriveri、专注于变构位点发现的算法AlloSiteii、以及专注于变构效应评价的算法AlloScoreiii等等。

3.3 海内外代表性变构企业

人工智能从变构靶点发现、可成药变构位点发现、先导物发现及优化等各方面介入变构药物研发赛道:通过使用人工智能及物理计算方法发现并分析靶点隐藏的变构位点,使用统计物理学方法/第一原理计算方法,机器学习&聚类方法多维度评价挑选最优变构位点进行下一步变构分子开发,使用AI/深度学习方法评价分子的变构效应等等。

变构新药研发企业

Revolution Medicines成立于2015年,综合了化学生物学,癌症药理学和基于结构的药物发现。公司目前主要管线靶点包括SHP2,RAS,SOS1,mTORC1/4EBP1。Revolution Medicines于2020年2月在纳斯达克上市,目前市值约32.05亿美元,历史投资人包括Boxer Capital,Vivo Capital,Fidelity等。

Black Diamond Therapeutics成立于2017年,其平台MAP覆盖了突变发现,变构验证和根据蛋白质药理学设计变构分子的全过程。公司目前主要管线包括EGFR/Her2抑制剂和EGFR抑制剂。Black Diamond Therapeutics于2020年1月在纳斯达克上市,目前市值达10.1亿美金,历史投资人包括Boxer Capital,NEA恩颐投资等。

加科思药业成立于2015年,专注开发难成药靶点的创新药物,如磷酸酶和KRAS的变构抑制剂;主要靶向关键的癌症信号通路,如RAS,MYC,RB,肿瘤免疫和肿瘤代谢等通路。其SHP2抑制剂管线的海外权力于2020年以4500万美元的前期费用和8.1亿美元的里程碑付款license out给AbbVie。加科思于2020年12月在港股上市,目前市值154.3亿港币。历史投资人包括礼来亚洲,高瓴资本,启明创投等

 

AI+变构新药研发企业

HotSpot Therapeutics成立于2017年,是一家致力于变构药物发现的生物技术公司,其平台SpotFinder利用机器学习在整个蛋白组中系统性地发现调控位点,然后基于化学结构设计靶向这些热点的变构小分子抑制剂,并进行筛选。2019年8月收购DEL合成和筛选平台公司Macroceutics。公司目前主要管线包括PKC-theta抑制剂,S6 Kinase抑制剂和E3连接酶。HotSpot于2020年获得SR One领投,Tekla Capital Management等跟投的6500万美金投资。

Relay Therapeutics成立于2016年,平台Dynamo是基于蛋白质运动的药物发现平台,通过将计算能力与结构生物学、生物物理学、化学和生物学领域的前沿实验技术相整合,研究蛋白质构象的动态性质与调节功能的关系。公司目前主要管线包括SHP2抑制剂, FGFR2抑制剂和PI3Kα抑制剂。Relay Therapeutics于2020年7月在纳斯达克上市,目前市值达46亿美金,历史投资人包括软银愿景基金,GGV纪源资本,Google Ventures等。

宇道生物成立于2013年,拥有自主研发的AI+变构药物发现平台ALLOSTARTM及变构FIC分子管线,通过AI/统计物理/深度学习的算法,实现从蛋白结构数据到变构小分子药物的快速突破。其构建的ASD数据库为全球变构数据中心,被多家跨国药企/生物技术公司使用,计算平台发现的多个变构先导分子已得到验证,管线包括全新靶点的变构激动剂,已成药靶点的正构和变构抑制剂,目前最领先管线进度已达到PCC。宇道生物于2020年完成近亿元Pre-A轮融资,投资方包括北极光创投,BV百度风投,方圆资本和腾业创投。


[i] Song, Kun et al.“AlloDriver: a method for the identification and analysis of cancer drivertargets.” Nucleic acids research vol. 47,W1 (2019): W315-W321.doi:10.1093/nar/gkz350

[ii] Huang, Wenkang et al.“Allosite: a method for predicting allosteric sites.” Bioinformatics (Oxford,England) vol. 29,18 (2013): 2357-9. doi:10.1093/bioinformatics/btt399

[iii] Li, Shuai et al.“Alloscore: a method for predicting allosteric ligand-protein interactions.”Bioinformatics (Oxford, England) vol. 32,10 (2016): 1574-6. doi:10.1093/bioinformatics/btw036