同时,2020年AI+变构赛道融资也十分火热:
“孙子兵法云:凡用兵者,以正合,以奇胜”
目前常规靶点的正位小分子药物开发赛道已极为拥挤,与此同时,为数众多的难成药靶点却仍是小分子领域的一片蓝海,而专注于克服难成药靶点的变构机制药物成为了闪亮的新星。
将人工智能和数字化技术应用于变构药物研发,可有效解决变构药物由来已久的位点发现与先导化合物发现/优化问题,完成变构药物研发从0到1和加速成药(从1到10)的突破,大大拓宽了人类新药研发的边界。
如同已有数千年历史的围棋以及流传于世的半本棋谱一样,传统的新药研发往往高度依赖大师(资深专家)以及各个研究小组长期积累的不传之秘(know-how)。而在AlphaGo出现之后,曾经的灵光一现成为了机器的计算结果,曾经身经百战的大师不得不弃子认输。
人工智能正在重构一个又一个行业,从搜索引擎到自动驾驶,从语言翻译到疾病诊断,不断改变着人类的生活。如今,面对人口老龄化及不断增长的肿瘤发病率,许多疾病仍然缺乏有效的治疗方法,人类对新药的需求比以往任何时候都高。将人工智能技术引入新药研发,可以帮助我们基于数据及算法建立对药物开发的全新洞见,从而最终重塑药物研发行业。
新药研发面临着研发周期长,成功率低,费用高的问题,提升投入产出比是当前药企发展的重要议题,AI技术的引入将会是一个强有力的突破点,因此,近年在AI制药领域诞生了数百家创业公司。
传统的药物研发从发现到上市周期长(平均14年),成功率低(低于10%),费用高:包括3-6年的研发和临床前工作,平均需花费超过5亿美金推进到IND阶段,再进行6-7年的临床试验,通过数百至数千名志愿者的参与,平均需花费超过4亿美金推进到上市阶段。
(图:新药研发的支出越来越高,而FDA批准的新药上市数量呈下降趋势)
一颗新药从最初的想法到最终实现商业化销售,需要经历“药物发现、临床前研究、临床试验、审批上市”四大阶段,目前的“AI+新药研发”技术可以应用于上述阶段的不同场景,包括靶标发现及验证、苗头化合物发现、先导化合物优化、晶型预测、患者招募、优化临床试验设计、药物重定向等等。
其中,临床前的现代药物发现在技术上可以分为四个阶段,即靶标发现与验证、苗头化合物发现、先导化合物优化,临床候选分子确定,分别对应四种研发状态:Target靶点发现与验证->Hit苗头化合物发现->Lead先导化合物优化->PCC(Preclinical candidate compound)临床前候选分子确定。
Lead是具有较好生物活性和可成药化学结构的化合物,用于进一步的结构改造和修饰以使得分子可以满足进入临床试验的需求。得到Hit后,寻找Lead是新药研发中的关键一步(Hit-to-Lead)。该过程通过采用骨架跃迁、基团替换、结构简化、分子杂交等方法对苗头化合物的化学结构进行修饰,使Hit的生物活性和选择性提高,同时物理化学性质、药代动力学和毒理学性质得到改善,最终优化产生一个或多个有开发价值的Lead。
通过对先导化合物化学结构的修饰,在保持其生物活性的前提下,进一步改善其选择性、物化性质、药代动力学和毒理学性质,最终优化得到一个安全有效、具有开发价值的临床前候选药物(PCC)。不论是me too/me-better类新药,或者是first-in-class类新药,其研发过程一般都需要耗费大量的资源和时间。当代药物发现有时可能有20~30个指标需要同时优化,而分子改造牵一发而动全身,因此非常有必要引入高效的优化方法。借助AI,能够以直观的方式定性推测物质结构与活性的关系,进而推测活性位点的结构和设计新的活性物质结构,进一步提升药物的构效关系分析的速度,快速挑选最具安全性的化合物。
许多投资者和大药企已经布局AI+药物开发,不少企业已经取得了初步的成功。
经过持续10年跟踪制药巨头与AI公司合作情况来看,“AI+新药研发”可为“药物发现和临床前研究阶段”及“临床研究阶段”各节约50%左右的研发周期:
表:“AI+新药研发”所节约时间及费用情况
由于“AI+新药研发”可助力缩短新药发现的周期、减少新药发现的花费,为全球新药发现成本每年节约30%左右。
目前已上市药物中95%为正构药物,而未开发的靶点大都是难度很高或难以成药的靶点,未来小分子新药研发重点在变构药物(Allosteric Drug)和靶向蛋白降解技术(PROTAC)。由于变构机制药物具有常规小分子药物在合成和成药性等方面的优势,因此变构机制药物将极有可能撬动整个小分子市场。过去的2020年是变构药物爆发元年,随着Black Diamond,Relay等多家公司上市,可以预期未来市场将出现大量变构新药研发公司。
人类蛋白质组中易成药靶点已接近于开发殆尽,而剩下占比85%的难成药靶点需要投入更多的时间和经济成本才可能成功。变构技术和PROTAC技术已被公认为是在目前新药研发中找到增量的最佳方案。
CRISPR,蛋白质降解和RNA靶向技术的出现,让整个行业为之激动,因为这些技术为人类提供了从根本上用其他方法无法实现的发现新药的机会,变构技术在小分子领域也是如此。
新的人类基因靶标代表着新的生物学,并包含了制药和人类健康最具挑战性和最有希望的未来靶标。AI+变构技术可以解锁现有靶标的新位点和原本无法成药的新靶标,为药物发现开辟了新途径。
过去,制药行业将其药物发现工作的重点放在通过直接与活性或配体结合位点结合并与天然配体竞争的正构药物上(给老锁孔配钥匙)。
正构药物开发存在一些由于其机制带来的限制,而这些限制可以通过开发变构机制的药物解决。
第一,由于正构药物的作用机制(占据老锁孔使人体内原本要结合的分子无法结合),正构技术只能开发蛋白的抑制剂,难以开发激活蛋白功能的激动剂,无法解决一些需要精细调控或者激活功能的靶点。第二,对于某些酶类靶点,不同靶点间的正构位点结构十分相似,因此传统正构方式难以开发高选择性分子,低选择性带来更多的副作用(一把钥匙开好几个锁,其中有些锁是不应该被打开的)。格列卫有脱靶现象,同时抑制激酶c-Kit,PDGFR, ABL2和DDR1
变构调节是一种更为巧妙的“开锁”方式:小分子“钥匙”在远离蛋白活性位点(远离老锁孔)的其他位置结合上了“锁”,通过蛋白质远距离构象变化间接影响蛋白功能。
由诺华研发的BCR-ABL1变构药物ABL001(新锁孔的钥匙),通过结合在位置上不同于活性位点的变构调节位点(新锁孔)来调节蛋白质功能,目前正在3期临床试验中,其与正构药物联用可以有效延缓病人耐药的发生,对疾病有部分治愈的疗效。
从创新药物研发的角度来看,蛋白变构为靶标新型药物的出现提供了极具吸引力的前景。
第一,变构可以开发激动剂。由于变构位点和正构位点不处在同一位置(新老锁孔不重合),变构调节剂结合变构位点可精细调控蛋白功能,并不和保守正构位点上的内源配体竞争(新锁孔的钥匙不会和老锁孔的原装钥匙竞争),这一特点提供了激动型药物的普适开发方式。
第二,变构可以开发高选择性抑制剂。相对于高度保守的正构位点,多样化的变构位点赋予了变构药物更好的选择性和更低的毒性。
第三,蛋白中的变构抑制剂和正构抑制剂联用还可以对蛋白功能进行协同抑制,来降低药物耐药突变产生的可能,或延长发生耐药突变的时间。
目前变构面临的挑战有三点,第一,难以识别可成药的变构位点。正构位点往往极为保守,在蛋白上一眼可见,而变构位点则变化多端,甚至隐藏在蛋白结构的动态变化过程中。
第二,难以发现具有变构效应的苗头小分子。变构效应的产生远不止亲和力那么简单,我们可以使用DEL计算靶标与化合物的亲和力。但有些小分子在结构上虽然与天然配体相似,亲和力足够结合蛋白,然而它们的结合并不能影响蛋白的功能,它们就像是假的钥匙,适合孔的大小,但无法转动锁。变构调节除了小分子可以与位点口袋结合外,还需要其能远距离调控蛋白的功能位点。
第三,难以有效优化具有变构效应的小分子。传统的变构药物技术主要依赖实验,但现有实验技术无法从原子水平揭示蛋白的变构过程,因此传统开发往往缺乏对变构药物先导化合物及其对蛋白靶标分子作用机制的理解,使得其开发周期长,成功率低,费用高。
(部分FDA批准的变构药物及发现方法)
每日电讯(The Daily Telegraph)2021年1月对Exscientia的CEO Andrew Hopkins采访栏目中写道:十年后,所有药物都将使用人工智能进行设计。要实现这样的目标需要强大的数据库和人工智能技术的支撑。
与社会网络分析等IT领域的应用相比,用于药物发现研究的数据集相对较小。当前与药物发现和开发有关的公开可用数据,根据其在药物发现和开发不同阶段的应用和相关性,可分为5类:
专注于海量化合物的数据库(例如Enamine REAL数据库,PubChem和ChEMBL);
专注于某类药物研发所构建的整合型数据库(例如ASD,PROTAC-DB等);
专注于药物靶点-小分子结合的数据库(例如BindingDB,Supertarget和Ligand Expo);
专注于药物安全和毒性的数据库(例如DrugMatrix,SIDER和LTKB基准数据集);
专注于临床的数据库(例如ClinicalTrials.gov,PharmaGKB和EORTC临床试验数据库)。
随着Allosteric Database(ASD)变构数据库的建立,我们积累了大量与变构有关的标准化数据,有关变构蛋白、变构位点及其调节剂的数据可用性与日俱增,为建立使用AI合理识别变构位点并筛选变构机制药物发现方法的发展提供了可能。
近10年来,随着相关方法的建立和不断完善,面向新靶标从头结合药物设计方法和实验方法发现变构调节剂的开发已经出现,这也是变构赛道的机遇。变构平台ASD的建成是人工智能辅助变构药物设计的里程碑事件,它是全球范围内最大、最完整的变构数据库,集合了1937年至今所有的变构领域的公开信息。同时围绕该数据库,已经构建了许多与变构机制药物开发相关的算法,如专注于变构靶点发现的算法AlloDriveri、专注于变构位点发现的算法AlloSiteii、以及专注于变构效应评价的算法AlloScoreiii等等。
人工智能从变构靶点发现、可成药变构位点发现、先导物发现及优化等各方面介入变构药物研发赛道:通过使用人工智能及物理计算方法发现并分析靶点隐藏的变构位点,使用统计物理学方法/第一原理计算方法,机器学习&聚类方法多维度评价挑选最优变构位点进行下一步变构分子开发,使用AI/深度学习方法评价分子的变构效应等等。
Revolution Medicines成立于2015年,综合了化学生物学,癌症药理学和基于结构的药物发现。公司目前主要管线靶点包括SHP2,RAS,SOS1,mTORC1/4EBP1。Revolution Medicines于2020年2月在纳斯达克上市,目前市值约32.05亿美元,历史投资人包括Boxer Capital,Vivo Capital,Fidelity等。
Black Diamond Therapeutics成立于2017年,其平台MAP覆盖了突变发现,变构验证和根据蛋白质药理学设计变构分子的全过程。公司目前主要管线包括EGFR/Her2抑制剂和EGFR抑制剂。Black Diamond Therapeutics于2020年1月在纳斯达克上市,目前市值达10.1亿美金,历史投资人包括Boxer Capital,NEA恩颐投资等。
加科思药业成立于2015年,专注开发难成药靶点的创新药物,如磷酸酶和KRAS的变构抑制剂;主要靶向关键的癌症信号通路,如RAS,MYC,RB,肿瘤免疫和肿瘤代谢等通路。其SHP2抑制剂管线的海外权力于2020年以4500万美元的前期费用和8.1亿美元的里程碑付款license out给AbbVie。加科思于2020年12月在港股上市,目前市值154.3亿港币。历史投资人包括礼来亚洲,高瓴资本,启明创投等
HotSpot Therapeutics成立于2017年,是一家致力于变构药物发现的生物技术公司,其平台SpotFinder利用机器学习在整个蛋白组中系统性地发现调控位点,然后基于化学结构设计靶向这些热点的变构小分子抑制剂,并进行筛选。2019年8月收购DEL合成和筛选平台公司Macroceutics。公司目前主要管线包括PKC-theta抑制剂,S6 Kinase抑制剂和E3连接酶。HotSpot于2020年获得SR One领投,Tekla Capital Management等跟投的6500万美金投资。
Relay Therapeutics成立于2016年,平台Dynamo是基于蛋白质运动的药物发现平台,通过将计算能力与结构生物学、生物物理学、化学和生物学领域的前沿实验技术相整合,研究蛋白质构象的动态性质与调节功能的关系。公司目前主要管线包括SHP2抑制剂, FGFR2抑制剂和PI3Kα抑制剂。Relay Therapeutics于2020年7月在纳斯达克上市,目前市值达46亿美金,历史投资人包括软银愿景基金,GGV纪源资本,Google Ventures等。
宇道生物成立于2013年,拥有自主研发的AI+变构药物发现平台ALLOSTARTM及变构FIC分子管线,通过AI/统计物理/深度学习的算法,实现从蛋白结构数据到变构小分子药物的快速突破。其构建的ASD数据库为全球变构数据中心,被多家跨国药企/生物技术公司使用,计算平台发现的多个变构先导分子已得到验证,管线包括全新靶点的变构激动剂,已成药靶点的正构和变构抑制剂,目前最领先管线进度已达到PCC。宇道生物于2020年完成近亿元Pre-A轮融资,投资方包括北极光创投,BV百度风投,方圆资本和腾业创投。
[i] Song, Kun et al.“AlloDriver: a method for the identification and analysis of cancer drivertargets.” Nucleic acids research vol. 47,W1 (2019): W315-W321.doi:10.1093/nar/gkz350
[ii] Huang, Wenkang et al.“Allosite: a method for predicting allosteric sites.” Bioinformatics (Oxford,England) vol. 29,18 (2013): 2357-9. doi:10.1093/bioinformatics/btt399
[iii] Li, Shuai et al.“Alloscore: a method for predicting allosteric ligand-protein interactions.”Bioinformatics (Oxford, England) vol. 32,10 (2016): 1574-6. doi:10.1093/bioinformatics/btw036