您当前的位置:首页 > 学科资讯 > 详情
登顶Nature!跨越胎儿、健康、肿瘤——中国学者绘制出最精、最全人体蛋白质“地图”
浏览量:16     发布者:肿瘤界     时间:2026-06-24

如果把人体比作一座城市,基因组如同施工图纸,转录组像是把图纸转化成一条条可执行的指令,而真正让这座城市运转起来的,是蛋白质组。心脏的收缩跳动、肝脏的代谢解毒、大脑的记忆思考……所有这些活儿,都由不同的蛋白质协同其他生物分子合作完成,它们共同运作着人体这座生命之城。


然而,长期以来,我们对这座“城市”的蛋白质分布知之甚少。我们对人体不同组织器官的蛋白质的空间分布理解很少,也不知道某个药物针对的蛋白质,除了在肿瘤内,还会分布在哪些健康器官中,又可能会误伤哪里。


2026年6月17日,西湖大学郭天南团队联合上海交通大学医学院、哈尔滨医科大学等单位,在Nature发表了一项研究,系统性地绘制了人体蛋白质组的空间分布图谱。他们收集了近三千份样本,覆盖58种正常组织、25种癌症类型,定量了超过1.3万种蛋白质。这是迄今为止分辨率最高、覆盖范围最广的人体蛋白质组空间图谱,相当于为人体安装了一套可见的“蛋白质导航系统”。


2-1.png

论文截图

论文链接:

https://www.nature.com/articles/s41586-026-10660-y




为什么需要一张蛋白质“地图”



过去几十年,科学家已绘制了基因的“图纸”(基因组)和转录的“计划清单”(转录组),但真正执行生物学功能、并作为绝大多数药物(尤其是近年来备受关注的免疫治疗药物)直接作用靶点的,是蛋白质。


一个关键问题是:同一种蛋白质,在不同器官里表达量可能相差成百上千倍。若某种抗癌药物的靶点在肿瘤里高表达,同时也在肝脏中维持高水平表达,那么药物在杀死肿瘤的同时,也可能严重损伤肝脏。这正是许多创新药在临床试验中因意料之外的副作用而失败的重要原因之一:研究人员对药物靶点在全身范围内的分布缺乏系统性认知。


郭天南团队的研究,正是为了填补这一空白。他们试图回答几个根本问题:人体内究竟有哪些蛋白质?每种蛋白质主要富集在哪些器官?肿瘤发生以后,哪些蛋白质会发生变化?这些变化能不能帮我们找到更安全、更有效的药物?


2017年,郭天南结束在瑞士苏黎世联邦理工大学的博士后工作,加入西湖大学,开始从事蛋白质组学相关研究,关注生物体在特定时刻体内所有蛋白质的种类、数量及相互作用等。十多年前的蛋白质组学,还远不像今天这样高通量、自动化。做一次实验,首先得有足够新鲜、足够大的组织样品——至少要像一粒黄豆那么大。即便样品合格,分析一个样品也常常要花上一两天。时间成本、样本门槛和仪器费用叠加在一起,使得做蛋白质组学长久以来都是一件“奢侈”的事。


为此,他们开发出一系列基于微量样本蛋白质组的分析方法体系。自此,只需要芝麻大小的组织样本,便可完成标准化的蛋白质组学分析。该方法不仅将分析速度提高了约十倍,也显著降低了实验成本,使得大规模、高通量的蛋白质组学分析研究成为可能。有了这些积累,郭天南团队终于能够着手绘制一张更宏观、也更贴近生理病理真实图景的蛋白质组的“人体导航地图”。



“画”出癌症的“前世今生”



这项研究自实验室创建之初便已启动。在最初的五六年里,团队持续进行样本采集与实验积累。最终,他们构建了一个包含15332个蛋白质的质谱谱图库,并在此基础上定量了13609种蛋白质。

2-2.png

左侧列出了眼、血液、人类胚胎、耳、鼻及脑的具体采样位置,底部则展示了 25 种癌症类型。本图部分素材经授权改编自 BioRender.com 和 Magnific.com。


拿到蛋白质“地图”后,他们发现了什么?


团队进一步进行了降维分析,将上万维的蛋白表达数据压缩到二维平面,以观察不同样本之间的关系。结果显示,样本并非随机散布,而是沿着一条连续轨迹依次排列:胎儿组织、肿瘤组织、配对临近的非肿瘤组织,最后到健康的成人组织。非肿瘤组织是位于肿瘤周围、常规病理下看似正常的组织。由于它与对应的肿瘤组织来自同一位患者、同一器官,并且是在同一时间获得的样本,因此常被用作研究对照。以非肿瘤组织作为参照,可以更准确地识别肿瘤组织中蛋白表达发生了哪些特异性变化。


可以这样理解这个结果:胎儿细胞多处于尚未完全分化的前体状态,具有较强的增殖能力和可塑性;而许多肿瘤细胞的蛋白质表达模式,会“退回”到类似胎儿期的未成熟状态,因而失去原本的组织功能,并获得更活跃的增殖能力。相比之下,癌旁组织虽然外观看似正常,但其蛋白表达已经受到肿瘤微环境影响,呈现出介于肿瘤组织与正常成人组织之间的状态。这些发现,对理解癌症的发生机制、寻找早期诊断标志物都有重要价值。



2-3.png

组织发育与癌变过程中的蛋白质组演变


研究还极大地填补了组织特异性蛋白的空白,共鉴定了1717个组织特异性富集蛋白,并补充了480个此前研究未涵盖的组织富集蛋白。其中,研究首次在蛋白水平发现了PANX3在耳蜗中的特异性表达。由于此前的人体蛋白质数据集并未覆盖耳蜗组织,这一发现也进一步体现了本数据集在组织覆盖范围上的完整性,以及在完善人体蛋白质注释方面的独特价值。


团队进一步比较了25种癌症中肿瘤组织与癌旁组织的蛋白质表达差异,共识别出8940个差异表达蛋白。结果显示,不同癌种之间的蛋白变化幅度差异显著:结肠癌、直肠癌和睾丸癌的变化最为明显,而胶质母细胞瘤,也就是一种脑癌,变化最少。这一结果也与前面关于脑组织蛋白质特征相对稳定的观察相一致。


在这些差异蛋白中,有33个蛋白在超过20种癌症里都变得“异常活跃”,它们参与的多是最基本的生命活动,比如DNA复制、抗氧化等。这说明,尽管癌症类型各不相同,却可能共同依赖某些核心生存机制。


于是,一个值得思考的问题就来了:能否针对这些共同蛋白,开发一种能同时对付多种癌症的“广谱抗癌药”?郭天南认为,理论上存在这种可能,但现实中肿瘤异质性很强,单一药物很难覆盖所有情况。尽管如此,这些共同靶点至少为抗癌药物研发提供了新的思路。而未来的一个新发展方向是根据这些癌症相关蛋白设计多靶点联合治疗策略。


除了共同蛋白,团队也发现了2879个肿瘤特异蛋白,它们只在某些特定癌症中才会出现变化。


举个例子:胃肠道间质瘤里,居然出现了很多与神经有关的蛋白质。为什么会这样?原来这种肿瘤起源于“Cajal间质细胞”,而这种细胞天生就带着神经细胞的某些特点。这个发现就像找到了能证明身份的线索,反过来印证了肿瘤的来源。


研究还发现了一批“局部富集差异蛋白”。这类蛋白指的是:在某个正常器官里本来就特别多的蛋白质,到了肿瘤里,它们的数量发生了明显变化。据观察,这些蛋白普遍表现出显著下调,提示了相关组织特异性功能在癌症中的衰退或者受损。


2-4.png
肿瘤特异性蛋白特征



为制药产业“导航”



拿到“地图”,读懂“地图”,“好戏”才真正开始——这项研究的最终目的,是让这些蛋白质数据真正派上用场。这张“图”怎么用?团队实验并展示了几类可能。


第一,老药新用。


有些药已经被批准用于治疗某种癌症,而研究发现,它们针对的蛋白靶点在其他癌种中同样活跃。比如,一款叫戈沙妥珠单抗的药物(Trodelvy)已用于乳腺癌治疗,而它的靶蛋白在子宫内膜癌中也高度表达,因此可能对后者同样有效,而其在二期临床试验中的报告的确展示了该药物在子宫内膜癌中的应用潜力。简单来说,通过分析蛋白表达谱,研究人员可以有效地发掘这些“老药”的新的适应症。


第二,寻找新药靶点。


团队把三类数据放在一起比对:蛋白表达数据、药物敏感性数据(某种药对癌细胞的杀伤效果)、以及CRISPR基因敲除数据(敲掉某个基因后细胞会不会死)。通过交叉验证,筛选出一批很有潜力的蛋白靶点。多组数据互相印证,让筛选结果更可靠。研究数据显示,Savolitinib、Tepotinib和Merestinib等MET抑制剂在结直肠癌(CRC)细胞系中的细胞毒性效应与MET蛋白表达水平呈显著正相关,即MET蛋白丰度越高,药物诱导的毒性越强。鉴于在队列中,直肠癌组织相较于配对的癌旁非肿瘤组织表现出MET蛋白的显著上调,这一发现提示MET抑制剂可能在直肠癌的靶向治疗中具有潜在的临床应用价值。


第三,筛选ADC药物的理想靶点。


ADC药物是当前抗癌药研发的热点,可以把它想象成一枚“精准导弹”:抗体负责识别并锁定肿瘤细胞,连接在抗体上的毒素则负责完成杀伤。不过,要让这枚“导弹”导航精准,前提是靶点蛋白在肿瘤细胞上高度表达,而在临近非肿瘤组织和全身正常组织中几乎不表达。团队从所有差异蛋白中,筛出了41个满足这个条件的细胞质膜蛋白,它们很可能成为下一代ADC药物的理想靶点。



未来



五年前,绘制蛋白质组的“人体导航地图”还只是一个遥远的愿景。没有先例,没有足够的样本,也没有成熟的高通量技术;有的只是一群愿意深入探知、并真正开始着手行动的年轻研究者。


就拿实验的起点——样本收集来说,这本身就是一个庞大的工程。得益于郭天南实验室长期深耕临床蛋白质组技术的积累,微量组织样本的高通量蛋白质组分析并不是最大的障碍,但不同批次、不同来源的样本往往存在批次效应。如何做好质控、保证数据之间可比,是团队花费大量精力攻克的难题。


第一作者岳靓是西湖大学第二期博士生,现为西湖大学博士后。她回忆,第一轮数据分析是在2021年初开始的。自课题启动以来,团队前后经历了多轮数据更新和重新分析。


2-5.jpg

文章一作岳靓(右一)、共同一作姜玟昊(左一)

通讯作者郭天南(左二)、朱怡(左三)


如今,这张图谱已经绘制完成。更重要的是,它让药物研发从过去“在黑箱里摸索”,逐渐转向“看着地图导航”。目前,这项研究的所有数据已通过公开数据库(db.prottalks.com)向全球开放。任何研究者都可以查询某个蛋白质在人体58种组织中的表达丰度,或者某种癌症中哪些蛋白发生了改变。


“我们收到了不少反馈,”郭天南说,“有做药物研发的公司来查询ADC靶点,有做基础研究的学者来验证自己的蛋白假设。这个数据库正在成为一个助力生物医药研发与转化的公共资源。”


而郭天南团队,即将带着这些蛋白质的大数据,驶入新的“航道”。


加入西湖后的前五到六年里,他们的实验室主要在做一件事:采集数据。随着数据积累到一定程度,建立模型成为了可能——这个模型就是虚拟细胞(AIVC)模型,即利用人工智能和机器学习,将海量的蛋白质组数据整合成一个可以预测、可以交互的数字细胞模型。如今,这个实验室也把名字从“蛋白质组大数据实验室”更名为“蛋白质组复杂科学实验室”,标志着研究进入新的阶段。


下一步,郭天南团队会继续深入,让虚拟细胞成为每个药物研发者手边的智能助手。他打了个比方:“就像天气预报,输入今天的天气数据,模型就能预测明天会不会下雨。我们希望让药物研发也变成这样:在计算机中输入一个药物分子和相关的蛋白质组数据,模型就能判断它对某一类疾病,甚至是某一个病人是否安全、是否有效。而另一方面,我们输入一个临床样本的蛋白质组数据,模型可以告诉我们药物干预应该针对哪些蛋白靶点。这正是‘虚拟细胞’计划希望抵达的彼岸。”


本研究由西湖大学医学院博士后岳靓,西湖大学科研助理姜玟昊(西湖大学2026届预录取博士生),西湖大学科研助理李赛男(现北京大学博士研究生)和西湖大学访问学生罗蒙担任共同第一作者,西湖大学医学院郭天南教授,上海交通大学医学院李岩教授,哈尔滨医科大学季勇教授和西湖实验室朱怡研究员为文章共同通讯作者。

项目获得了国家自然科学基金,国家重点研发计划,国家科技重大专项,浙江省“尖兵”“领雁”研发攻关计划,科技创新2030-重大项目,上海市卫生健康委员会和广东省基础与应用基础研究基金的资助。项目实施过程中得到了西湖大学超算中心和π-HuB项目的支持。


2-6.jpg

团队合影 

一排左起:姜玟昊,郭天南,朱怡,岳靓;

二排左起:聂宗祥,程宏晗,孙瑞,薛张芝,王瑛睿,阿俊 


蛋白质组复杂科学实验室

西湖大学蛋白质组复杂科学实验室(Guomics)是依托西湖大学、西湖实验室(生命科学和生物医学浙江省实验室)和医学蛋白质组全国重点实验室成立的一个多学科交叉的AI蛋白质组学实验室。实验室长期从事蛋白质组学相关研究,联合人工智能,构建虚拟细胞,解析生物过程的原理,助力疾病诊疗。团队诚邀有志于虚拟细胞研究的优秀本科生、研究生及博士后研究人员加盟!实验室官网:guomics.com

公开数据库:https://db.prottalks.com/




来源:郭天南实验室、西湖大学WestlakeUniversity