精准医学是一种融合个体遗传变异、环境因素与生活方式等多维信息,为患者量身定制诊疗与预防方案的医学模式。近年来,随着前沿技术的迅猛发展及多组学研究的深入推进,该领域正经历着从“以基因为核心”向“以蛋白质为核心”的深刻转型。自2019年“蛋白质组学驱动的精准医学”(Proteomics-Driven Precision Medicine,简称PDPM)概念提出以来1,已成为推动精准医学研究范式升级的关键力量。相比相对稳定的基因组,蛋白质组呈现出更为复杂且动态的特性。它不仅真实地反映了生命活动的执行状态,还与疾病的发生发展及治疗反应高度相关,因而在疾病机制解析与精准干预中具有不可替代的价值。2025年7月14日,医学蛋白质组学全国重点实验室贺福初院士团队在National Science Review 期刊在线发表综述论文《The coming era of proteomics-driven precision medicine》2。文章系统梳理了蛋白质组学在精准医学领域的关键进展,重点涵盖:人体蛋白质表达谱的高精度绘制、翻译后修饰的深入解析、蛋白质互作网络的系统构建,以及空间蛋白质组学的前沿探索。这些技术突破深化了对疾病本质的理解,推动了精准诊断手段的发展,并为个体化治疗策略的制定提供了坚实基础。基于上述进展,作者鲜明指出:“蛋白质组学驱动的精准医学时代已至”。如果将基因组学驱动的精准医学视为第一代精准医学,那么蛋白质组学驱动的精准医学就是第二代精准医学,同时也是第一代智慧医学。01 疾病分类系统的提出与发展精准医学的蓬勃发展,深植于疾病分类系统持续进化的土壤之中,这一进步对于实现疾病与健康状况标准化分类具有不可估量的价值。世界卫生组织(WHO)所推行的《国际疾病分类》(ICD)等权威体系,在确立诊断依据、指导健康管理实践方面奠定了坚实的基础。然而,面对日益增长的个体化医疗需求,这些系统往往显得较为通用,难以充分满足每位患者的独特需求。在此背景下,基于本体论的疾病机制性分类系统应运而生。该系统巧妙地融合了丰富的临床数据与广泛的科学研究,旨在深入剖析并精准定义疾病的内表型,即疾病在个体层面所展现出的特定生物学特征3。这一创新不仅极大地提升了医疗服务的个性化水平,使之能够更精准地匹配患者的具体状况,而且与精准医学的核心理念不谋而合,共同推动着医疗保健领域向更加精细化、个体化的治疗策略迈进。因此,基于本体论的疾病分类机制的开发,无疑是医疗保健领域向个体化医疗时代转型的一个重要里程碑。基因组学和分子生物学的兴起,深入解析个体基因图谱的重要性日益凸显,极大地推动了精准医学的进步。基因组驱动的精准医学(GDPM)在遗传性疾病及肿瘤学领域取得了瞩目成就。然而,近期包括英国生物样本库(UK Biobank)在内的研究表明,许多疾病的遗传贡献率可能低于预期,尤其是某些癌症展现出较低的遗传决定性,这限制了基因组学在癌症靶向治疗中的直接获益4。这一发现促使我们重新审视疾病发生的全貌,积极探索遗传因素之外的其他致病机制,以期在提升治疗效果上取得新的突破。在此过程中,遗传与环境因素之间错综复杂的相互作用成为了关注的焦点。虽然基因组成提供了生命的基本蓝图,但其与环境因素交织影响,共同塑造了个体的健康状况5。这种交互作用不仅涉及基因组的变异,还深刻影响着转录组、蛋白质组等多个层面的动态变化。作为遗传信息的直接执行者,蛋白质在生命活动中扮演着核心角色。蛋白质组学作为对蛋白质进行大规模、系统性研究的学科,致力于解析蛋白质的表达模式、功能特性及其在健康与疾病状态下的功能差异。蛋白质与mRNA水平间常因翻译后修饰等因素存在偏差,蛋白质组学为我们提供了理解这些复杂差异的关键视角(图1)。图1.蛋白质组在表型中的关键作用。遗传和环境因素之间的相互作用定义了转录组、蛋白质组、代谢组等的状态,其中蛋白质组直接影响健康和疾病。蛋白质组包括所有具有各种序列、结构、修饰、丰度、稳定性、活性、定位和相互作用的蛋白质。这里展示的表型包括生理、心理、病理、药理学和毒理学特征。pQTL可以检测导致蛋白质表达变异的遗传变异。PWAS可以破译引起疾病和非疾病表型的蛋白质。SNV,单核苷酸变体。Indel,插入和删除。PTM,翻译后修饰。QTL,数量性状位点。eQTL,表达数量性状位点。pQTL,蛋白质数量性状位点。GWAS,全基因组关联研究。TWAS,全转录组关联研究。PWAS,全蛋白质组关联研究。在过去的十五年中,全球蛋白质组学研究显著扩展,这一非凡历程由2009年至2023年间文章发表数量的激增得以生动诠释,彰显了蛋白质组学在科学殿堂中日益攀升的重要性与地位。尽管基因组学长久以来在精准医学领域内占据主导地位,但自2019年起,蛋白质组学以迅猛之势崭露锋芒,尤其是在与精准医学的深度融合与探索中,其作用愈发凸显。蛋白质组学与众多前沿领域紧密相连,如蛋白质组精细图谱的描绘、翻译后修饰的复杂调控、蛋白质-蛋白质相互作用的深入解析以及空间蛋白质组学等,共同构建了一个多维度、多层次的研究框架(图2)。这一系列进展不仅标志着蛋白质组学正逐步确立其在精准医学发展中的核心引擎地位,更预示着其在推动医疗健康领域变革方面的巨大潜力和深远影响。随着技术的不断进步和研究的持续深入,蛋白质组学无疑将在未来成为驱动精准医学发展的重要力量。图2.从人类蛋白质组到精准医学:由分子特征通向个体化健康结局。蛋白质表达及其翻译后修饰在多种时空条件下呈现动态特性,最终导致蛋白质-蛋白质互作网络的变化。这些互作发生在多个生物学层级上,包括细胞内、细胞间、组织/器官乃至个体水平,层层传导并共同决定生理或病理表型的形成。P:磷酸化(phosphorylation);Ac:乙酰化(acetylation);Ub:泛素化(ubiquitination);Lac:乳酰化(lactylation)。02 技术跃迁推动蛋白组研究深入发展蛋白质组医学的核心技术体系,深受诺贝尔生理学或医学奖得主悉尼·布伦纳所倡导的大科学计划的 “CAP标准”影响,这一金标准即全面性(Comprehensive)、准确性(Accurate)与永久性(Permanent)的完美结合6。在蛋白质组学的研究范畴内,遵循CAP标准意味着不仅要对蛋白质的序列及其复杂功能进行无遗漏的深入剖析与细致解读,还需在精确的时空维度上实现其动态变化的量化捕捉。同时,确保从蛋白质组学研究中提炼出的数据、洞见及基本原理能够跨越时间的长河,持续保持其科学价值与应用相关性,为医学进步奠定稳固基石。临床蛋白质组学领域在探索之路上,还需克服一系列复杂挑战。其中,样本类型的多样性尤为突出,包括但不限于冷冻组织、福尔马林固定石蜡包埋切片及多种体液样本,这些样本的差异性对采样策略的制定提出了更高要求。此外,体液样本中蛋白质丰度的宽动态范围,要求检测技术必须具备极高灵敏度,以捕捉那些低丰度但至关重要的蛋白质信息。面对多中心协作与大规模队列研究的需求,高通量蛋白质组学技术的研发与应用成为关键,旨在提升研究效率与数据产出量。而面对海量蛋白质组学数据,发展出精确且强大的数据挖掘与分析技术,则是解锁数据深层价值、推动科学发现的必由之路。尽管挑战重重,蛋白质组医学领域的研究者们仍凭借不懈的努力与创新精神,取得了令人瞩目的成就,为精准医学、疾病诊断与治疗策略的优化开辟了新的路径。蛋白质表达谱:在过去的三十年间,蛋白质组学领域迎来了前所未有的软硬件革命性突破,这一系列里程碑式的进展从样本制备的精细化、肽段的高效分离、质谱测序技术的飞跃,直至数据解析的深度挖掘,以及大数据与深度学习等先进技术的应用,共同驱动了蛋白质组学鉴定与定量技术的显著进步。具体而言,压力循环技术与单罐固相增强样品制备等创新技术的诞生,实现了样品处理的高通量化与自动化,极大地提升了实验效率与数据质量。与此同时,多维分级技术作为传统凝胶电泳技术的革新替代,显著增强了蛋白质组的覆盖广度与深度,为全面解析生物体内的蛋白质组构成提供了有力支撑。在定量分析领域,尽管iTRAQ与TMT等高端技术因成本较高及定量准确度的小幅偏差而面临挑战,但它们无疑为蛋白质组学的稳定定量提供了强有力的工具,推动了该领域向更高精度迈进。此外,非标定量技术的兴起与数据非依赖性采集策略的发展,结合高速、高精度质谱硬件的持续突破,共同促进了蛋白质组学分析通量、覆盖率及重现性的显著提升。正是得益于这些技术进步的强大推动,科研人员已成功绘制出一系列模式生物的蛋白质组全景图,这些全景图不仅揭示了生物体内蛋白质组成的复杂性与动态性,更为疾病机制解析、药物靶点发现的研究提供了宝贵的资源与启示。蛋白质翻译后修饰:蛋白质翻译后修饰(PTMs)通常是指在氨基酸侧链上添加化学基团,使其获得更多调节机制或者生物学功能,常见的翻译后修饰包括磷酸化、乙酰化、泛素化和糖基化等。目前,修饰密码的概念逐步成为科学家的共识,修饰密码系统通常包括密码写入器(添加PTMs),擦除器(删除PTMs)和读取器(读取PTMs),通过密码系统来调节蛋白质功能,包括活性、定位、相互作用、降解等。随着技术的发展,翻译后修饰组学逐步成为密码解析的重要手段和研究策略。深入探索基于修饰组学的密码解析机制,极大地促进了我们对疾病生物学的深刻理解,并为药物研发开辟了新纪元。截至目前,科学界已识别出超过650种PTMs,这一发现标志着修饰组学在持续支撑并加速新型PTMs的发掘及其功能阐释方面发挥着不可或缺的作用。从翻译后修饰调控的角度探究疾病机制为精准医学和靶向药物的创建开辟了新的道路。更进一步,修饰组学技术的日新月异,及其与基因组学、转录组学等其他组学领域的深度融合,正以前所未有的力度推动着这一科学领域的蓬勃发展。这种跨学科的整合不仅深化了我们对生命系统复杂性的认识,还极大地增强了我们在疾病治疗策略上的创新能力,预示着未来在疾病诊断、治疗及预防方面的重大突破。蛋白质相互作用网络(蛋白质连锁图):涌现(Emergence)是指当一个复杂整体展现出其组成部分单独所不具备的性质或行为,这些特性仅在整体相互作用中才得以显现。蛋白–蛋白相互作用构成了蛋白质复合物和分子机器的基础,建立了蛋白质群体的层级与聚类结构,进而产生单个蛋白所不具备的涌现属性。值得注意的是,蛋白–蛋白相互作用的涌现特性存在于多个层级,从分子层面延伸至细胞、组织/器官,乃至个体尺度。每一级生命特征的涌现,都是前一级相互作用所产生的属性延伸。全面解析不同层级的蛋白相互作用网络,是蛋白质组学的重要任务之一,有助于揭示仅通过蛋白群体才能体现的涌现表型或特征。人类完整的互作组(interactome)涵盖约19,411个蛋白编码基因,其二元蛋白互作的估算范围在50万到300万个之间。蛋白质相互作用网络为揭示人类蛋白质社会在各个层次涌现出的特性提供了新的认知。一是在细胞内层次水平上,发现了蛋白质相互作用网络的社会构架和模块结构,如DNA复制、RNA转录、蛋白质翻译、蛋白质运输等,表明蛋白质相互作用网络中存在高度连接的拓扑模块或类群。全局性人体蛋白质相互作用组或参考图谱的描绘是分子生物学和系统生物学研究的重要基石。二是在细胞间层次上,有研究系统绘制了人体免疫细胞间的互作网络,为细胞间网络关系提供了系统认识。三是在组织或器官层次上,其特有的功能/特性很大程度上源于蛋白质选择性剪接体或组织特异性蛋白质间形成的独特互作网络。蛋白质社会群体涌现的异常特性可能导致各种人类疾病。蛋白质复合体或蛋白质机器的重构或异常组装能够引发异常的涌现,最终导致各种人类疾病的失控表型。通过比较正常和突变的蛋白质复合体组装模式,可以识别新的致病相互作用,例如在肿瘤和自闭症等研究中发现了疾病相关的蛋白质互作变化。此外,病原体也可诱发蛋白质社会的异常涌现,并导致人类疾病。多项研究系统地分析了病原体和人类蛋白质之间的互作网络,包括新型冠状病毒SARS-CoV-2和埃博拉病毒等,为传染病的临床治疗提供了宝贵的资源、药物靶点和候选药物。空间蛋白质组(蛋白质组定位图):鉴于蛋白质在组织、细胞乃至亚细胞层面精准定位与其功能之间的深刻关联,空间蛋白质组作为这一领域的核心方法,为全面解析蛋白质的空间分布、相互作用机制及其功能特性提供了强有力的支撑,进而促进了医学研究的深入发展。在空间蛋白质组的实践中,高精度的样本采集与数据分析策略占据了举足轻重的地位。这些策略通过将蛋白质组的特征与它们在生物体内的具体位置紧密关联,为临床医学带来了前所未有的创新视角。借助三维成像技术与溶剂透明化器官的质谱分析(DISCO-MS)等前沿手段,科学家们已成功识别出与动脉粥样硬化密切相关的生物标志物,并深入揭示了斑块微环境中蛋白质分布的区域性差异。针对肿瘤微环境内复杂的分子异质性以及mRNA表达水平与蛋白质定量之间的不一致性,基于激光捕获显微切割(LCM)技术的微米级分辨率采样与差异蛋白质组学的联合应用,成为了一种高效且精准的方法,用于比较肿瘤不同区域间的分子特征。这一策略不仅揭示了卵巢癌中基质细胞的关键作用,还阐明了胶质母细胞瘤中的化疗耐药机制,凸显了区域特异性蛋白质组在疾病驱动因素发现和靶向治疗策略制定中的宝贵价值。尽管细胞类型和单细胞空间蛋白质组学在追求更高灵敏度和分辨率的道路上面临诸多挑战,但这一领域的研究仍取得了显著进展。深度视觉蛋白质组(DVP)技术的引入,极大地推动了蛋白质组学研究向更深层次的发展。该技术不仅能够精确追踪从正常细胞到侵袭性黑色素瘤转变过程中的蛋白质组变化,还成功揭示了肿瘤进展中的关键失调通路。在细胞外基质动态变化的研究中,DVP技术展现出了超越单细胞转录组学的独特优势。而单细胞DVP(scDVP)的兴起,更是将空间蛋白质组的研究精度提升到了前所未有的高度,实现了无需预先定义细胞类型信息的单细胞蛋白质组分析,为生命科学领域的研究开辟了新的可能。蛋白质组学资源:随着蛋白质组学的不断发展,从数据到信息再到知识与智慧的研究范式,已通过分析和挖掘PRIDE和iProX等蛋白质组数据库中的海量数据得以体现。这些数据通过pFind和MaxQuant等工具转化为定性和定量信息。进一步,这些信息通过dbPTM、BioGRID和Human Protein Atlas等资源转化为特定生物过程和疾病机制的知识。最终,这些知识引导临床智慧,实现个性化治疗,提高患者的治疗效果。“数据-信息-知识-智慧”的研究范式凸显了整合蛋白质组学资源在实现智慧医学中的变革性影响。03 人体蛋白质组参考图谱人类蛋白质组计划(HPP)的进展显著深化了我们对人类蛋白质组的认知。根据最新报告,在19,411个GENCODE蛋白编码基因中,已有18,138个(93%)通过基于质谱的方法在蛋白质水平获得实验验证。与此同时,人类蛋白质图谱(Human Protein Atlas, HPA)项目通过整合高亲和力抗体与免疫检测技术,成功绘制了涵盖32种健康人体组织及器官的蛋白质组图谱,结合定量转录组数据,鉴定到90%以上的预测蛋白质编码基因。不仅如此,研究视野还深入到更为精细的层面,从器官整体逐步拓展至解剖区域、单个细胞乃至细胞器内部,构建了包含成年健康人类及模式生物(如小鼠)在内的多层次、多维度的蛋白质组参考图谱。这些图谱不仅详尽描绘了蛋白质的表达模式与丰度,还深入探索了包括磷酸化在内的多种蛋白质修饰状态、蛋白质变体的多样性以及复杂的蛋白质-蛋白质相互作用网络。在生物体内,各器官以其复杂而精细的层级结构,由种类繁多的细胞协同工作,共同执行特定的生理功能。为了深入剖析人体这数万亿个细胞、数千种细胞类型如何精妙配合,以维持生命活动的正常运作及揭示疾病发生的机制,科研人员采用基于质谱技术的蛋白质组学方法,对多个关键器官的不同解剖区域与细胞类型展开了深入的探索。这些开创性的研究,为心脏、大脑、皮肤及肝脏等核心器官绘制了详尽的细胞和分子图谱,揭示了器官内部各类细胞间既分工明确又紧密协作的深层机制。以肝脏为例,一项针对健康成年小鼠肝脏的细胞类型分辨率蛋白质组学研究,首次揭示了器官(肝脏)的细胞构成规律和分工原则。该研究发现,在肝脏的核心代谢过程中,实质细胞(即肝实质细胞)扮演着核心执行者的角色,而诸如肝窦内皮细胞、枯否细胞和肝星型细胞等非实质细胞,则主要通过调控机制,为这一过程提供必要的触发与调节。尤为关键的是,肝脏实质细胞通过一系列高度复杂的相互作用网络——涉及非实质细胞分泌的配体、实质细胞内的受体、转录因子及靶基因——共同维系着肝脏的动态平衡与稳态。此外,在神经科学领域,研究人员通过针对小鼠不同脑区及细胞类型的突触蛋白质组学研究,鉴定了约1800种在特定突触类型中显著富集的蛋白质,还发现了18种跨越不同突触类型、共享的关键蛋白质模块,以及特定于某些突触类型的关键节点蛋白。这些发现为我们理解突触这一神经系统基本功能单元的结构多样性、功能复杂性及其在神经信息传递中的核心作用提供了重要的分子基础。04 蛋白质组在健康监测与疾病监控中的应用健康,本质上是人体各系统间维持的一种分子动态平衡状态,其范畴超越了病理学的单一视角。血液蛋白质组,其非侵入性的采集方式,为个性化健康监测与追踪开辟了新径。随着微采样技术及可穿戴设备等前沿科技的革新,我们能够实现在一周内,每小时精准收集血液样本,从而描绘出分子的时序动态变化。这些变化,与生理和病理活动密切相关,彰显了蛋白质组学在通过追踪体内分子动态变化进而监控健康状态的能力。通过对人类生命周期中血浆蛋白质的深入研究,蛋白质组学为我们绘制了生老病死过程的全景式变化图谱。早期探索已揭示出与衰老进程及疾病发生紧密相关的蛋白质丰度周期性变化规律,这一突破性发现激发了科学界对衰老机制的深刻洞察,并催生了多达十余种衰老预测模型的构建。这些模型覆盖了阿尔茨海默病、心房颤动、脑血管疾病、糖尿病、心脏病发作、高胆固醇血症、高血压、肥胖及步态障碍等九种常见的年龄相关健康挑战。综上,血液蛋白质组图谱作为衡量人体健康状态的系统性指标,其重要性日益凸显。它不仅为我们理解和阐释生命各阶段的变化规律提供了关键信息,更成为了预测、干预乃至优化人类健康的重要工具,引领着未来医疗健康领域的创新与发展。蛋白质组学作为疾病风险评估领域的革新力量,正日益展现出其强大优势。在一项前瞻性队列研究中,科研人员成功构建了蛋白质风险评分体系,这一创新工具在预测动脉粥样硬化性心血管疾病及糖尿病风险时,其精准度显著超越了传统的多基因风险评分模型。尤为引人注目的是,血浆蛋白质组学的深入分析揭示了胶质纤维酸性蛋白(GFAP)水平作为痴呆前期长达15年的预警信号,体现了蛋白质组学在疾病超早期风险评估中的潜力和价值。值得强调的是,随着蛋白质组学技术的发展,其成果已逐步获得权威监管机构的认可与采纳。例如,FDA已批准了多种基于蛋白质生物标志物的癌症检测工具,如OVA1用于卵巢癌风险的有效评估,去γ-羧基凝血酶原(DCP)与甲胎蛋白异质体组分(AFP-L3)联合应用于肝细胞癌的精准诊断,以及CancerSEEK这一革命性检测平台,能够实现对八种不同癌症类型的全面筛查。这些里程碑式的进展不仅彰显了蛋白质组学在发现新型生物标志物方面的卓越能力,更预示着通过该技术能够显著提升现有诊断工具的敏感性和特异性,为临床决策提供坚实的数据支持。05 基于蛋白质组的个性化治疗近十年来,医学领域对疾病异质性的理解日益加深,认识到即便是被诊断为同一疾病的患者群体,其内在生物学特性亦展现出显著的多样性,迫切呼唤精准医疗的分层管理与个性化治疗策略。这一认识推动了组学技术,特别是蛋白质组学,在分子分型领域的飞速发展,使之成为精准医学探索的前沿阵地。蛋白质组学分子分型技术,通过深入挖掘肿瘤(如乳腺癌、肝癌、肺癌、胃癌及食管癌等)的复杂病理机制,为临床提供了疾病分类信息与治疗决策的科学依据。鉴于蛋白质为药物靶点的主要载体,蛋白质组学分型展现出了独特的优势:它不仅能够紧密关联患者的预后情况,更能清晰描绘出药物靶点在不同亚型患者中的表达模式,为基于亚型特异性通路和靶标蛋白的药物开发指明了方向。例如,SOAT1在肝细胞癌、NNMT在卵巢癌、CDK2在弥漫性胶质瘤均预示着针对这些靶点的干预措施能够为患者带来更加精确和有效的治疗选择。耐药性问题,作为横亘在疾病治疗道路上的巨大障碍,亟需创新性的干预策略来增强药物的敏感性或逆转耐药现象。一项针对242例高级别浆液性卵巢癌(HGSOC)患者的蛋白质组学研究揭示了脂肪酸氧化途径活跃与化疗难治性亚群之间的联系,提示CPT1A作为该途径的关键酶,可能成为提升铂类化疗敏感性的新靶点。06 挑战与希望尽管精准医学取得了极大进展,但由于医学专业的复杂性、技术的迅速发展与多样化的疾病和临床指南,于患者个体层面实现最优临床实践仍充满挑战。这种挑战主要源于临床诊断中的不确定性、理论与实践之间的鸿沟,以及临床医生可能存在的认知偏见,这些因素共同加剧了寻找最佳治疗路径的难度。在此背景下,学界开始重新审视并强调亚里士多德提出的“实践智慧(Phronesis)”概念,探讨其在应对临床不确定性及高效应用医学知识中的潜在价值。与此同时,跨学科研究的兴起为临床决策带来了革命性的变革,它倡导从人体的整体性视角出发,结合从细胞到器官的多层次交互系统分析,为临床决策提供了更为全面和深入的洞察。人工智能,尤其是深度强化学习,已在多个领域展示出卓越的决策能力,并在整合利用复杂医学知识的能力上表现突出。这表明人工智能将在未来医疗领域中发挥重要作用。鉴于此,我们正式启动了人体蛋白质组导航计划(π-HuB),旨在通过三大核心目标推动智慧医学的发展7。首要目标是利用单细胞和空间蛋白质组等尖端技术,绘制人类蛋白质组的“解剖空间图”,详尽描绘各组织和细胞内蛋白质的成分及其相互作用网络。其次,通过持续追踪个体生命周期内的蛋白质组变化,以及在各种生理病理条件下的动态调整,定义并解析人体的蛋白质组“状态空间”。最终,π-HuB项目将构建一套智能导航系统,该系统能够精准识别人体当前的身体状态,利用动态模型预测其发展演变轨迹,并据此规划最佳治疗方案。这一项目的实施,对实现蛋白质组学驱动的智慧医学具有重大意义。原文链接:https://doi.org/10.1093/nsr/nwaf278参考文献:1. Jiang, Y. et al. Proteomics identifies new therapeutic targets of early-stage hepatocellular carcinoma. Nature 567, 257-261 (2019).2. Jiang, Y. et al. The coming era of proteomics-driven precision medicine. National Science Review, nwaf278. doi:10.1093/nsr/nwaf2783. Haendel, M. A., Chute, C. G. & Robinson, P. N. Classification, ontology, and precision medicine. N. Engl. J. Med. 379,1452-1462 (2018).4. Bycroft, C. et al. The UK Biobank resource with deep phenotyping and genomic data. Nature 562, 203-209 (2018).5. Wu, H., Eckhardt, C. M. & Baccarelli, A. A. Molecular mechanisms of environmental exposures and human disease. Nat. Rev. Genet. 24, 332-344 (2023).6. Crombie, C., Junio, A. & Fraser, A. The not-so-humble worm. Genome Biol. 5, 301 (2003).7. He, F. et al. π-HuB: the proteomic navigator of the human body. Nature 636, 322-331 (2024).