秦俊法
( 中 国 科 学 院 上 海 应 用 物 理 研 究 所 ,上 海 201800)
摘 要 :上世纪 80 年代,我国科学家首次将模式识别技术成功地应用于生物微量元素研究领域,
从而开启了微量元素组学研究的新时代。详细介绍了微量元素组学方法的形成和发展历程,微量
元素组学策略的构成和应用实例,以及微量元素组学研究的现状和发展趋势。
关键词 :微量元素;微量元素组学;模式识别;中国
中图分类号 : S 963. 734 文献标识码 : A
Trace Elementomics in the Formation and Development of China
QIN Junfa
(Chinese Academy of Sciences Shanghai Institute of Applied Physics, Shanghai 201800, China)
Abstract : In the 1980 s, scientists for the first time in our country has been successfully used in the
pattern recognition technology to the biological trace element research field, thus opened up the study of
trace elementsomics new era. Trace elements are introduced in detail the formation and development of
group learning method. Trace element composition of group learning strategies and some application
examples, and studies the status quo and development trend of the trace elementsomics.
Key words : trace elements ; trace elementsomics ; pattern recognition ; China
曾有人说,在微量元素科学领域中,充满着诱人的发现和创造的机会。微量元素科学的核心
是微量元素医学。在过去几十年中,微量元素医学研究的最大发现是一切人类疾病均与其体内微
量元素失衡有关,据此建立了微量元素平衡医学理论;微量元素医学研究的最大创造是运用微量
元素诊断和预报人类疾病,从而诞生了一门称作为微量元素组学的新学科。
微量元素组学是微量元素医学的核心和支柱。应用微量元素组学策略,中国在微量元素科学
研究中取得了令世人瞩目的成就。本文叙述微量元素组学在中国的形成和发展的历程。
1 缘 起
癌症是人类生命的最重要杀手。在 20 世纪 70 — 80 年代,许多与肿瘤有关的标记物,除少
数以外,均缺乏特异性,利用一、二个非特异的生物标记物来进行普查或早期诊断,准确率往往
难以提高。有人指出,采用多种标记物对癌症的正确诊断可能有重要意义。根 据 SZENT-
GYORGYI(1979) 学派的观点,癌症应在亚分子层次就已有所表现,这意味着从微量元素谱着手
捕捉早期癌症的信息可能也是一种途径。问题的关键在于如何有效处理复杂的数据资料 。 BOULL
等(1979)用非线性映照法研究微量元素,未能获得满意的结果。 SEPPALA 等(1982)对多种标记
物的数据处理也缺乏有力的数学工具。
中国科学家徐辉碧等[1]利用27个国家和地区7 种元素平均摄入量和乳腺癌死亡率数据研究
了砸的拮抗元素的作用,结果表明,在一定的条件下,多元线性回归法可以将几种拮抗元素的作
用简化为一种元素对砸的拮抗,用砸和主要拮抗元素及其相应的乳腺癌死亡率作图,发现较高死
亡率和较低死亡率之间有明显的分界线,分界线的斜率反映元素的拮抗程度。徐辉碧等[2]还用
计算机模式识别法对上述同一组数据进行分类研究,在非线性映照所得特征面上,有分别对应于
癌症高、低死亡率的两个区域,所有代表癌症死亡率低的点均落在同一个区域,而所有代表癌症
死亡率高的点均落在另一个区域,无一例外(图 1)。这说明应用这个方法进行分类是成功的。从
这个研究结果可以推测,根据人群对微量元素的摄入量可以预报一个地区的乳腺癌,根据这种方
法有可能建立起一种微量元素谱一计算机模式识别法应用于与微量元素有关的疾病诊断。
2 微量元素组学的兴起和形成
从砸的拮抗元素作用的研究中可以看出,人类的疾病与健康实质上是多种微量元素相互作用
的综合表现,体内微量元素代谢平衡不同,微量元素相互作用的大小也不同,故有可能按不同健
康状态所对应的微量元素谱进行健康水平分类。根据这种设想,华中工学院徐辉碧等[3]系统研
究了有关微量元素分类的数学方法,结果表明,模式识别中的非线性映照法和判别分析法均适用
于疾病的微量元素分类,用这种方法研究肺癌、乳腺癌、鼻咽癌、肝癌、宫颈癌及长寿等问题,
均得到了较好的结果。例如,他们采集云南锡矿矿工中67 名健康人、22例早期肺癌和28例晚
期肺癌病人的头发样品,测定了 8 种微量元素含量,取其中88个样品用于建立判别函数,其余
29个样品用作验证。结果判别检验的准确率分别是:健康者8 8 % ,肺癌初期患者8 6 % ,肺癌患
者 100% (图2)。在其后的5 年内,对 1899份云锡矿工进行头发8 种元素检测,摸索出了预报云
锡矿工肺癌的一个较好的微量元素谱 — As 、 Mn 、 Zn 、 Cu ,对 342名矿工(其中34人后来确诊
为肺癌)进行检验,有 32人预报为肺癌,预报准确率为9 4 % 。
中国科学院上海冶金研究所陈念贻等和刘征先等结合胃镜检查,以病人全血中6种元
素为特征量,用非线性映照法分类,不仅证明全血微量元素检验对胃癌病人有 90% 以上的符合
率 ,还能区分不典型增生和单纯胃溃疡,而不典型增生是癌的前期病变(图 3 ) 。 用组织样品中 9
种元素的识别结果,对癌症组和溃疡组的判别正确率也达 90 % 。
华中工学院和上海冶金所的研究结果表明,用正确的方法测定微量元素,并用模式识别法对
测量数据进行处理和分析,可对研究对象或样品属性进行判别和分类。模式识别在生物微量元素
谱研究中的成功应用开启了微量元素组学研究的新时代。
在微量元素组学的形成和发展过程中,数据解析技术的发展起着关键的作用,除上述多元判
别分析、非线性映照外,偏最小二乘法、人工神经网络法、支持向量机法也先后应用于微量元素
医学研究领域。例如,王小如等[6]应 用 ICP - AES 法 和 AAS 法测定正常人和癌症病人头发和血
清样品中13种元素,用偏最小二乘法处理76个血清样品和用非线性多元判别分析法处理106个
头发样品,结果在两种情况下均得到了病人和正常人分类极其清晰的二维判别图(图4)。血清样
本和头发样本对病人的判别失误率分别为4. 8 % 和0. 0 % ,对正常人的判别失误率均为0. 0 % 。蒋
淑梅等[7_8]测定脑栓塞和冠心病患者血清中8 种元素含量后,对所得数据用反向传播神经网络进
行分析,建立神经网络识别系统,结果对病人组和各自对照组的预报识别率均达1〇〇%。陈瑞兰
等[9]用头发中 Al 、 Cu 、 Zn 、 Ca 、 Mg 含 量及 Zn / Cu 比值建模研究微量元素与高血压的相关性,
结果支持向量机算法对高血压患者和健康人的分类正确率达96. 2 % ,留一法的预报准确率
为 86. 7 % 。
我国科技文献中分别于1991、1995和 2002年首次出现偏最小二乘法、人工神经网络法和支
持向量机法应用于生物微量元素研究的正式报道(表 1)。偏最小二乘判别分析法可用于寻找或筛
选生物标记物;神经网络法有不依赖于概率模型和参数自学习等优点;支持向量机法能较好地解
决小样本、非线性、高维数和局部极小点等问题。这表明,到 21世纪初,微量元素医学领域的
数据解析技术 — 微量元素谱模式识别法已经形成了一个比较完善的理论体系,这为微量元素
组学的正式形成奠定了坚实的基础。
3 微量元素组学的完善和成熟
根据研究的对象和目的不同,微量元素组学研究策略可以分为 4 个层次,即元素靶标分析
(一种或数种元素分析)、元素指纹分析(特定分析技术的整体定性分析)、元素谱分析(预设的多
种元素分析)、元素组分析(多元素或全元素分析)。我国至今所报道的微量元素组学研究,大多
数属于前三个层次,严格地说,只有最后一个层次才是真正意义上的微量元素组学研究。
微量元素组学研究方法的最大特点是高通量分析。本世纪以来,有越来越多的研究结果表
明,任何疾病的发生不只是与一种或数种微量元素含量异常有关,有时甚至牵连到几十种元素。
如陈祥友等[1°]在头发 35 种元素检验中发现,与相同性别、相同或相近年龄正常人比较,脑中
风、红斑狼疮、帕金森氏综合征患者各有 18 种元素含量异常,艾滋病人有 20 种元素含量异常,
血小板减少患者有 26 种元素含量异常(表 2 ) 。 另一方面, ICP-M S 等高通量定量分析技术在这
一时期也已得到更加广泛的应用,多元素测定已经成为微量元素医学研究中的一种新常态(表
3 )。
20 世纪 90 年代之后,随着生命科学研究的深入,出现了各种组学的新概念和新学科,微量
元素组学也就应运而生。
微量元素组学由三个主要部分组成,即:样品收集和制备,元素检测和鉴定,数据处理和分
析。虽然微量元素组学研究在中国已有 30 多年的历史,但直到本世纪第一个 10 年才被正式命
名。 2009 年 ,上海交通大学赵铁[11]首次正式提出了血清微量元素组学的假设,并建立了 ICP -
MS 分析血清中 65 种元素的组学方法学,应用于寻找与临床骨关节炎相关的差异性元素。 2014
年,中国科学院上海应用物理研究所秦俊法在“微量元素改变中国的科学面貌”一文中首
次详细列举了中国科学家在头发、血液、组织、中药、基因和蛋白质微量元素组学研究中取得的
成果,提出了中国“首创微量元素组学”的新见解。这就表明,微量元素组学这门新兴学科已
经完善和成熟,并已得到认可。
4 微量元素医学研究的理想工具
微量元素组学最重要的研究目标是阐明生物体中微量元素的生物学作用和功能,其首要任务
是定量或定性地分析生物体中的微量元素,比较不同状态或不同物体中微量元素的差异,研究不
同生理或不同病理状态下微量元素变化规律。微量元素组学研究可以给出生物体内微量元素的含
量、分布、形态和相互作用的信息,可以区分不同类型的样本并寻找反映这种区别的生物标记
物,可以识别和诊断疾病,可以量化和鉴定中药品质,可以监督疾病的进程和治疗效果,因而微
量元素组学策略是微量元素医学研究的理想工具。
(1)不同方法识别效果比较:如前所述,在微量元素医学领域,最常用的模式识别法包括:
聚类分析法、主成分分析法、判别函数法、非线性映照法、 K 最近邻法、偏最小二乘法、神经网
络法、支持向量机法。对于同类样品和同样数据,不同的方法可能出现不同的识别效果。重庆大
学袁前飞等[14]比较了 4 种方法对癌症病人和正常人基于血液中 6 种元素的判别结果,支持向量
机的 5 次交叉验证准确率达到 95. 95% , 优于 K 最近邻法 (93. 24% ) 、 人工神经网络法 (94. 59% )
和决策树法 (79. 73% ) 。 上海大学陈念贻等[15]基于茶叶中 8 种元素对乌龙茶与红茶、乌龙茶与绿
茶所作的研究也表明,支持向量机法优于决策树法和 Fishei •判别法;支持向量机的预报正确率均
为 100. 0% , 决策树法分别为 90. 0% 和 90. 4% , 判别分析法分别为 96. 6% 和 100. 0 % 。
(2) 不同属性样本判别效果比较:在微量元素医学领域,可供实际应用的临床样本主要有头
发、血液和尿液。对于同类疾病和同样数据,不同属性样本可能具有相近或不同的诊断效果。沈
阳药科大学硕士研究生陈丹丹[16]和李丹[17]分别用判别函数法和支持向量机法对心血管病和糖尿
病进行比较研究。结果头发、全血和尿液9 种元素对心血管病的判别正确率分别为93. 4 % 、
89. 7 % 和 91. 3 % ,对 II 型糖尿病的判别正确率分别为97. 0 % 、95. 8 % 和 96. 9 % 。
(3) 生物标记物筛选:病例对照研究中采用单维检验法能够获得疾病与健康的差异性元素,
但差异性元素不一定都是疾病的生物标记物。组学策略采用单维和多维统计相结合的方法寻找潜
在生物标记物,常用的筛选标准有变量权重重要性排序、载荷权重和相关系数。福建医科大学硕
士研究生陈小红[18]测定孕妇头发中24种元素,秩和检验表明,胎儿先天性心脏病孕母有10种
元素含量显著高于正常对照组。多因素 Logistic 回归分析筛选出头发 As 、 Se 、 Ba 、孕前3 个月接
触噪音和孕期接触化学试剂5 个危险因素。上海交通大学博士研究生赵铁[11]测定血清中65种元
素,正交偏最小二乘判别分析(0 PLS - DA )发现,膝骨关节炎有3 0 多种异常性元素,其 中 Li 、
Ga 、 Br 、 Sn 、 I 、 Ba 、 Ce 、 U 、 Mg 、 Ca 可看作是潜在元素标记物;急性痛风性关节炎有20种差
异性元素, Sr 、 Li 、 Ce 、 Cu 、 Fe 、 U 可能是痛风发作的重要参与因素; Li 、 Sr 、 Mo 、 Cs 、 U 可能
是伴发高血压与否的潜在元素标记物。赵铁等[19]用偏最小二乘判别分析模型发现,无论是强直
性脊柱炎湿热症患者还是痛风性关节炎湿热症患者,血清 Cu 、 Rb 、 Cs 水平均显著高于相应健康
志愿者,血清 Cu 、 Pb 、 Cs 可能是风湿性疾病湿热症的共性元素标记物。上海交通大学博士研究
生李昕[2°]测定血清中60多种元素,发现神经管缺陷孕母有36种差异性元素,正交偏最小二乘
判别模型 V 型图(图5)显示,正常孕母组血中 Sr 、 Ca 、 Pt 等元素较多,而神经管缺陷孕母组 S 、
Hg 、 Mg 、 Se 、 Zn 等元素较多,这些元素可能是出生缺陷的潜在性元素标记物。
(4) 疾病诊断:利用差异性元素或元素标记物,可以对不同健康状况的样品进行分类和诊
断。上海大学张列净等[21]测定前列腺癌症病人和正常人头发中20种元素,用主成分模式识别法
筛查结果, Ca 和 P 是两类样本分类和判别的最重要元素,用这两种元素建立的模型用以预报前
列腺癌,其准确率达到了 1〇〇%。湖南怀化学院杨兴华等[22]测定头发中9 种元素,用支持向量机
算法研究老年痴呆与头发微量元素的相关性,发现7 种差异性元素,但无论是用 Al 、 Mn 、 Pb 、
Cd 4 元素或 Al 、 Mn 、 Cd 3 元素建模,判别正确率和预报准确率均可达100%。赵铁[11]的研究表
明,正交偏最小二乘判别分析模型可以成功地将骨关节炎患者和健康志愿者样本分离(图 6); Li
和 Sn 这两种元素在骨关节炎患者血清内浓度较高。
5 唯一能将所有组学整合在一起的前沿学科
在微量元素组学的形成过程中,曾经出现过另一个类似的名称 — 金属组学,这个名称提
出较早(2002年)而且目前仍在延用。微量元素组学和金属组学有不同的研究侧重点。微量元素
组学研究的主要目标是从多元素共同作用的角度对不同健康状况、不同症候、不同药物等进行判
别、分类、诊断和预测,金属组学研究的最重要目标则是从金属和类金属元素在生物体或环境系
统的含量、分布、形态、结构阐明金属元素的生物学作用、功能及其机制。微量元素组学的研究
方法强调高通量元素的含量分析,金属组学则特别强调金属或类金属的形态或结构分析。微量元
素组学 (trace elementomics )和金属组学( metallomics )的共同点都是以细胞、器官或组织作为研究
对象,都是研究生物体中微量元素的生物学作用及其变化规律,因而两者都属微量元素组学
范畴。
(1) 微量元素与其他组学的整合。微量元素组学是继基因组学、转录组学、蛋白质组学、代
谢组学之后发展起来的一门新兴学科,各组学之间有着明显的差别,也存在密切的联系。生物体
的生命现象是基因、 mRNA 、蛋白质、代谢产物、细胞、组织、器官、个体和群体各个层次有机
结合和共同作用的结果。生物信息从 DNA 、 mRNA 、蛋白质、代谢产物、细胞、组织、器官、个
体的方向进行流动,逐渐形成了这几个自下而上逐渐上升的研究层次。基因组学、蛋白质组学、
代谢组学的研究对象处于生命信息流的下游和中游,而微量元素组学的研究对象相对处于生命信
息流的上游(图 7 ) 。
由于微量元素不仅参与遗传信息的转录和翻译、生物分子的修饰、蛋白质的合成、酶的催
化 ,以及物质传递、能量生成和信息传导等许多生命过程,而且各个层次的物质也都与微量元素
有关,因而微量元素将是唯一能将基因组学、转录组学、蛋白质组学、代谢组学等整合在一起的
研究分支。
(2) 蛋白质微量元素组学。近年来,随着组学研究的迅速发展,越来越多的蛋白质被发现必
须结合至少一种微量元素才能行使正常的功能,而许多微量元素也已发现具有不同数量的蛋白质
家族。例如,据刘克钦等[23]报道,锌结合蛋白广泛存在于早期所研究的所有57种物种中,人至
少有 2 800 个锌蛋白;某些原核生物的铜蛋白质有 25 个 ,而某些陆地真核生物的铜蛋白可达到
78 个 ;陆生生物有 10〜 11 个含钼酶,而某些原核生物(如脱氯菌)中有 63 个含钼酶;大多数原
核生物只含有较少的镍蛋白质组和钴蛋白质组(1 〜4 个蛋白),但某些生物含有高达16个含镍
蛋白和 35 个 B12 结合蛋白;人和小鼠中各有 25 个和 24 个砸蛋白,但某些原核生物和某些真核生
物可能至少各含有60个砸蛋白。这些事实表明,微量元素蛋白质组的比较基因组学研究将大大
增强人们对微量元素的代谢、功能和进化趋势的认识。
(3)组学策略联合应用举例。多种研究方法或几种组学技术的联合应用,将会为微量元素医
学提供更多的新信息。国家清史纂修工程重大学术问题研究专题组钟里满等[24]采用元素含量测
定与元素形态分析相结合的方法,解开了困扰历史学界百年之久的光绪皇帝死因之谜:光绪头发
及衣物中存在高含量的砷,其化学形态为三氧化二砷,结论是清光绪帝系舭霜中毒而死。包头医
学院第一附属医院刘鹤鸣等[25]通过测定内蒙古白云鄂博稀土矿工头发稀土元素含量(微量元素组
学分析)和血清蛋白质组学分析,发现矿工组头发15种稀土元素中有8 种元素含量显著高于非矿
区健康人,血清蛋白组中有29种蛋白表达异常,首次揭示黏多糖和纤维连接蛋白可能在稀土元
素致病理性纤维化发生过程中发挥重要作用。
6 小 结
(1) 微量元素组学包括三个主要组成部分,即:样品的收集和制备,元素的检测和鉴定,数
据的处理和分析。根据研究对象和目的的不同,微量元素组学分析可以分为4 个研究层次,艮 P :
元素靶标分析、元素指纹分析、元素谱分析和全元素分析,严格地说,只有第4 个层次才是真正
意义上的微量元素组学研究。
(2) 微量元素组学的形成与微量元素数据处理技术的发展密切相关,微量元素组学技术由中
国科学家于上世纪80年代首创,但直到本世纪第一个10年才被正式命名。微量元素平衡学说的
正式提出,高通量分析技术的广泛使用,以及微量元素模式识别体系的逐渐完善是微量元素组学
完善和成熟的三大标志。
(3) 微量元素组学是微量元素医学研究的理想工具,也是唯一能将所有组学整合在一起的前
沿交叉学科。
参考文献:
[1 ] 徐辉碧,朱治良,钱晓良,等 . 用统计模式识别法研究硒与某些微量元素的拮抗作用 [J ].分子科学与化学
研究 , 1982 (4) : 185 -191.
[2 ] 徐辉碧,陈念贻,江乃雄,等 . 用计算机模式识别非线性映照法研究硒的拮抗元素的作用 [J ].分子科学与
化学研究 , 1983 (2) : 139 -142.
[3 ] 徐辉碧,朱治良,余明书,等 . 模式识别法在生物微量元素谱研究中的应用 [J]. 科学通报 , 1985 (14):
1085 - 1086.
[4 ] 陈念贻,史奎雄,郭孝达,等 . 模式识别在胃癌早期诊断中的应用 [J ]. 自然杂志, 1984, 7(12): 947.
[5 J 刘征先,史奎雄,郭孝达,等 . 胃癌与消化性溃疡患者的微量元素谱模式识别 [J ]. 中华肿瘤杂志, 1987,
9(3) : 173 - 174.
[52] LIU Z X, QIANG M, CHEN N Y, et al. Sub - molecular aspects of cancer IH : Trace elements in blood and
stomach tissue to diagnose gastric carcinoma [ J]. Journal of Advancement in Medicine, 1988, 1(4 ) : 204 - 217.
[6 ] 王小如,朱尔一,庄峙厦,等 . 用于癌症病人初级临床诊断的化学计量学研究 [J]. 化学学报, 1993, 51:
1094 - 1098.
[7 ] 蒋淑梅,柯以侃,时彦,等 . 脑栓塞患者血清中微量元素的原子吸收光谱测定及人工神经网络分析 [J ].北
京化工大学学报:自然科学版, 1999, 26(3): 70 - 72.
[8 ] 蒋淑梅,柯以侃,时彦,等 . 冠心病患者血清中微量元素的原子吸收光谱测定及人工神经网络分析 [J ].分
析试验室, 1999, 18(2) : 42 - 43.
[9 ] 陈瑞兰,陆文聪,刘旭,等 . 支持向量机算法研究头发微量元素与高血压的相关性 [J ] . 计算机与应用化
学 , 2003, 20(5) : 567 - 570.
[1 〇 ] 陈祥友,孙嘉淮,陈建达,等 .Awls 与正常人各 125 例头发 ICP35 种元素检验结果比较 [J ] . 世界元素医
学, 2006 , 13(3) : 1 - 4.
[11] 赵铁 . 血清微量元素组学及其在痛风性关节炎病理研究中的应用 [D ]. 上海交通大学博士学位论文, 2009.
[12] 秦俊法 . 微量元素改变中国的科学面貌(下) [J]. 广东微量元素科学, 2014, 21(9): 32 - 52.
[13] 秦俊法 . 试谈中国特色的现代微量元素研究 [J]. 广东微量元素科学, 2014, 21(10): 30 - 35.
[14] 袁前飞,蔡从中,肖汉光,等 . 基于人体血液常量 / 微量元素含量的支持向量机癌症辅助诊断 [J ].生物医
学工程学杂志, 2007, 24(3): 513 - 518.
[15] 陈念贻,陆文聪,陈瑞兰,等 . 支量向量机 - 微量元素分析法判别乌龙茶、红茶和绿茶 [J ] . 计算机与应
用化学, 2002 , 19(6): 719 - 720.
[16] 陈丹丹 . 微量元素化学模式识别早期诊断肺癌和心血管疾病的方法学研究 [D ].沈阳药科大学硕士学位论
文, 2007.
[17] 李丹 . 支持向量机 - 微量元素法用于 n 型糖尿病的模式识别 [D ]. 沈阳药科大学硕士学位论文, 2009.
[18] 陈小红 . 福建省孕妇头发化学元素含量及其相关因素与胎儿先天性心脏病的关系 [D ].福建医科大学硕士
学位论文, 2014.
[19] 赵铁,张英泽,王晓雪,等 . 基于微量元素组学的风湿性疾病湿热症共性特征研究 [J]. 中医杂志, 2014,
55(24) : 2100 - 2105.
[20] 李昕 . 基于色谱质谱联用技术的出生缺陷代谢组学和金属组学的研究 [J ] . 上海交通大学博士学位论
文, 2009.
[21] 张列睁,尹京苑,李重河,等 . 用头发微量元素诊断前列腺肿瘤的研究 [J]. 计算机与应用化学, 2009,
26(6) : 705 - 711.
[22] 杨兴华,肖缇,吴锋 . 基于支持向量机的老年痴呆 - 头发微量元素相关性研究 [J]. 计算机与应用化学,
2013, 30(2) : 125 - 128.
[23] 刘克钦,陈康民,张 焱 . 微量元素蛋白质组的比较基因组学研究 [J ]. 生命科学, 2012, 24(8): 948
-965.
[24] 钟里满,耿左车,王珂,等 . 清光绪帝死因研究工作报告 [J]. 清史研究, 2008(4): 1 - 12.
[25] 刘鹤鸣,王玉璐,杨增华,等 . 稀土元素致病理性纤维化的定量蛋白组学分析 [J]. 西安医科大学学报,
2015, 36(3) : 422 - 426.