作者简介:孙晓霞(1974-),女,山东荣成人,研究员,主要从事浮游生态学研究. E-mail:xsun@qdio.ac.cn
浮游生物图像自动识别技术是当前海洋浮游生态学的研究热点。该技术结合水体成像系统和自动识别软件,能够对浮游生物的种类组成和丰度进行快速自动识别和定量分析,从而获得关于浮游生物分布和丰度更及时、更准确的信息,为大尺度、实时、连续地研究浮游生物分类学和生态学特征提供了一种有效手段。重点分析了当前国际上浮游生物图像识别技术研究的最新进展、主要应用领域、存在的问题以及未来的发展方向,旨在进一步推进该技术在我国近海及大洋浮游生态学及相关研究领域中的应用。
Automated marine plankton image identification technique is a hot issue in the research of marine plankton ecology. By combining imaging systems and automatic classification software, these techniques are good at rapid identification and quantitative analysis on composition and abundance of plankton samples, which provides an efficient way to study the ecology and taxonomy of plankton continuously on a large scale. The development of planktonimaging systems, including ZooScan, Video Plankton Recoder, Underwater Video Profiler, FlowCAM, CytoSense and Holography, was reviewed. The techniques for automated identification of plankton images were introduced accordingly. The application of this technique in the field of marine ecosystem long term observation, size spectra and plankton biomass estimation was analyzed. The perspective and challenge were proposed finally. It is anticipated to promote the application of this technique in the research of coastal and oceanic plankton ecology and relevant fields in China.
浮游生物是海洋生态系统中非常重要的类群,是海洋生物生产过程的核心之一,是海洋食物网的基础和关键组成部分。国际上许多重大研究计划,如全球海洋生态系统动力学研究(Global Ocean Ecosystem Dynamics, GLOBEC)、海洋生物地球化学与生态系统整合研究(Integrated Marine Biogeochemistry and Ecosystem Research, IMBER)和全球海洋生物普查计划(Census of Marine Life, CoML)等,均将浮游生物作为重要观测内容。由于浮游生物的复杂性,当前海洋浮游生物观测研究面临的一个瓶颈问题是难以在较大的时空尺度上快速测量其数量与种类组成的变化。网采、泵采和瓶采仍然是当前浮游生物采样技术的核心,也是许多长时间序列研究和海洋研究计划的基础。这些传统采样技术所面临的一个挑战是只能在相对较低的时空精度采集样品,且样品分析的周期很长。现在已经普遍认识到许多与浮游生物有关的重要生态学过程发生在更为精细的时空尺度上,使用传统的采样方法难以达到。而且,拖网经常会扰乱浮游生物的分布特征(如斑块分布、薄层分布等),这些特征对于更好地了解浮游生物群落结构和分布非常重要,只有通过现场原位观测系统才能保持。另一个挑战是生态学上重要但易受损伤的类群,如胶质类浮游动物[ 1],使用传统网具采集容易低估它们的数量。
在过去的十几年间,创新性的原位和实验室成像系统得到快速发展,使精细时空尺度上的浮游生物研究成为可能。图像自动识别系统的一个主要优势是能够快速、自动进行浮游生物的分类识别,有效弥补分类学人才短缺造成的数据获取滞后。另外,通过原位成像系统,能够在不接触目标生物的情况下采集浮游生物分布和丰度的信息。这对于研究网采中易受损伤的胶质类浮游生物尤其有效。能力强大的成像系统能够提供海盆尺度上浮游生物分布近乎连续的图像[ 2]。与此相适应,利用图像处理和模式识别技术进行浮游生物的自动分类与计数已成为该领域的研究热点。2007年5月在日本广岛举行的第4届国际浮游动物大会设立了一个专门会议“成像技术进展及图像分析在浮游生物计数和识别中的应用”,鼓励进行与浮游生物自动识别研究相关的交流活动。2010年,《自然》杂志上发表观点,认为现在应进入图像自动识别的时代[ 3]。目前,浮游生物图像识别研究已经取得显著进展。本文重点介绍国际上浮游生物成像系统和自动识别技术的研究进展、主要应用领域、存在的问题以及未来的发展方向,以进一步推进该技术在我国近海及大洋浮游生态学及相关研究领域中的应用。
浮游生物观测的最终目的是对目标生物的分布、丰度、大小或生物量进行准确估计。浮游生物成像系统能够在水平和垂直的精细尺度上产生浮游生物的分布数据。与传统浮游生物样品处理过程相比,浮游生物图像分析能够节约大量时间。为此,许多研究组织正在开发有效的方法,从浮游生物图像中提取有用信息。根据不同的应用目的,目前的浮游生物成像系统可分为两大类,即实验室成像系统和野外原位成像系统。
对于已经采集并使用固定剂保存的浮游生物样品,可以在实验室直接进行成像和数字化。这种方法逐渐成为一种越来越普遍的样品保存方式。自1979年剪影照片[ 4]被首次用来进行网采浮游生物样品的记录以来,对浮游生物样品直接进行录像和数字化的技术开始发展,并逐步用于浮游生物的自动识别[ 5]和大小的测定[ 6, 7]。浮游生物扫描仪(ZooScan)的出现是浮游生物图像领域一个重要的发展,能为已经保存的浮游生物样品创造高精度的数字记录[ 8]。结合扫描传感器、光学系统和防水扫描室,可以将浮游动物样品置入其中,在高分辨率下数字化,并且毫无损伤地回收样品。所产生的图像能够通过专门的软件进行识别、计数和测定。这种方法已在一些海域得到很好应用,如地中海、加利福尼亚沿海等[ 9],并取得了一系列的研究成果。ZooScan技术在我国浮游动物生态学研究中也得到了有效应用,对于胶州湾毛颚类、桡足类、夜光虫等优势类群的识别准确率高达90%以上,通过后期人工校正,准确率达到100%[ 10]。ZooScan技术有效地推动了浮游动物样品的分析效率,为大尺度、长时间序列的浮游生物生态学和功能类群的研究提供了一种快速、标准化的手段。
在野外原位成像系统的研究中,Davis等[ 11]于1992年开发了第一个能原位自动识别和计数浮游生物种类并实时高精度定量描绘其丰度和分布格局的装置——浮游生物视频记录器(Video Plankton Recorder,VPR),成为现代原位浮游生物成像装置的先驱。该装置在1997年全球海洋生态系统动力学(Global Ocean Ecosystem Dynamics, GLOBEC)乔治海岸野外项目的研究中发挥了重要作用[ 11]。此后,原位成像系统迅速发展,目前应用较好的有水下视频剖面仪 (Underwater Video Profiler, UVP), 浮游生物视频记录器二代 (Video Plankton Recorder II, VPR II)等[ 12, 13, 14]。二者的工作方式不同,UVP多用于浮游动物垂直剖面的定量观测,最新型号的UVP5可以与温盐深探测仪CTD(Salinity Temperature Depth)整合,也可与浮标结合,实时获取图像与环境信息。VPR主要用于水平拖曳,记录0.2~20.0 mm粒级浮游生物的水平分布格局。上述系统主要聚焦于中型浮游生物的成像,可以根据不同的研究需求选取。在此基础上,小型和微型浮游生物的原位观测研究也取得进展,如流式影像术(FlowCAM)主要用来进行微型浮游动物和浮游植物的成像与自动分析,工作粒径范围降低到5~1 000 靘。王雨等[ 15]和任琳琳[ 16]分别对流式影像术的功能及其在我国近海浮游植物生态学研究中的应用进行了研究。浮游植物流式细胞仪(CytoSense,CytoBuoy,CytoSub)结合流式技术与成像技术,实现从微微型到小型浮游植物信息的获取,为全粒级浮游植物的原位观测提供了一种有效方法。为检验成像系统在浮游生物观测研究中的性能,Remsen 等[ 17]同时利用浮游生物网、光学浮游生物计数器(Optical Plankton Counter, OPC)和浮游生物成像系统SIPPER对墨西哥湾中型浮游动物的丰度、生物量、种类组成和大小分布进行了比较研究。结果表明,与成像系统的结果相比,传统的网采方法明显低估了一些重要类群的丰度和生物量,建议在以后的浮游生物调查中逐渐引入浮游生物成像系统作为参考。Basedow等[ 18]在2013年比较了2种光学浮游生物计数器——LOPC和VPR,并对挪威北部2个峡湾的飞马哲水蚤的种群丰度进行了研究。结果表明飞马哲水蚤不同生长发育期的丰度表现出非常高的相似性,垂直剖面分布未表现出明显差异。该研究认为现在基于图像观测的时机已经成熟,应该更广泛地使用光学设备来估计浮游生物在海洋中的丰度和分布。
在二维(2D)成像技术的基础上,三维(3D)成像技术为研究海洋生态系统提供了一种新的、重要的备选方案,如全息成像技术。全息成像的独特之处在于能够在不产生干扰的情况下,获取大体积水体(>1 000 mL)的高精度图像,能够原位记录活体的、运动的生物的自然状态及其准确的三维空间位置。对于完全透明的生物也能够得到很好的记录。Knox[ 19]和Beers等[ 20]分别在室内对全息成像系统的性能进行了定性试验。Stewart等[ 21]采用全息相机进行了野外水下观测。Heflinger等[ 22]和Briones等[ 23]能够以很高的精度记录大的桡足类和小的硅藻,精度可以达到3 靘。1979年Cader[ 24]及其合作者首次使用全息成像定量研究海洋颗粒物。Costello等[ 25]将精度提高至12 靘。1997年建立的HOLOMAR系统将成像水体扩大至100 L,该系统在2000年和2001年的海试中,获得了大量的3D图像资料[ 26]。与2D成像系统相比,全息成像的局限性在于数据量大、成本高、技术挑战性高。
除了获取浮游生物的种类数量和分布外,3D成像系统也被用于追踪深海水母的分布、浮游动物原位行为研究等[ 27, 28]。 Hwang等[ 29]曾使用3D激光视频系统对固着和自由的桡足类进行比较研究。Malkiel等[ 30]使用数字全息系统,揭示桡足类的捕食流场。更多关于成像系统的应用可参考Dahms等[ 31]和陈纪新等[ 32]的研究综述。
原位和实验室成像技术的发展带来一个新的问题:由于这些系统产生的海量图像和信息,对这些系统的图像进行人工分析是不现实的。要解决这一问题,必须进行浮游生物样品的自动识别。
浮游生物图像的自动分类与识别需要解决一系列的问题。浮游生物包括各种形态不同的类群,同时水体中还存在各种非生物颗粒如海雪、沉积物颗粒、气泡等。浮游生物个体大小差别很大,某些门类在个体发育过程中要经历显著的形态变化。 由于图像精度和生物体位的限制,并非所有图像都能看出明确的分类特征。原位采集的浮游生物图像则呈现不同的三维方位。即使是保存的或新采集的样品背面和腹面也可能相差很大。因此同一个体的图像可能表现出显著不同的特征。此外,几种不同的生物可能会叠加在一张图像中,共生生物也会导致一张图像中包含多个物种的信息。
浮游生物图像自动识别性能主要依赖于浮游生物分类器的构建。Culverhouse[ 33]开发了一个通过人工神经网络进行甲藻分类的软件系统(Dinoflagellate Categorisation by Artificial Neural Network, DiCANN),该系统主要利用细胞形状和表面纹理特征进行分析。目前已经开发成为模型,能够进行海洋生物群、属和种的分类。进一步使用DiCANN分辨几种形态学上相似的甲藻种类,有些种类表现出多态现象。通过判别分析辨别3种形态学上相近的种类( Dinophysis acuta, D. acuminata, D. fortii),总体平均准确率可达72%,与人工分类的能力相当[ 34]。PechPacheco等[ 35]首次使用一种光学—数字系统进行浮游植物角藻属( Ceratium)的5个种类的识别,准确率达到90%以上。使用VPR自动识别浮游生物的研究表明自动分类方法对于主要门类丰度的估计已足够准确,对其中7个门类自动识别的准确率为60%~70%,对2个门类识别的准确率达到79%~82%,因此可以用来对主要生物门类进行海上实时定量监测[ 11]。为了进一步降低图像自动识别软件的误差,Hu等[ 36]尝试了一种双重分类方法,首先使用神经网络分类器,以形态特征为基础进行浮游生物图像识别,然后以表面结构特征为基础进行识别。只有这2种识别一致时,才能将浮游生物归类,否则,将其标记为未知。这种双重分类方法极大地降低了错误率,对浮游生物丰度较低的区域能给予较好估计。所产生的丰度数据与人工分类结果很相近。除了根据形态结构特征进行浮游生物自动识别外,还可以利用计算机技术对发光浮游生物的水下图像进行定量、跟踪和识别。这类系统通过自动识别发光体并提取分类特征,如持续时间、尺寸等,并利用这些信息进行浮游生物分类。据报道该方法的性能也与人工分类相当[ 37]。ZooProcess是专门针对浮游生物扫描仪ZooScan开发的软件系统,它结合图像分类和识别软件Plankton Identifier使用,有7种自动识别算法可供选择,能够对浮游生物样品进行快速的自动识别与定量分析。已经证明ZooProcess的自动识别性能与分类学家进行人工分类的性能相当,某些重要的浮游动物类群,如桡足类、箭虫等自动识别准确率达到90%以上。该技术已应用于地中海、北海等全球重要海域的浮游生物研究,验证了许多有意义的生态现象与科学假说。另一个图像识别软件ZooImage是作为一个集成系统被设计出来的,可以进行输入、分割、特征提取、产生培训数据库、分类和报告。ZooImage可以针对多种图像数据库工作,如已保存浮游生物样品的扫描图像、拍摄的微型和大型图片、FlowCAM产生的图像等。Chang 等[ 38]进一步研究了培训图像库的构建对提高图像自动识别性能的影响。Vandromme等[ 39]研究了ZooScan自动分类的粒径谱计算过程中的误差。2005年在西班牙举行的GLOBEC研讨会“利用图像分析进行浮游动物的计数和识别”上,专家们认为目前浮游生物图像识别技术总体水平可达到:使用纹理、形状和其他的图像特征,在10~20个纲的范围内,自动分类系统的准确率目前为70%~80%。如果在分类算法中结合分类学专家的知识,可以达到更高的准确率。
国内的浮游生物自动识别技术起步较晚。赵文仓等[ 40]提出利用最近邻准则对浮游植物进行自动识别的试探聚类算法。通过对17种浮游植物细胞图像的识别实验,证明该方法的识别准确率在95%以上。杨榕等[ 41]根据胶州湾浮游动物优势种的特点,设计了一种自动分类计数算法,一方面通过有效的分割手段提供了更多的分类特征,另一方面设计了基于BP的神经网络分类器,取得了较好的分类计数效果。
鉴于图像观测技术自动、高效、无扰动等特点,其在针对海洋生态系统进行长期或者原位观测中发挥了重要优势。在目前已有的图像观测系统中,使用较多的有VPR,UVP,ZooScan和FlowCAM等。在1994—1995年GLOBEC乔治海岸的研究中,Davis等[ 11]结合VPR与温度、电导率、荧光等传感器,研究了不同类型水体与锋面区浮游生物的特征及环境因子的变化,进而得以比较不同物理场浮游生物和颗粒物的分布。Ashjiana等[ 42]使用自动VPR,在楚科奇—波弗特海之间获取了桡足类、链状硅藻、海洋雪和放射虫等不同类群高精度的垂直分布数据。Gorsky等[ 43]将UVP用于挪威西部4个峡湾浮游动物分布的研究中,针对6个浮游动物类群开展观测。 Stemmann等[ 44]使用UVP对西北地中海1 000 m以上大颗粒的垂直分布及通量进行了为期4年的研究,获取了大颗粒的丰度、体积、干重、3个粒级的丰度、粒级分布等特征。Hosia等[ 45]和Gaard等[ 46]分别研究了北大西洋中脊网采浮游刺胞类的分布及其与主要水团的关系,以及桡足类的组成、丰度和分布。在浮游生态系统长期变化方面,García-Comas 等[ 47]基于ZooScan技术研究了西北地中海浮游动物的长期变化,获取了1974-2003年桡足类、毛颚类、十足类幼体、管水母和水母的月丰度长期变化。此外,图像技术还有效地用于海洋生态灾害的观测中,如FlowCAM和CytoSUB对有害藻华的监测等。在我国海洋先导科技专项针对西太平洋的观测中,UVP,FlowCAM和CytoSUB都将作为重要的观测手段得以应用。
浮游生态系统粒级的分布对于明确浮游生态系统的功能特征具有重要意义。浮游生物的粒径谱能够指示能量沿食物网的传递,粒径谱的总体改变会影响浮游动物捕食的食物类型。基于图像观测技术,能够快速获得浮游生物粒级组成信息,为深入进行浮游生态系统功能研究提供了非常有价值的信息。Sieracki等[ 48]将FlowCAM成功应用于海洋浮游生物的粒径谱分析。Martin等[ 49]结合FlowCAM和ZooScan 2种技术研究了大西洋浮游生物粒径谱沿纬度(70°N~50°S)的变化。Marcolin等[ 50]使用LOPC和ZooScan研究了Abrolhos 海岸生态系统浮游生物的粒径谱信息。通过比较研究发现,图像技术在海洋浮游生物粒径谱的研究中显示出巨大的优势。Carstense等[ 51]利用FlowCAM与库尔特仪的比较表明,二者性能相似。应用FlowCAM技术与显微镜技术对自然海域浮游生物样品粒级结构的比较研究结果表明,FlowCAM在浮游生物群落结构研究中的检测结果更加准确,可以有效地避免样品的长期储存[ 52]。除了浮游生物之外,图像观测技术在海洋雪等颗粒物的研究中也显示出巨大优势。以海洋雪为例,它们构成大洋中垂直碳通量的最大组分,但由于其易碎的特点,采用传统手段很难采集和研究。图像传感器和计算机系统的发展促进了原位图像获取系统的发展,能够产生海洋雪粒径分布和丰度的垂直剖面。结合沉积物捕集器,可以有效地估计颗粒物的大小,分布及POC,PIC和PON等不同组分的含量[ 53]。
在海洋浮游动物的研究中,浮游动物生物量(湿重、干重,以mg/m3或者 mg/m2表示)及其碳、氮含量的测定是定量研究浮游食物网的物质和能量传递的必须环节,是浮游动物生态学研究中的关键参数,对于揭示生态系统的能流与物流特征极为重要。关于浮游动物生物量及碳、氮含量的研究,在传统的研究方法中,主要包括直接测定法和经验公式估算法。由于直接测定法测定生物量及碳、氮含量具有耗时、费力、成本高、对样品产生破坏等方面的限制,难以用于批量样品的测定。采用经验公式估算法,即通过直接测量浮游动物体长、面积或体积等形态参数,利用经验公式间接推算生物量的方法成为当前国际上浮游动物生物量及碳、氮含量的主要估算方法[ 54, 55, 56]。浮游动物图像自动识别技术的应用,使得浮游动物形态参数的快速获取能够得到有效解决。
国际上基于图像手段进行生物量估算的研究得到相应开展。Alcaraz等[ 57]研究了地中海不同浮游动物类群生物学体积与碳、氮含量之间的关系,认为这是一种估算浮游动物生物量的非破坏性的、较为精确的方法。Hernández-León等[ 58]和Lehette等[ 56]基于图像手段分别研究了南极和亚热带海域浮游动物生物量估算的经验公式,建立了面积与浮游动物干重之间的关系,并建议将通过图像手段获得的面积与生物量之间的经验公式作为生物量估算的标准方法。Lehette等[ 56]同时比较了甲壳类浮游动物和胶质类浮游动物的转换公式,发现甲壳类浮游动物类群内部可以通用一个公式,但甲壳类与胶质类浮游动物之间差异较大,建议依据不同类群建立各自的经验公式。Di Mauro等[ 59]使用ZooImage自动系统估计北阿根廷海桡足类的生物学体积。大型桡足类、小型桡足类和剑水蚤的准确率分别为83.15%,79.5%和85.7%,证明ZooImage能够作为一种工具对桡足类丰度和生物学体积进行估算,与传统测量方法相比,能够显著降低所需时间。孙松等[ 60]和冯秋园[ 61]分别针对胶州湾和黄东海的浮游动物优势类群,如中华哲水蚤、强壮箭虫、细长脚虫戎和小型水母等,建立了浮游动物体形参数与湿重、干重和碳、氮含量等生物量参数之间的回归关系,为我国近海浮游动物主要类群生物量及碳、氮含量的估算奠定了基础。
浮游生物在海洋生态系统中起着重要的调节作用,浮游生物种类繁多,但在生态系统中起主要作用的是一些关键功能群。目前,把生态系统中的物种区分为不同的功能群来研究其多样性和生态功能已成为一种重要的研究思路和方法,并且被广泛地应用于各种生态系统结构和功能的研究,以及全球变化和恢复生态学等各个研究领域。现有的图像自动观测与识别技术可以识别到属/优势种的水平,在进行生物量估计和主要浮游生物类群的生态学研究中具有巨大的优势。随着图像自动识别技术的进一步发展,对浮游生物快速分类、计数和生物量估算成为可能,对于海洋浮游生物功能群的研究、生物生产过程以及生态模拟研究将提供有力的技术支撑。
综观当前浮游生物图像自动识别技术研究进展,仍以2D图像的自动分类识别为主。由于浮游生物个体的范围非常广泛,对于许多物种,2D图像难以满足分类学上的需求,必须有高精度可旋转的3D图像或者标本的线断层扫描图像才能达到原位实时观测的目的。要解决与生物多样性有关的科学问题,需要针对大的水体进行物种丰度和形态变化的分析。对于这些研究,需要有物种分类学的详细信息,因此需要有高精度的图像来支持。要达到上述目标,浮游生物图像识别技术领域尚需进行大量工作,包括:①特定海区物种的快速自动分类,自动识别的效率应等于或高于人工分类的效率;②构建高精度(3D)的标本图像数据库做为图像识别参考标准,每一物种需要有全方位的一系列的图像资料,捕捉现场样品的自然变化;③通过互联网对全球范围内图像数据库的常规访问等[ 2]。此外,由于图像分类软件是一种高度专业化的软件,与海洋工程领域正在设计开发的成像系统属于完全不同的科学领域。因此,开发出一种适应性强的分类软件将显著增强现有成像系统的效率。这需要不同组织之间加强协作,避免不同机构之间进行重复性的开发工作,共同推动该领域的发展。
对于生物海洋学的研究,关键是要解决连续、大范围、长期观测的问题。就目前的浮游生物研究方法看,远远无法满足对变化中的海洋的认识,而图像观测技术的发展对于原位观测能力的加强以及与物理、化学传感器结合开展综合观测具有重要的意义,预期将会取得更多突破。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
|
[59] |
|
[60] |
|
[61] |
|