发布信息

一种海图专题信息的提取处理方法、装置及系统 专利技术说明

作者:admin      2022-11-26 11:24:43     391



计算;推算;计数设备的制造及其应用技术1.本发明涉及海图专题信息的提取处理技术领域,尤其涉及一种海图专题信息的提取处理方法、装置、计算机可读存储介质及系统。背景技术:2.海图专题信息是指海图中表示的某一类信息,如潮间带、2m等深线、5m等深线、陆域范围、海域范围等。海图是地图的一种,也称海洋地图,是以海洋及其毗邻的陆地为研究对象的地图。海图是海洋测绘、海洋调查和研究的主要成果,也是海洋区域的空间模型、海洋信息的载体和传输工具,是海洋地理环境特点的分析依据,更是海洋开发利用的重要资料。在航海、渔业、海洋工程建设、海洋划界、历史研究、海洋军事、海洋科学研究,以及海洋开发利用的各个领域中都有重要的使用价值。海图是海洋科学领域的重要成果,耗费了大量的人力和财力制成,海图表达并记录了大量的信息,是前人留下的宝贵财富。几十年来,在海洋领域积累了大量的纸质海图。然而,纸质海图表达的信息不能直接进行数字化分析使用。因此,将海图中表达的特定信息进行数字化提取,尤其是矢量化,在大数据背景下的信息时代具有很高的实用价值。纸质海图进行数字化或矢量化,多是传统的人工矢量化,这需要耗费巨大的人力和财力,操作繁琐且消耗时间。由于不同人工操作的精细程度不同,对数字化的信息会有不同程度的细微偏差。其人为的失误操作也会影响信息提取的最终质量。历史海图具有重要的研究价值,但是早期的纸质海图存放年代久远,各类地物原始标准配色已经老旧。色调、饱和度、亮度等色彩的基本属性表现偏差,且纸质海图扫描成电子版后也会有色彩的失真现象,并伴随着噪声点的存在。色彩失真现象和噪声点会随机出现在不同位置,我们并不能通过某种滤波或者某种算法将其完全消除或忽略其影响,以上问题可总体归纳为色彩畸变,色彩畸变会增加自动识别提取的难度。在海图制图中,对于同一种信息,不同时期制作的海图,色彩表达上也会略有偏差,这同样会增加自动识别提取的难度。3.在现有技术中,通常采用滤波、聚色分类、二值化图像分割、色彩空间的增强转换进行海洋地图信息的自动提取。4.但是,现有技术仍存在如下缺陷:准备工作操作繁琐难懂,增加了非专业人员的理解难度;在进行自动提取识别海图中较粗的线要素或较细小的面要素时,会出现混淆提取或漏掉提取,识别效果不理想;造成少量栅格信息被错误分类,并零散的分布在整个海图(类似于胡椒面撒在整个海图)。5.因此,当前需要一种海图专题信息的提取处理方法、装置、计算机可读存储介质以及系统,从而克服现有技术中存在的上述缺陷。技术实现要素:6.本发明实施例提供一种海图专题信息的提取处理方法、装置、计算机可读存储介质以及系统,从而提升海洋地图信息自动提取的准确性及效率。7.本发明一实施例提供一种海图专题信息的提取处理方法,所述提取处理方法包括:获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集;根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果;根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果。8.作为上述方案的改进,根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果,具体包括:以预设的单元划分尺寸,对所述识别结果进行栅格划分,获得多个栅格单元;根据预设的权重赋值方法,对中心栅格和非中心栅格分别进行权重赋值以获取中心栅格权重以及非中心栅格权重;所述栅格单元包括中心栅格和非中心栅格;根据中心栅格的类别、非中心栅格的类别、中心栅格权重以及非中心栅格权重,对潮间带类别和非潮间带类别分别进行加权比重计算,获取潮间带类别比重以及非潮间带类别比重;根据所述潮间带类别比重以及所述非潮间带类别比重,确定所述中心栅格的修正类型;根据各个中心栅格的修正类型输出海图提取结果。9.作为上述方案的改进,根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果,具体包括:将所述特征数据集输入预设的海图信息提取识别模型中,获取第一识别结果文件以及第二识别结果文件;根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果。10.作为上述方案的改进,根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集,具体包括:获取所述待处理海图的各个图层中每一个像元的灰度值,并将所述灰度值作为所述待处理海图的特征数据集。11.作为上述方案的改进,根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果,具体包括:将所述第一识别结果文件作为第一识别结果;根据预设的划分界限,将所述第二识别结果文件划分为潮间带类别和非潮间带类别,并将划分后的内容作为第二识别结果;根据预设的区间阈值,对所述第二识别结果文件进行阈值划分,并将划分后的内容作为第三识别结果;并根据预设的结果需求,从所述第一识别结果、第二识别结果以及第三识别结果中挑选确定识别结果。12.作为上述方案的改进,在获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集之前,所述提取处理方法还包括:获取用于训练的训练海图以及对应的海图信息,将所述海图信息划分为潮间带类别信息以及非潮间带类别信息,并根据预设的图像预处理方法对所述训练海图进行预处理,获取训练特征数据集;根据预设的识别样本筛选方法,从所述潮间带类别信息中筛选潮间带样本,并根据预设的反向样本筛选方法,从所述非潮间带类别信息中筛选非潮间带样本;根据所述潮间带样本以及非潮间带样本,分别建立第一训练数据集以及第一验证数据集;根据所述训练海图的图像信息,对所述第一训练数据集以及所述第一验证数据集进行同化处理,对应获得训练数据集以及验证数据集;根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型。13.作为上述方案的改进,根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型,具体包括:根据所述训练数据集以及所述训练特征数据集,对预设的随机森林模型进行训练调试以获取第一海图信息提取模型;根据所述验证数据集以及所述训练特征数据集,对所述第一海图信息提取模型进行验证并计算模型精度以及 kappa系数,判断所述模型精度以及所述kappa系数是否满足预设的模型输出要求;当所述模型精度以及所述kappa系数不满足预设的模型输出要求时,重复上述步骤;当所述模型精度以及所述kappa系数满足预设的模型输出要求时,将所述第一海图信息提取模型输出为海图信息提取识别模型。14.本发明另一实施例对应提供了一种海图专题信息的提取处理装置,所述提取处理装置包括特征获取单元、提取识别单元以及结果修正单元,其中,所述特征获取单元用于获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集;所述提取识别单元用于根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果;所述结果修正单元用于根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果。15.作为上述方案的改进,所述结果修正单元还用于:以预设的单元划分尺寸,对所述识别结果进行栅格划分,获得多个栅格单元;根据预设的权重赋值方法,对中心栅格和非中心栅格分别进行权重赋值以获取中心栅格权重以及非中心栅格权重;所述栅格单元包括中心栅格和非中心栅格;根据中心栅格的类别、非中心栅格的类别、中心栅格权重以及非中心栅格权重,对潮间带类别和非潮间带类别分别进行加权比重计算,获取潮间带类别比重以及非潮间带类别比重;根据所述潮间带类别比重以及所述非潮间带类别比重,确定所述中心栅格的修正类型;根据各个中心栅格的修正类型输出海图提取结果。16.作为上述方案的改进,所述提取识别单元还用于:将所述特征数据集输入预设的海图信息提取识别模型中,获取第一识别结果文件以及第二识别结果文件;根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果。17.作为上述方案的改进,所述特征获取单元用于:获取所述待处理海图的各个图层中每一个像元的灰度值,并将所述灰度值作为所述待处理海图的特征数据集。18.作为上述方案的改进,所述提取识别单元还用于:将所述第一识别结果文件作为第一识别结果;根据预设的划分界限,将所述第二识别结果文件划分为潮间带类别和非潮间带类别,并将划分后的内容作为第二识别结果;根据预设的区间阈值,对所述第二识别结果文件进行阈值划分,并将划分后的内容作为第三识别结果;并根据预设的结果需求,从所述第一识别结果、第二识别结果以及第三识别结果中挑选确定识别结果。19.作为上述方案的改进,所述提取处理装置还包括模型训练单元,所述模型训练单元用于:获取用于训练的训练海图以及对应的海图信息,将所述海图信息划分为潮间带类别信息以及非潮间带类别信息,并根据预设的图像预处理方法对所述训练海图进行预处理,获取训练特征数据集;根据预设的识别样本筛选方法,从所述潮间带类别信息中筛选潮间带样本,并根据预设的反向样本筛选方法,从所述非潮间带类别信息中筛选非潮间带样本;根据所述潮间带样本以及非潮间带样本,分别建立第一训练数据集以及第一验证数据集;根据所述训练海图的图像信息,对所述第一训练数据集以及所述第一验证数据集进行同化处理,对应获得训练数据集以及验证数据集;根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型。20.作为上述方案的改进,所述模型训练单元还用于:根据所述训练数据集以及所述训练特征数据集,对预设的随机森林模型进行训练调试以获取第一海图信息提取模型;根据所述验证数据集以及所述训练特征数据集,对所述第一海图信息提取模型进行验证并计算模型精度以及kappa系数,判断所述模型精度以及所述 kappa系数是否满足预设的模型输出要求;当所述模型精度以及所述kappa系数不满足预设的模型输出要求时,重复上述步骤;当所述模型精度以及所述kappa 系数满足预设的模型输出要求时,将所述第一海图信息提取模型输出为海图信息提取识别模型。21.本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如前所述的海图专题信息的提取处理方法。22.本发明另一实施例提供了一种海图专题信息的提取处理系统,所述提取处理系统包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的海图专题信息的提取处理方法。23.与现有技术相比,本发明的技术方案至少存在如下有益效果之一:24.本发明提供了一种海图专题信息的提取处理方法、装置、计算机可读存储介质以及系统,通过预设的海图信息提取识别模型自动识别提取海图信息以获取识别结果,并对识别结果进一步修正,该方法、装置、计算机可读存储介质以及系统实现了海图信息提取的自动化,从而提升了海洋地图信息自动提取的准确性及效率。25.进一步地,本发明提供的一种海图专题信息的提取处理方法、装置、计算机可读存储介质以及系统还通过对待处理海图进行图层灰度值处理,从而进一步提升了海洋地图信息自动提取的准确性及效率。附图说明26.图1是本发明一实施例提供的一种海图专题信息的提取处理方法的流程示意图;27.图2是本发明一实施例提供的一种海图专题信息的提取处理装置的结构示意图。具体实施方式28.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。29.具体实施例一30.本发明实施例首先描述了一种海图专题信息的提取处理方法。图1是本发明一实施例提供的一种海图专题信息的提取处理方法的流程示意图。31.如图1所示,所述提取处理方法包括:32.s1:获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集。33.要实现海图专题信息的自动提取,首先要将海图进行数字化处理,具体地,当待提取的海图为纸质版时,将纸质版海图进行扫描得到电子版海图,进一步将电子版海图进行地理配准,得到具有准确的地理空间位置的电子版海图(本文中描述为“待处理海图”)。通过先进行地理配准再识别提取,可以使识别提取后的结果直接具有准确的地理空间位置,使识别提取后的结果方便计算、统计等工作,避免了先识别提取再地理配准带来的误差累积。随后即可根据配准后的电子版海图(本文中描述为“待处理海图”),提取对应的特征数据集以进行后续识别。具体地,预处理后的海图有rgb三个图层,每一个图层中每一个像元都具有不同的灰度值,每一个图层中每一个像元的灰度值都代表着各自所属的信息 (对分类识别提取起着极为重要的作用),通过获取每一个图层中每一个像元的灰度值,基于所述灰度值,将其作为特征数据集。34.即,在一个实施例中,根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集,具体包括:获取所述待处理海图的各个图层中每一个像元的灰度值,并将所述灰度值作为所述待处理海图的特征数据集。35.基于对上述灰度值的操作处理,预处理后的海图的rgb三个图层不需要再进行多余的操作处理。与现有技术相比不需要进行滤波、聚色分类、二值化图像分割、色彩空间的增强转换等处理,减少了准备工作的繁琐,使非专业人员更容易理解。基于上述灰度值操作处理,避免了在进行转换、增强等处理时造成的信息丢失、数据冗余等,减少了计算机的数据计算量,提升了效率和准确性。基于上述灰度值操作处理,将每一个图层中的每一个像元的灰度值当做处理对象,可以增加识别提取的精细程度,避免人为造成的细微偏差。将每一个图层中的每一个像元的灰度值当做处理对象,消除了由个别像元造成的色彩畸变、色彩偏差对整体识别提取的精度影响。将每一个图层中的每一个像元的灰度值当做处理对象,在对预处理后的海图中由较粗的线或较细小的面组成的信息类别进行识别提取时,可以有效避免混淆提取或漏掉提取,使得识别提取效果达到最佳。36.在对待处理海图获取特征数据集之后即可根据预设的海图信息提取识别模型对该特征数据集进行提取输出。为了实现该目的,首先需要训练出海图信息提取识别模型,具体地,先根据用于训练的训练海图构建训练数据集和验证数据集,再获取训练海图的特征数据集,随后,采用随机森林模型作为海图信息提取识别模型的基础模型,根据训练海图的训练数据集、验证数据集以及特征数据集对该随机森林模型进行参数调试、模型训练以及模型验证,并在模型精度和kappa系数达到一定标准时,将模型输出为海图信息提取识别模型。其中,用于训练的训练海图为通过电子化和地理配准后得到的用于训练的海图。在一个实施例中,随机森林模型可替换为最大似然模型、支持向量机模型、逻辑回归模型、深度学习模型等分类识别模型。当数据量过于大时,可以优选最大似然模型以减少计算机的计算时间,同时也能保证精度。37.在构建训练数据集之前,需要将训练海图(默认为电子化海图,如果不是则需要如前所述地进行转换)进行潮间带信息识别提取,具体地,将训练海图中表达的信息划分为两种类别:潮间带类别(需要提取的信息)和非潮间带类别(其他信息)。采用这样的划分方式是为了将两种类别的信息进行最大程度的区分,以达到最佳的识别提取效果。两种类别表示的信息,互相差异越大,越容易辨识,同时也会削弱色彩畸变、色彩偏差对识别提取的精度影响,使得识别提取效果最佳。38.对训练海图中的潮间带类别(需要提取的信息)进行样本选取,选取的潮间带样本要均匀、随机的分布在预处理后的海图中,这样选取的潮间带样本具有最佳的代表性,可以提高后续识别提取的精度。尤其是预处理后的海图中潮间带发生色彩畸变、色彩偏差的位置,一定要进行重点选取样本,这样可以将色彩畸变、色彩偏差对识别提取的精度影响降到最低。将选取好的潮间带样本归为潮间带类别,为了便于理解,将潮间带类别相对应的赋值为“1”。39.对训练海图中的非潮间带类别(其他信息)进行样本选取,选取的非潮间带样本要尽可能的包含除潮间带类别外的所有类别。非潮间带类别样本选取的越全面,潮间带类别与非潮间带类别互相差异越大,越容易辨识,同样也会削弱色彩畸变、色彩偏差对识别提取精度的影响,使得识别提取效果最佳。非潮间带类别样本选取也要均匀、随机的分布在预处理后的海图中,以保证非潮间带样本具有最佳的代表性。为了便于理解,将非潮间带信息相对应的赋值为“2”。40.将上述方法选取的两种类别的样本创建训练数据集。训练数据集要均匀、随机分布在预处理后的海图中,以达到最佳的代表性。并且训练数据集的总面积要大于预处理后的海图总面积的5%,优选5%-10%,这个取值范围既能保证模型的识别精度,又减少了人工操作,还降低了模型计算的复杂程度和计算机的硬件要求。当预处理后的海图面积非常大时,可以适当减少训练集的选取面积。41.在创建验证数据集的过程中,对预处理后的海图中的潮间带类别和非潮间带类别进行样本选取。将潮间带类别相对应的赋值为“1”,非潮间带类别相对应的赋值为“2”。将上述选取的两种类别的样本创建验证数据集。验证数据集要保证不与训练数据集有重复,这样可以保证验证数据集的独立性,使验证数据集在验证模型时,模型能表达出准确的精度信息。验证数据集中的数据量应小于训练数据集中的数据量,验证数据集中的数据量取值应为训练数据集中的数据量的 40%-50%,优选43%。这样选取验证数据集既能保证模型验证的准确度,又减少了人工操作,还降低了模型计算的复杂程度和计算机的硬件要求。42.在创建完训练数据集和验证数据集后,将上述训练数据集、验证数据集处理成与训练海图具有相同的空间大小和分辨率,即具有相同的行数和列数(本文亦描述为“同化处理”)。这样可以使训练数据集、验证数据集在预处理后的海图上对应着正确的类别信息,可以在进一步的操作中减少模型产生的系统误差。43.在进行随机森林模型参数调试时,第一个参数:决策树的数量(number oftree),它取决于数据的复杂程度。可以选择较为稳定的300棵,优选300-500 棵,这样选择既能保证模型的识别精度的稳定,又避免了模型出现过拟合现象,还降低了模型数据计算的复杂程度和计算机的硬件要求。但鉴于海图数据量的变化,也可以通过将其设置为100、300、500和1000进行了测试,可以使模型在不同情况下的精度趋于稳定,以获得模型最佳效果;第二个参数:每个节点上随机选择的特征数,选择所有特征的数量的平方根。这样选择可以使随机森林中的决策树彼此不同,相互独立,决策树的多样性得到了增加,使具有线性或非线性关系的因子都能准确的归类,同时也避免了过拟合,分类性能得到提升,模型精度会更高;第三个参数:停止标准(用于节点拆分),选择节点中最小样本数的默认值1和基于基尼系数为0来计算最小不纯度。这样选择可以使模型选择最优的特征划分点生成决策树,进而使分类结果更准确。基于特征数据集和验证数据集来验证训练好的模型,当模型整体精度大于90%、kappa系数大于0.7,则模型精度合理,非常可靠。通过对训练数据集按上述要求进行最优化选取,再结合模型参数调试部分,可以将模型整体精度、kappa系数进一步提高,以获取更精准可靠的识别结果。44.在一个实施例中,在获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集之前,所述提取处理方法还包括:获取用于训练的训练海图以及对应的海图信息,将所述海图信息划分为潮间带类别信息以及非潮间带类别信息,并根据预设的图像预处理方法对所述训练海图进行预处理,获取训练特征数据集;根据预设的识别样本筛选方法,从所述潮间带类别信息中筛选潮间带样本,并根据预设的反向样本筛选方法,从所述非潮间带类别信息中筛选非潮间带样本;根据所述潮间带样本以及非潮间带样本,分别建立第一训练数据集以及第一验证数据集;根据所述训练海图的图像信息,对所述第一训练数据集以及所述第一验证数据集进行同化处理,对应获得训练数据集以及验证数据集;根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型。其中,同化处理即使得所述第一训练数据集以及所述第一验证数据集具有相同的行数和列数。45.在一个实施例中,根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型,具体包括:根据所述训练数据集以及所述训练特征数据集,对预设的随机森林模型进行训练调试以获取第一海图信息提取模型;根据所述验证数据集以及所述训练特征数据集,对所述第一海图信息提取模型进行验证并计算模型精度以及 kappa系数,判断所述模型精度以及所述kappa系数是否满足预设的模型输出要求;当所述模型精度以及所述kappa系数不满足预设的模型输出要求时,重复上述步骤;当所述模型精度以及所述kappa系数满足预设的模型输出要求时,将所述第一海图信息提取模型输出为海图信息提取识别模型。46.s2:根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果。47.在一个实施例中,根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果,具体包括:将所述特征数据集输入预设的海图信息提取识别模型中,获取第一识别结果文件以及第二识别结果文件;根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果。48.将特征数据集输入预设的海图信息提取识别模型后,会得到两个文件,即,第一识别结果文件以及第二识别结果文件;其中,第一识别结果文件是两种类别已经识别并分开的结果(第一个文件具有很高的精度),可直接当做分类识别结果进行使用(第一识别结果);第二识别结果文件是得到与特征数据集大小一样的一幅概率值文件(即,每一个栅格值代表是否为潮间带的概率,概率值在0-1 之间,“0”值代表着此栅格为潮间带的概率最小,“1”值代表着此栅格为潮间带的概率最大);进一步地,将第二识别结果文件进行分段划分,以0.5为界限划分,栅格概率值大于0.5的都分段为潮间带类别,栅格概率值小于0.5的都分段为非潮间带类别,可以得到精度更高分类识别结果(第二识别结果);更进一步地,对照预处理后的海图将第二识别结果文件进行更细段的阈值划分,第二识别结果文件的阈值划分的越细,每个栅格的归类越准确,从而得出更精准的分类识别结果(第三识别结果)。49.第一识别结果、第二识别结果以及第三识别结果都具有很高的精度,都可以作为分类结果进行使用。其中第一识别结果的精度≤第二识别结果的精度≤第三识别结果的精度,根据预设的结果需求(对分类精度的要求)可以相应的选择其中之一的结果使用。50.在一个实施例中,根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果,具体包括:将所述第一识别结果文件作为第一识别结果;根据预设的划分界限,将所述第二识别结果文件划分为潮间带类别和非潮间带类别,并将划分后的内容作为第二识别结果;根据预设的区间阈值,对所述第二识别结果文件进行阈值划分,并将划分后的内容作为第三识别结果;并根据预设的结果需求,从所述第一识别结果、第二识别结果以及第三识别结果中挑选确定识别结果。51.s3:根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果。52.为了进一步提升海图信息提取识别的精度,本发明实施例基于识别结果进一步去除少量被错误归类的栅格,进而得到更高精度的结果。以实际应用为例但不限制地描述本步骤,具体为,将识别结果中的栅格划分为每5×5个栅格为一个单元范围。一个单元范围中,中心栅格的权重可赋值为1,其余栅格的权重为1。一个单元范围中,每个栅格类别乘以权重,得到相同类别数量最多的类别,则被重新定义为这个单元范围的中心栅格的类别。依次类推,遍历识别结果中的所有栅格。示例性的:若一个单元范围中,中心栅格的类别为非潮间带类别,其余栅格有22个潮间带类别,2个非潮间带类别。则,潮间带类别×22>非潮间带类别×2,那么,这个单元范围的中心栅格的类别被重新定义为潮间带类别。根据需求可以调整一个单元范围中的栅格数和中心栅格的权重,一个单元范围中的栅格数应选择奇数×奇数个栅格,最优选择是相同的奇数×相同的奇数,即每5×5 个栅格为一个单元范围,中心栅格的权重可赋值为1,其余栅格的权重为1。这样选择不会因为一个单元范围过大或过小,从而影响去除错误栅格的精度,也可以使得中心栅格居于一个单元范围正中间,最具有代表性,中心栅格的权重不会过多的决定一个单元范围整体类别。53.为了进一步提升海图信息提取识别的精度,作为替代方案,本发明实施例还可以运用聚类处理(clump)方法。聚类处理是运用形态学算子将邻近的类似分类区域聚类并合并。分类图像经常缺少空间连续性(分类区域中斑点或洞的存在)。低通滤波虽然可以用来平滑这些图像,但是类别信息常会被邻近类别的编码干扰,聚类处理可以解决这个问题。首先将被选的分类用一个扩大操作合并到一起,然后用指定了大小的变换核对分类图像进行侵蚀操作。54.为了进一步提升海图信息提取识别的精度,作为替代方案,本发明实施例还可以运用过滤处理(sieve)方法。过滤处理解决分类图像中出现的孤岛问题。过滤处理使用斑点分组方法来消除这些被隔离的分类像元。类别筛选方法是通过分析周围的4个或8个像元,判定一个像元是否与周围的像元同组。如果一类中被分析的像元数少于输入的阈值。这些像元就会被从该类中删除,删除的像元归为未分类的像元(unclassified)。以上两种并行方案都可以达到去除少量被错误归类的栅格,将错误栅格进行重新正确归类的效果,进而得到更高精度的结果。55.通过上述步骤得到的海图提取结果相比较与所述第一识别结果、第二识别结果以及第三识别结果分类精度更高,去除了少量栅格信息被错误分类的影响,在两种类别的识别效果显得更平滑。56.在一个实施例中,根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果,具体包括:以预设的单元划分尺寸,对所述识别结果进行栅格划分,获得多个栅格单元;根据预设的权重赋值方法,对中心栅格和非中心栅格分别进行权重赋值以获取中心栅格权重以及非中心栅格权重;所述栅格单元包括中心栅格和非中心栅格;根据中心栅格的类别、非中心栅格的类别、中心栅格权重以及非中心栅格权重,对潮间带类别和非潮间带类别分别进行加权比重计算,获取潮间带类别比重以及非潮间带类别比重;根据所述潮间带类别比重以及所述非潮间带类别比重,确定所述中心栅格的修正类型;根据各个中心栅格的修正类型输出海图提取结果。57.在一个实施例中,所述提取处理方法还包括:将所述海图提取结果转化为矢量面文件,并对所述矢量面文件进行整饰处理以获取第一海图提取结果。具体地,将所述海图提取结果转化为栅格文件,再将栅格文件转化为矢量面文件,栅格文件转为矢量面文件的操作后,不连续的栅格会矢量面文件中产生细小的、分块的、有间隔零散的面;将多余的、细小不连续零碎的面进行剔除,将未准确达到边界的缺失部分进行补充,整饰处理可以将矢量面文件中两种类别的分类结果更连续,边界部分更平滑,结果的精度更高;进一步地,还可以将第一海图提取结果中相同属性的类别进行融合,得到连续、整体的第二海图提取结果,从而进一步提升精度;更进一步地,将第二海图提取结果对照预处理后的海图,对融合后的矢量面文件进行整形修饰,通过将边缘界线或特征折点进行编辑、移动、微调等操作,可以得到更准确的识别结果和更准确的边界效果(第三海图提取结果);更进一步地,可以将第三海图提取结果转化为矢量线文件以获取包括海陆分界线的第四海图提取结果,使得两种类别的边界更加准确、平滑,分界明显,精度更高。58.经过上述步骤在进行提取两种类别的信息时,可直接得到两种类别的边界线,不需要再重新使用别的方法对边界线进行单独提取,减少了工作的复杂程度。更进一步的,如果是在进行一次性提取多种所需的类别信息时,也可以直接获得多种所需的类别信息的边界线,极大地提高了工作效率。59.根据上述方法步骤也可以进行纸质版海图中的陆域范围、2m等深线范围、 5m等深线范围、海域范围等信息的提取。依次类推,可以得到纸质版海图中陆域范围、2m等深线范围、5m等深线范围、海域范围等信息的分界线。60.本发明实施例描述了一种海图专题信息的提取处理方法,通过预设的海图信息提取识别模型自动识别提取海图信息以获取识别结果,并对识别结果进一步修正,该提取处理方法实现了海图信息提取的自动化,从而提升了海洋地图信息自动提取的准确性及效率;进一步地,本发明实施例描述的一种海图专题信息的提取处理方法还通过对待处理海图中的每一个图层中的每一个像元进行处理,从而进一步提升了海洋地图信息自动提取的准确性及效率。61.具体实施例二62.除上述方法外,本发明实施例还公开了一种海图专题信息的提取处理装置。图2是本发明一实施例提供的一种海图专题信息的提取处理装置的结构示意图。63.如图2所示,所述提取处理装置包括特征获取单元11、提取识别单元12以及结果修正单元13。64.特征获取单元11用于获取待处理海图,并根据预设的图像预处理方法对所述待处理海图进行预处理,获取特征数据集。65.在一个实施例中,特征获取单元11用于:获取所述待处理海图的各个图层中每一个像元的灰度值,并将所述灰度值作为所述待处理海图的特征数据集。66.提取识别单元12用于根据所述特征数据集、预设的海图信息提取识别模型以及预设的结果需求,识别并确定识别结果。67.在一个实施例中,提取识别单元12还用于:将所述特征数据集输入预设的海图信息提取识别模型中,获取第一识别结果文件以及第二识别结果文件;根据预设的结果需求、所述第一识别结果文件以及所述第二识别结果文件,获取识别结果。68.在一个实施例中,提取识别单元12还用于:将所述第一识别结果文件作为第一识别结果;根据预设的划分界限,将所述第二识别结果文件划分为潮间带类别和非潮间带类别,并将划分后的内容作为第二识别结果;根据预设的区间阈值,对所述第二识别结果文件进行阈值划分,并将划分后的内容作为第三识别结果;并根据预设的结果需求,从所述第一识别结果、第二识别结果以及第三识别结果中挑选确定识别结果。69.结果修正单元13用于根据预设的栅格信息修正方法,对所述识别结果进行修正以获取海图提取结果。70.在一个实施例中,结果修正单元13还用于:以预设的单元划分尺寸,对所述识别结果进行栅格划分,获得多个栅格单元;根据预设的权重赋值方法,对中心栅格和非中心栅格分别进行权重赋值以获取中心栅格权重以及非中心栅格权重;所述栅格单元包括中心栅格和非中心栅格;根据中心栅格的类别、非中心栅格的类别、中心栅格权重以及非中心栅格权重,对潮间带类别和非潮间带类别分别进行加权比重计算,获取潮间带类别比重以及非潮间带类别比重;根据所述潮间带类别比重以及所述非潮间带类别比重,确定所述中心栅格的修正类型;根据各个中心栅格的修正类型输出海图提取结果。71.在一个实施例中,提取处理装置还包括模型训练单元,所述模型训练单元用于:获取用于训练的训练海图以及对应的海图信息,将所述海图信息划分为潮间带类别信息以及非潮间带类别信息,并根据预设的图像预处理方法对所述训练海图进行预处理,获取训练特征数据集;根据预设的识别样本筛选方法,从所述潮间带类别信息中筛选潮间带样本,并根据预设的反向样本筛选方法,从所述非潮间带类别信息中筛选非潮间带样本;根据所述潮间带样本以及非潮间带样本,分别建立第一训练数据集以及第一验证数据集;根据所述训练海图的图像信息,对所述第一训练数据集以及所述第一验证数据集进行同化处理,对应获得训练数据集以及验证数据集;根据所述训练数据集、所述验证数据集以及预设的模型输出要求,对预设的随机森林模型进行训练和验证,获得海图信息提取识别模型。72.在一个实施例中,模型训练单元还用于:根据所述训练数据集以及所述训练特征数据集,对预设的随机森林模型进行训练调试以获取第一海图信息提取模型;根据所述验证数据集以及所述训练特征数据集,对所述第一海图信息提取模型进行验证并计算模型精度以及kappa系数,判断所述模型精度以及所述kappa 系数是否满足预设的模型输出要求;当所述模型精度以及所述kappa系数不满足预设的模型输出要求时,重复上述步骤;当所述模型精度以及所述kappa系数满足预设的模型输出要求时,将所述第一海图信息提取模型输出为海图信息提取识别模型。73.其中,所述提取处理装置集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。即,本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如前所述的海图专题信息的提取处理方法。74.所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。75.需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,单元之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。76.本发明实施例描述了一种海图专题信息的提取处理装置及计算机可读存储介质,通过预设的海图信息提取识别模型自动识别提取海图信息以获取识别结果,并对识别结果进一步修正,该提取处理装置及计算机可读存储介质实现了海图信息提取的自动化,从而提升了海洋地图信息自动提取的准确性及效率;进一步地,本发明实施例描述的一种海图专题信息的提取处理装置及计算机可读存储介质还通过对待处理海图中的每一个图层中的每一个像元进行处理,从而进一步提升了海洋地图信息自动提取的准确性及效率。77.具体实施例三78.除上述方法和装置外,本发明实施例还描述了一种海图专题信息的提取处理系统。79.所述提取处理系统包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的海图专题信息的提取处理方法。80.所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现成可编程门阵列 (field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述装置的控制中心,利用各种接口和线路连接整个装置的各个部分。81.所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。82.本发明实施例描述了一种海图专题信息的提取处理系统,通过预设的海图信息提取识别模型自动识别提取海图信息以获取识别结果,并对识别结果进一步修正,该提取处理系统实现了海图信息提取的自动化,从而提升了海洋地图信息自动提取的准确性及效率;进一步地,本发明实施例描述的一种海图专题信息的提取处理系统还通过对待处理海图中的每一个图层中的每一个像元进行处理,从而进一步提升了海洋地图信息自动提取的准确性及效率。83.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部