数据处理查重复方法总结
在数据处理过程中,我们可能会遇到有重复数据的情况,下面主要针对数据重复查总结以下几种方法:
一、同一数据层中查重复
1.按照查频数查重复(前提:重复数据属性中有相同字段)
图1
如上图(图1),通过属性表可以看出一共7条数据,但是图形只有6个。主要就是图形覆盖了(此处主要是图形完全一样所致);我们可以通过查属性的频
数即可快速查出重叠的图像。
首先在ArcToolBox工具箱中,到分析工具Analysis Tool/Statistics/Frequency (查频数工具);如图2。
图2
左键单击Frequency工具,出现如下图(图3)窗口:
图3
点击OK按钮即可统计,待屏幕右下角出现下图时,说明统计完成。
此时,ArcMap会自动将统计结果表加载进来,右键点击统计表,打开该表,如下图(图4):
图4
选中Frequency列,右键进行排序(一般按照降序排列),Frequency列数值>1,即可能为重复数据(a.重复数据;b.图形完全压盖的数据);如图5:
图5
接下来,自己可以通过相关字段进行快速查判断、如果数据重复删除即可,在处理结束后建议再次统计频数,确保无重复数据后方可。
2.通过拓扑进行查重复数据;tool工具箱
首先通过ArcCatalog建立拓扑规则。(仍然以上述练习数据为例)
①拓扑的建立必须在数据库中,shp数据无法建立拓扑;如果为shp数据可以先将shp数据导入.mdb数
据库中,再进行操作。
②到将要建立拓扑的数据所在的数据集,右键点击该数据集,选择
New/Topology开始建立拓扑关系。如下图(图6):
图6
③具体建立拓扑关系的步骤如下:
I.在上一步点击Topology之后,进入建立拓扑规则界面;如下图(图6-1)
图6-1
II.此处,点击下一步即可,进入建立拓扑容差见面,一般我们容差设定为0.001(容差越小,精度越高);如下图(图6-2)
图6-2
III.点击下一步,即可勾选需要建立拓扑关系的要素层;如图6-3;
图6-3
IV.接下来点击下一步,在设定登记时我们保持默认的等级,Rank:5点击下一步即可;进入添加rule界面;如图6-4;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论