空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）

摘要：

输出结果分析该工具将给出一系列统计值，包括计算的邻居之间的平均距离、预期随机分布的平均距离，两者之间的比率，以及Z分数和P值。如果P值具有统计学意义，则可以推翻零假设。输出结果分析该工具将给出一系列统计值，包括ObservedGeneralG、ExpectedGeneralG、方差、Z评分和P值。如果P值显著，则Z值是规则的ObservedGeneralG大于ExpectedGeneralG，表明它是一个高值集群；如果Z值为负值，则ObservedGeneralG小于ExpectedGeneralG，后者与聚类一样低。图形输出包括ObservedK、ExpectedK、LowerConfidenceEnvelope、HigherConfidence Envelope曲线，表格还包括DiffK。

Average Nearest Neighbor

工具简介

平均最近邻工具用来度量在不考虑属性的前提下，要素在空间上的分布趋势是离散分布、聚集分布还是随机分布。该工具会计算每一个要素的质心到最近的邻居的距离之和的平均值，再与假设随机分布的距离做比较。如果比值小于1，则认为是聚集分布；如果大于1，则认为是离散分布。

主要参数

Input Feature Class:输入的矢量要素类，一般是点类型；对于线类型或面类型的要素，则取他们的质心进行计算；

Distance Method：欧几里得距离：计算平面上两点之间的直线距离；曼哈顿距离：计算两点之间两个直角边的距离之和；解释见另一篇博文http://www.cnblogs.com/gisangela/archive/2012/10/22/2734176.html

Area：该工具对面积是敏感的，不同的地理尺度会造成不同的分析结果。默认是输入要素类的外包矩形，可以指定实际的面积大小。

输出结果解析

该工具会给出一系列的统计值，包括计算得到的邻居之间的平均距离（Observed Mean Distance）、期望的随机分布的平均距离（Expected Mean Distance）、这两者之间的比值（Nearest Neighbor Ratio）以及Z分数和P值。同时也可以输出为HTML报表，直观地以图形形式输出分析的结果。

空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）第1张

High/Low Clustering(Getis-Ord General G)

工具简介

该工具返回某个属性在空间上是高值聚类还是低值聚类的可能性，零假设是随机分布。如果P值具有统计显著性，则可推翻零假设。可以用该工具来反映GDP产值大部分是高于平均水平（高值聚集）还是低于平均水平（低值聚集）。

主要参数

Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式，推荐使用Fixed Distance Band, Polygon Contiguity方法；

Standardization：行标准化一般是在数据存在可能的偏见性的时候采用，一般是由于有偏采样造成的，这里推荐使用None；

Weights Matrix File(optional)：空间权重矩阵文件，可指定ASCII码格式的权重文件，如果要素的个数大于5000个，建议转换成swm格式。

输出结果解析

该工具会给出一系列的统计值，包括Observed General G, Expected General G, 方差（Variance）, Z分数和P值。如果P值具有显著性，则看Z值为正则Observed General G大于Expected General G，说明为高值聚类；如果Z值为负，则Observed General G小于Expected General G，为低至聚类。

Multi-Distance Spatial Cluater Analysis(Ripleys K Function)

工具简介

该工具在多尺度自相关分析中经常使用，可以对给出的一系列距离内要素的离散或是聚集程度进行度量。边缘校正是该工具一个很重要的参数。在生态学中常用该工具来做种群的空间格局分析。

主要参数介绍

Number of distance bands:设置多少个距离区间；

Compute Confidence Envelope：确定随机分布上下包迹线的方法，Monte Carlo方法是选取m组n个随机数，求出每组的l（d）值，分别取最大和最小值最为上下包迹线的取值，一般建议使用99组随机模拟值来确定包迹线的区间。可理解为不同的置信水平（90%，99%，99.9%）；

Weight field：要素的权重字段，例如一个点要素的权重为3，则意味着在同一坐标位置有三个重复的点；

Beginning distance：起始距离；

Distance Increment：距离步长；

Boundary Correction Method（边缘校正）：用来对位于研究范围边界处的要素邻居个数进行估计的方法

NONE——不进行校正，即便输入的要素落入了研究范围外，仍会作为邻居参与位于边界处的要素的计算；

SIMULATE_OUTER_BOUNDARY_VALUES——对位于边界范围内的要素（一个距离步长内）会按照研究范围的边界产生镜像要素，作为其邻居参与到计算中；

REDUCE_ANALYSIS_AREA——该方法会按照距离步长对研究范围进行收缩，位于收缩范围内的要素就作为邻居参与计算；

RIPLEY'S_EDGE_CORRECTION_FORMULA——该方法会比较每个要素与研究范围边界的距离与邻居的距离，如果邻居距离大于到边界的距离会赋予额外的权重，刚方法适合研究范围是矩形的情况。

Study Area Method：该工具算法对面积是敏感的，默认为MINIMUM_ENCLOSING_RECTANGLE（即要素的最小外包矩形）；USER_PROVIDED_STUDY_AREA_FEATURE_CLASS（指定一个多边形要素类来获取面积）

输出结果

空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）第2张

该工具会给出图形输出和表格输出两种结果。图形输出中包括ObservedK, ExpectedK，Lower Confidence Envelop，Higher Confidence Envelop曲线，表格中还包括了DiffK（即ObservedK和ExpectedK的差值）。如果在某个距离内ObservedK大于ExpectedK，则为聚类分布；反之为离散分布特征。如果ObservedK大于Higher Confidence Envelop的值，意味着聚集分布具有统计显著性；如果ObservedK小于Low Confidence Envelop的值，意味着这时的离散分布具有统计显著性。

Spatial Autocrrelation(Morans I)

工具简介

该工具是全局Moran I算法的实现，可以反映要素的空间位置以及属性值的空间聚集或离散的趋势。

主要参数介绍

Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式：

INVERSE DISTANCE——距离越近的要素具有越大的权重，越远权重越小；

INVERSE DISTANCE SQUARED——同上，权重的衰减更快；

FIXED DISTANCE BAND——指定距离内的要素权重为1，超出该距离的权重为0；

ZONE OF INDIFFERENCE——指定距离内的要素权重为1，超出该距离的权重随距离而衰减；

POLYGON CONTIGUITY——对多边形而言，与目标要素邻接的要素才作为邻居参与到计算中；

GET SPATIAL FORM FILE——可指定权重文件；

Standardization：行标准化一般是在数据存在可能的偏见性的时候采用，一般是由于有偏采样造成的；

输出结果解析

该工具会给出Moran's I Index, Expected Index, Variance以及Z分数和P值，如果P值具有统计显著性，则可推翻零假设（随机分布），Z值为正则为聚类分布，Z值为负则为离散分布。如果选择了ROW Standardization，Moran I的值一般在-1到1之间。

空间统计笔记之二（分布模式工具集，Analyzing Patterns Toolset）

Average Nearest Neighbor

High/Low Clustering(Getis-Ord General G)

Multi-Distance Spatial Cluater Analysis(Ripleys K Function)

Spatial Autocrrelation(Morans I)

相关文章

多级目录树（森林）的三种数据库存储结构介绍

零基础入门深度学习(5)

使用HDBSCAN 算法对分子聚类

图像分割之mean shift

[PHP] 6种负载均衡算法

黑帽SEO手法

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表