空间统计笔记之二(分布模式工具集,Analyzing Patterns Toolset)

摘要:
输出结果分析该工具将给出一系列统计值,包括计算的邻居之间的平均距离、预期随机分布的平均距离,两者之间的比率,以及Z分数和P值。如果P值具有统计学意义,则可以推翻零假设。输出结果分析该工具将给出一系列统计值,包括ObservedGeneralG、ExpectedGeneralG、方差、Z评分和P值。如果P值显著,则Z值是规则的ObservedGeneralG大于ExpectedGeneralG,表明它是一个高值集群;如果Z值为负值,则ObservedGeneralG小于ExpectedGeneralG,后者与聚类一样低。图形输出包括ObservedK、ExpectedK、LowerConfidenceEnvelope、HigherConfidence Envelope曲线,表格还包括DiffK。

Average Nearest Neighbor

  • 工具简介

        平均最近邻工具用来度量在不考虑属性的前提下,要素在空间上的分布趋势是离散分布、聚集分布还是随机分布。该工具会计算每一个要素的质心到最近的邻居的距离之和   的平均值,再与假设随机分布的距离做比较。如果比值小于1,则认为是聚集分布;如果大于1,则认为是离散分布。

  • 主要参数

      Input Feature Class:输入的矢量要素类,一般是点类型;对于线类型或面类型的要素,则取他们的质心进行计算;

      Distance Method:欧几里得距离:计算平面上两点之间的直线距离;曼哈顿距离:计算两点之间两个直角边的距离之和;解释见另一篇博文http://www.cnblogs.com/gisangela/archive/2012/10/22/2734176.html

      Area:该工具对面积是敏感的,不同的地理尺度会造成不同的分析结果。默认是输入要素类的外包矩形,可以指定实际的面积大小。

  • 输出结果解析

     该工具会给出一系列的统计值,包括计算得到的邻居之间的平均距离(Observed Mean Distance)、期望的随机分布的平均距离(Expected Mean Distance)、这两者之   间的比值(Nearest Neighbor Ratio)以及Z分数和P值。同时也可以输出为HTML报表,直观地以图形形式输出分析的结果。

      

           空间统计笔记之二(分布模式工具集,Analyzing Patterns Toolset)第1张

High/Low Clustering(Getis-Ord General G)

  • 工具简介

         该工具返回某个属性在空间上是高值聚类还是低值聚类的可能性,零假设是随机分布。如果P值具有统计显著性,则可推翻零假设。可以用该工具来反映GDP产值大部分是高于平均水平(高值聚集)还是低于平均水平(低值聚集)。

  • 主要参数

         Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式,推荐使用Fixed Distance Band, Polygon Contiguity方法;

         Standardization:行标准化一般是在数据存在可能的偏见性的时候采用,一般是由于有偏采样造成的,这里推荐使用None;

         Weights Matrix File(optional):空间权重矩阵文件,可指定ASCII码格式的权重文件,如果要素的个数大于5000个,建议转换成swm格式。

  •   输出结果解析

         该工具会给出一系列的统计值,包括Observed General G, Expected General G, 方差(Variance), Z分数和P值。如果P值具有显著性,则看Z值为正则Observed    General G大于Expected General G,说明为高值聚类;如果Z值为负,则Observed General G小于Expected General G,为低至聚类。

 Multi-Distance Spatial Cluater Analysis(Ripleys K Function)

  • 工具简介

       该工具在多尺度自相关分析中经常使用,可以对给出的一系列距离内要素的离散或是聚集程度进行度量。边缘校正是该工具一个很重要的参数。在生态学中常用该工具来做种群的空间格局分析。

  •  主要参数介绍

 Number of distance bands:设置多少个距离区间;

Compute Confidence Envelope:确定随机分布上下包迹线的方法,Monte Carlo方法是选取m组n个随机数,求出每组的l(d)值,分别取最大和最小值最为上下包迹线的取值,一般建议使用99组随机模拟值来确定包迹线的区间。可理解为不同的置信水平(90%,99%,99.9%);

 Weight field:要素的权重字段,例如一个点要素的权重为3,则意味着在同一坐标位置有三个重复的点;

Beginning distance:起始距离;

Distance Increment:距离步长;

Boundary Correction Method(边缘校正):用来对位于研究范围边界处的要素邻居个数进行估计的方法

NONE——不进行校正,即便输入的要素落入了研究范围外,仍会作为邻居参与位于边界处的要素的计算;

SIMULATE_OUTER_BOUNDARY_VALUES——对位于边界范围内的要素(一个距离步长内)会按照研究范围的边界产生镜像要素,作为其邻居参与到计算中;

REDUCE_ANALYSIS_AREA——该方法会按照距离步长对研究范围进行收缩,位于收缩范围内的要素就作为邻居参与计算;

RIPLEY'S_EDGE_CORRECTION_FORMULA——该方法会比较每个要素与研究范围边界的距离与邻居的距离,如果邻居距离大于到边界的距离会赋予额外的权重,刚方法适合研究范围是矩形的情况。

Study Area Method:该工具算法对面积是敏感的,默认为MINIMUM_ENCLOSING_RECTANGLE(即要素的最小外包矩形);USER_PROVIDED_STUDY_AREA_FEATURE_CLASS(指定一个多边形要素类来获取面积)

  •  输出结果

          

          空间统计笔记之二(分布模式工具集,Analyzing Patterns Toolset)第2张

     该工具会给出图形输出和表格输出两种结果。图形输出中包括ObservedK, ExpectedK,Lower Confidence Envelop,Higher Confidence Envelop曲线,表格中还包括了DiffK(即ObservedK和ExpectedK的差值)。如果在某个距离内ObservedK大于ExpectedK,则为聚类分布;反之为离散分布特征。如果ObservedK大于Higher Confidence Envelop的值,意味着聚集分布具有统计显著性;如果ObservedK小于Low Confidence Envelop的值,意味着这时的离散分布具有统计显著性。

 Spatial Autocrrelation(Morans I)

  • 工具简介

        该工具是全局Moran I算法的实现,可以反映要素的空间位置以及属性值的空间聚集或离散的趋势。

  • 主要参数介绍

Conceptualization of Spatial Relationships:度量要素间空间位置关系的方式:

INVERSE DISTANCE——距离越近的要素具有越大的权重,越远权重越小;

INVERSE DISTANCE SQUARED——同上,权重的衰减更快;

FIXED DISTANCE BAND——指定距离内的要素权重为1,超出该距离的权重为0;

ZONE OF INDIFFERENCE——指定距离内的要素权重为1,超出该距离的权重随距离而衰减;

POLYGON CONTIGUITY——对多边形而言,与目标要素邻接的要素才作为邻居参与到计算中;

GET SPATIAL FORM FILE——可指定权重文件;

     Standardization:行标准化一般是在数据存在可能的偏见性的时候采用,一般是由于有偏采样造成的;

  •   输出结果解析

     该工具会给出Moran's I Index, Expected Index, Variance以及Z分数和P值,如果P值具有统计显著性,则可推翻零假设(随机分布),Z值为正则为聚类分布,Z值为负则为离散分布。如果选择了ROW Standardization,Moran I的值一般在-1到1之间。

免责声明:文章转载自《空间统计笔记之二(分布模式工具集,Analyzing Patterns Toolset)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇oracle 触发器number判断空值,:NEW赋值,for each row,sql变量引号,to_date,to_charjava中的“空格”用trim()无法去除?原来是这样!下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

多级目录树(森林)的三种数据库存储结构介绍

去年做过一个项目,需要每日对上千个Android内存泄漏(OOM)时core dump出的hprof文件进行分析,希望借助海量数据来快速定位内存泄漏的原因。最终的分析结果是一个类森林,因为时隔较远,只找到下面这个截图了。 点击打开折叠的项目,会看到该类的每个属性,类有多少个实例,占用的大小等等信息,树的深度可以达到10^2级别。重点是项目需要实时,每个h...

零基础入门深度学习(5)

无论即将到来的是大数据时代还是人工智能时代,亦或是传统行业使用人工智能在云上处理大数据的时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就out了?现在救命稻草来了,《零基础入门深度学习》系列文章旨在讲帮助爱编程的你从零基础达到入门级水平。零基础意味着你不需要太多的数学知识,只要会写程序就行了,...

使用HDBSCAN 算法对分子聚类

对分子进行聚类分析,首先必须要考虑的是其描述符的问题,分子描述符通常是非常高维的,必须对其进行降维才好继续后面的分析,特别分子量特别大的时候。常用的降维手段有PCA,TSNE和UMAP.一说,TSNE用于可视化. 聚类的方法有许多,比如k-means,层次聚类. 但是这两个一个需要定义k,一个需要定义阈值,这样需要试错法合理进行着两个量的设置,不是很方便....

图像分割之mean shift

阅读目的:理解quick shift,同时理解mean shift原理,mean shift用于图像聚类,优点是不需要指定聚类中心个数,缺点是计算量太大(原因)。 mean shift主要用来寻找符合一些数据样本的模型,证明样本符合某一概率密度函数(PDF),是一种非参数迭代算法能够寻找模型和聚类。 数据经过非参数密度估计能够得到符合数据分布的概率密度函...

[PHP] 6种负载均衡算法

CP from : https://www.cnblogs.com/SmartLee/p/5161415.html http://www.dataguru.cn/thread-559329-1-1.html 1、轮询法 将请求按顺序轮流地分配到后端服务器上,它均衡地对待后端的每一台服务器,而不关心服务器实际的连接数和当前的系统负载。 2、随机法 通过...

黑帽SEO手法

黑帽SEO手法0x00:概念 SEO全称搜索引擎优化,通过站内优化和站内优化方式来提升搜索引擎排名,有白帽SEO和黑帽SEO。 因为正规的SEO优化需要很长时间,黑帽SEO手法让站内快速提升排名的有: 黑链(暗链) 站群 网站劫持(搜索引擎劫持) 桥页 0x01:SEO的一些黑色手法 常见的SEO手法: 利用泛解析做站群 入侵高权重网站挂暗链 入侵高...