这是模式挖掘、数据挖掘的一部分应用。
两个空间实体之间存在若干拓扑关系,这些关系基于两个实体的位置:
分离相交包含如图所示地表示位置信息,可以提取类似下面的规则:
我们可以知道语言中有很对二义性的词语,并且可以用不同的词汇表达相同或者相近的意思。
比如,我们表示“靠近”,可以用“临近”、“接近”、“比邻”等等。那么我们就可以用Progressive Refinement来解决,因此空间关系可以应用在一个更加粗糙或者更精细的层次上。
粗略计算,用于筛选
使用MBR(Minimum Bounding Rectangle)或者R-tree粗略估计。
更加细节的处理算法,用于精细处理
只处理那些通过粗略计算的数据(不小于最小支持度),从而节约时间与空间。
现有如图所示地拓扑结构,用数字表示每一个样本点,其符号是表示样本点的种类。
共置模式指的是一组空间事件或者物体经常发生在相同的区域,在拓扑图中这样的事件用线连在一起。
其中{3, 6, 17}, {4, 7, 10, 16}, {2, 8, 11, 14, 15}, {2, 9}就是一个Colocation pattern。
而rowset(SET)则表示SET集合中每一个元素都出现在的Colocation pattern。
定义如下
计算条件概率必须按照定义来。
不是恒等于的。
例如,求
其中
在
所以
定义如下
Participation ratio
表示在
例如,
我们可以看到总共有
算法思想和Apriori算法是一致的。
产生候选集的理论依据是Participation Ratio的单调性:
现有两个Co-location pattern:
轨迹聚类:基于空间/时空的几何估计进行分组
轨迹联合:给定两个轨迹数据库,检索所有的相似对
通过挖掘能够处理多种问题,包括,路线规划、城市规划、识别物体、模式分类。
描述移动事件,不考虑绝对位置
Constance:连续时间序列的相等运动属性,即保持运动方向不变Concurrence:有相等运动属性的多个对象,在某个时刻运动方向相同的多个物体Trendsetter:—组的共享目标的运动图形(constance + concurrence)上图中箭头表示运动方向,横坐标表示时间,纵坐标表示物体。
基本运动模式+空间约束
Track:单个对象,保持相同运动(constance + 空间约束)Flock:一组对象,同时保持相同运动(concurrence + 空间约束)Leadership:—个领导,踉着一组具有相同的运动物体(trendsetter + 空间约束)描述聚合和分离对象的运动
Encounter(m,r) : 至少m个对象同时到达半径为r的范围内Convergence (m,r) : 至少m个对象经过达半径为r的范围内(不需要同时)Divergence : 与Convergence相反Breakup : 与Encounter相反Moving Cluster
在一个时间段内,一组对象相互靠近Convoy
基于密度链接的 “Flock (m,k,r).”找到一组反映人们粗糙的语义级转换的模式。例如,办公室→餐馆,家庭→健身房。
粗糙的语义在之前讲的progressive refinement中说过,是一些粗糙的语义定义,比如,办公室、办公场所,甚至是一些更加具体的名词,如政府办等。
通过分组,将每个粗糙分类的相似图案分成几个细粒度图案运动片段。
论文:C. Zhang et al., Splitter: Mining Fine-Grained Sequential Patterns in Semantic Trajectories, VLDB 2014
新闻热点
疑难解答