基于概率描述逻辑的多层活动建模和识别 - 管理

彭一鸣王忠华

【摘要】活动识别是指从一系列家居传感器信号中自动识别人的日常活动，由于人类活动本质的模糊性，大多数传统模式识别方法不能表示活动的不确定性和复杂结构关系。针对上述问题，提出基于概率描述逻辑的多层活动识别方法，从对数线性描述逻辑构建的OWL2本体中的概率推理出当前最可能执行的活动，实验结果验证了论文方法的有效性。

【Abstrt】AtvtyrtrfrstthuttdtftfhutvtsfrsrsfhssrslsBusfthfuzzssfhutvts，sttrdtlpttrrtthdstrprstthurttydplxstruturftvtsAtbvprbls，ult-tvtyrtthddprbblstdlsprpsdThstllytvtyurrtsddudfrthprbbltyfOWL2ustrutdbylrthlrdl，dthxprtlrsultsvldtthfftvssfthprpsdthd

【关键词】活动识别；对数线性模型；描述逻辑；OW2本体

【Kyrds】tvtyrt；l-lrdl；dl；OWL2tly

【中图分类号】TP【文献标志码】A【文章编号】673-069（208）04-052-04

引言

活动识别被广泛应用于众多领域，这些领域包括医疗健康，老人摔倒和异常检测、健康生活方式的跟踪和改善、智能家居的上下文感知服务、机器人技术和安防和监控等。活动识别方法主要可以分为三种，即数据驱动、知识驱动和混合活动识别方法。基于本体的方法在活动识别领域中的应用越来越普遍，然而大多数基于描述逻辑的活动识别框架缺乏对概率知识的表示和推理。

为了弥补上述方法的不足，本文提出的方法将不确定性知识集成到一个统一的框架中，并考虑活动之间的不相容性，利用对数线性模型和描述逻辑的结合来推测出当前最可能执行的活动。

2多层活动模型的表示

2概率描述逻辑原理

描述逻辑[]（Dl，DL）是一种知识表示形式，通过概念、关系和公理来支持特定应用领域知识的逻辑表示，包括领域内概念的定义和对象个体的描述。

对数线性描述逻辑[2]（l-lrdl）将描述逻辑集成到对数线性模型中，允许对描述逻辑加权公理的概率性和确定性依赖关系进行建模，并支持OWL2网络本体语言[3]。形式上，一个对数线性知识库C=（CD，CU）是由一个确定性知识库CBxCD和一个不确定性知识库CBxCD=（，？棕）组成，其中表示一个公理，？棕是分配到公理的一个权重。

在规定的语法和语义下，最主要的推理任务是最大后验概率（MAP）查询，给定一个对数线性本体，推理出在同样的概念和角色下最可能的一致的本体，在概率描述逻辑背景下，MAP查询是至关重要的，因为它能够从概率本体中推理出一个最可能的本体。ELOG推理机[4]通过将概率本体转化为整数线性规划（trlrprr，ILP），從而进行MAP查询。它迭代查询一个推理机（例如Pllt）获得不连贯或不一致的解释，并将这些约束添加到整数线性规划中。

22多层活动的概念

复杂活动、简单活动、操作手势、原子事件和其他上下文概念被定义为活动本体的概念，下面是一系列本体活动模型主要概念的定义。

Prs：表示一个执行不同活动的居住者。

Ar：表示居住者的手臂，手臂分为左手臂和右手臂，一个人通过他的手臂与周围环境进行交互。

Fut：表示一个人的手臂操作物体的方式。

Lt：表示肢体动作，例如躺、坐、站立。

：表示居住者在执行一个活动中交互的物体，例如原子事件“移动瓶子”，交互的物体是“瓶子”。

EvtTyp：表示原子事件，表示这些不能被分解为更简单成分的原子活动，它们的持续时间非常短，为了简化模型，可以把它们看作为瞬时事件。

Mpultv：表示操作手势，由几个简单的原子事件组成。在某些情况下可以并发进行。

SplAtvty：表示简单活动，由操作手势和肢体动作组成的时间序列构成，同样的简单活动可能由不同的操作手势时间序列构成。

CplxAtvty：表示复杂活动，由执行的简单活动组成。

23多层活动模型的建立

多层活动本体模型是依据一个开源项目“Opprtuty”提出的框架建立的。本体模型一共包含四层结构，从底层到高层依次是原子事件层、操作手势层、简单活动层和复杂活动层。

本体模型的核心类是Prs，一个居住者通过他的手臂与周围环境进行交互，基于本体的类和属性，表示活动概念的公理能够迭代地通过更简单的活动进行定义，这些类和对象属性如图所示，图中的节点表示类，箭头表示关联类个体的对象属性。一个原子事件的公理可表示为类Prs通过属性hsAr关联到他的手臂类Ar，进而通过属性hsFut和hs关联到手臂操作物体的方式类Fut和交互的物体类。

3多层活动识别系统的设计

多层活动识别系统主要由两部分组成，首先使用OWL2本体语言构建多层活动本体，然后利用基于Jv语言编写的活动识别框架来解析本体。

3多层活动本体

本文提出的概率本体支持数据集[5]的活动识别场景，包括四个活动层级约50个日常生活动作和活动。只考虑个体S0生成的数据集构建我们的概率本体，其他两个人的数据用于评估我们的方法对活动识别的有效性。我们采用prtééOWL编辑器[6]构建活动本体，公理权重已经以注释的形式手动添加到公理定义中，权重的估计值通过领域常识和S0个体产生的数据获得。

32多层活动的识别方法

我们提出用以下技术从更简单的活动中识别出更复杂活动，该方法不局限于顺序活动的识别，也包括并发活动的识别。下面描述了操作手势、简单活动和复杂活动的识别步骤。

32识别操作手势

第三层的操作手势是基于原子事件和活动的语义推断得出的，为了识别在一个时间窗口？子3内执行的操作手势，我们执行下面四个步骤：

①收集所有在？子3时段内识别出的原子事件；

②使用本体论中的类和声明来表示它们，并将它们添加到概率本体中；

③使用对象属性将每一个原子事件和它的执行者关联起来；

④利用概率和标准的本体推理机推断出最有可能执行的操纵手势。

322识别简单活动

因为简单的活动被定义为由若干操作手势组成的时间序列，需要表示操作手势的执行先后关系。然而基于OWL2的描述逻辑本身并不支持时序推理，为了解决这个限制，根据操作手势的时间序列进行简单的时序推理。为了识别所有在？子2时段内执行的简单动作，我们按照如下步骤：

①收集所有在？子2时段内推测出的操作手势；

②利用本体的类和声明表示各种操作手势，并添加到概率本体中；

③利用对象属性关联每一个操作手势和它的执行者；

④更新收集到的操作手势的执行顺序，使用上述描述的公理形式，并添加到概率本体列表；

⑤使用关于对数线性的ELOG推理机[4]从概率公理中计算最可能的一致性本体；

⑥在最可能的一致性本体上执行标准的本体推理，得到在？子2时段内的简单活动。

323识别复杂活动

从简单活动中识别出复杂活动的方法类似于操作手势的识别，由于时间窗口？子持续的时间较长，在时间窗口？子内可以执行几个简单活动，这有助于区分各复杂活动和省略活动内部的時序关系。

33多层活动识别框架

本文提出的方法是基于Jv编写的系统OWL-API上实现的，如图4中所描述的一样，程序在一个滑动时间窗口中自动解析传感器的观测值，通过识别框架将更低层级活动作为输入，迭代地输出更高层级的活动。该程序收集的传感器观测数据包括执行者的肢体动作、手臂动作和交互物体。当运行时间超过了操作手势对应的预定义时间窗口？子3时触发推理过程。为了便于评估，依照传感器输入频率的平均值，我们固定？子3分割的时间为秒。

每个被识别出的原子事件都作为本体中对应类的一个个体，用于未知的操纵手势类的描述。新的公理被添加到对数线性本体后，通过ELOG推理机输出最可能一致的本体。ELOG推理机通过将概率本体转化为一个整数线性规划来解决MAP查询，它迭代查询Pllt推理机来获得关于不连贯或不一致的解释，并将其作为ILP的约束，可以使用Gurb解算机解决它们和重复这些操作，直到所有的不一致都得到解决。获得的一致性本体再次作为输入，通过Pllt推理机可以推断出未知类的等价类。这些类表示在给定的时间窗口中预测的操作手势。在下一个传感器输入时，采集的数据被删除和收集推理过程又被再次触发。类似地，为了识别下一个抽象层的活动，之前的预测类用于定义当前简单活动的未知类，保存当前收集的操作手势直到一个简单活动被识别。从一个时间窗口到下一个时间窗口，它们的顺序也进行相应地更新。构成一个简单活动的最长序列包括4个操纵手势，我们固定？子2的间隔长度为4个？子3时间间隔，因此一个操纵手势在它被识别前的最大序号为4，利用Pllt的解释特性来获取识别简单活动的公理，并获得它的持续时间。最后，在？子中预测的简单活动被用于产生未知的复杂活动类，复杂活动覆盖较长时间，考虑到识别框架的实时性，我们限制？子3为30秒。识别过程遵循与识别操作手势相同的步骤。

4实验与评估

4实验数据集

我们使用从高度丰富的网络传感器环境中收集到的真实数据来评估我们的方法，数据集是一个欧盟研究项目“基于传感器配置的活动和情景识别”的一部分。数据集通过观察几个住户早晨的日常活动获得，为了能够评估我们的方法，我们对三个目标个体S0、S和S2在三个不同早晨执行的日常活动ADL、ADL2和ADL3的不确定性进行注释。

为了评估我们的方法，首先使用时间窗技术，获得每个时间窗口内的真实活动集，然后把它与对应时间窗口内预测的活动集进行比较。评估方法采用三个模式识别中常用的评价指标：精确度（prs）、反馈率（rll）和F测量（F-Msur），三者按如下公式计算：

對于每个输出，正确预测的活动被视为是正确肯定（trupstv，TP）；如果时间窗口？子中预测的活动A，不匹配真实数据集在同一时间窗口内的任何活动，则被视为错误肯定（flspstv，FP）；任意一时间窗口内，参考数据集的活动没有在时间窗口内被预测出，则被视为错误否定（flstv，FN）。

42实验结果和分析

表描述了住户S0、S和S2三个早上的日常活动数据（ADL、ADL2和ADL3）在每个层级活动上的平均识别结果。由于各个住户之间的变化相对较小，本文方法表现出很好的性能水平。

一般来说，单独从各个层级活动识别结果来看，系统具有较高的精度。虽然对于操作手势和复杂活动而言，反馈率的值是比较满意的，但简单活动的反馈率较低，遗漏了相当数量的简单活动，这主要有以下几个原因，一方面操控手势层的预测错误或遗漏很可能违反整个简单活动的执行顺序，从而导致错误预测。另一方面，我们的本体模型时序表示过于简单，不能捕获定义一个简单活动的所有操纵手势序列。尽管简单活动的反馈率较低，复杂活动有相对较高的F-测量值，这主要有两方面原因，一方面复杂活动类的数量相比与其他层级数量较少，另一方面由于复杂活动的识别频率相对较低，在一个时间窗口？子能够识别到足够多的简单活动，从而能在很大概率上正确地推理出复杂活动。

5结语

本文提出了一种紧密耦合的混合系统来进行人类活动的识别，提出的识别框架将符号逻辑和概率推理相结合，采用对数线性描述逻辑来表示和推理当前活动，实验结果验证了本文方法处理多层活动识别的可行性。本文不同于大多数相关工作，它在不牺牲本体建模和推理的优势下，支持人类活动固有的不确定性，这些优势包括一致性检测和集成丰富背景知识的能力，能同步识别复杂和简单活动。标准描述形式的使用增强了系统的移植性和重用性，支持表示异构和不确定的上下文数据，能够有效处理数据的不确定性。

【参考文献】

【】FBdr，DClvs，DLMussThDLHdb：Thry，Ipl--ttdApplts[J]CbrdUvrstyPrss，200（32）：9-0

【2】MNprt，JNssr，HStushdtL-lrdls[J]ItrtlJtCfrArtflItll，20（2）：253-258

【3】BCGru，IHrrs，BMtOWL2：ThxtstpfrOWL[J]WbStsSSrvs&p;AtsthWrldWdWb，2008，6（4）：309-322

【4】JNssr，MNprtELOG：APrbblstRsrfrOWLEL[J]SprrBrlHdlbr，20，69（02）：28-286

【5】PLuz，GPrl，DBh，tlRrd--Cplx，MultMdlAtvtyDtStfrCtxtRt[J]ItrtlC--frArhtturfCputSysts，20（08）：6-66

【6】HKubluh，RWFrrs，NFNy，tlThprtééOWLPlu：AOpDvlptEvrtfrStWbApplts[J]StfrdShlfMd，2006（07）：5-62

文章来源于：中小企业管理与科技·上旬刊