CN102448562A - 用于跟踪模型的系统和方法 - Google Patents

用于跟踪模型的系统和方法 Download PDF

Info

Publication number
CN102448562A
CN102448562A CN2010800246603A CN201080024660A CN102448562A CN 102448562 A CN102448562 A CN 102448562A CN 2010800246603 A CN2010800246603 A CN 2010800246603A CN 201080024660 A CN201080024660 A CN 201080024660A CN 102448562 A CN102448562 A CN 102448562A
Authority
CN
China
Prior art keywords
pixel
people
joint
class targets
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800246603A
Other languages
English (en)
Other versions
CN102448562B (zh
Inventor
Z·马特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102448562A publication Critical patent/CN102448562A/zh
Application granted granted Critical
Publication of CN102448562B publication Critical patent/CN102448562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/05Geographic models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training

Abstract

可由设备接收、观察或捕捉诸如场景的深度图像之类的图像,并且可以生成深度图像中的用户的模型。可以移除接收到的深度图像的背景,以分离出接收到的深度图像中的人类目标。然后,可以调整模型以便适合于接收到的深度图像中的被分离出的人类目标内。为了调整模型,可以将关节或骨骼吸附至被分离出的人类目标的最接近像素。然后,可以细化关节或骨骼,使得该关节或骨骼可以被进一步调整至一像素,该像素在被分离出的人类目标的身体部分的两个边缘之间处在等距离,该关节或骨骼已被吸附至该像素。

Description

用于跟踪模型的系统和方法
背景
诸如计算机游戏、多媒体应用等之类的许多计算应用使用控制来允许用户操纵游戏角色或应用的其他方面。通常使用例如控制器、遥控器、键盘、鼠标等等来输入这样的控制。不幸的是,这些控制可能是难以学习的,由此造成了用户和这些游戏及应用之间的障碍。此外,这些控制可能与这些控制所用于的实际游戏动作或其他应用动作不同。例如,使得游戏角色挥动棒球拍的游戏控制可能不与挥动棒球拍的实际运动相对应。
概述
此处所公开的是用于跟踪场景中的用户的系统和方法。例如,可以接收或观察诸如场景的深度等图像。然后可以分析该深度图像以确定该图像是否包括与用户相关联的人类目标。如果图像包括与用户相关联的人类目标,则可以生成该用户的模型。然后可响应于用户移动来跟踪模型以使得该模型可被调整为模仿该用户作出的移动。例如,该模型可以是具有关节和骨骼的骨架模型,其可被调整为与物理空间中的用户的姿势相对应的姿势。根据一个示例实施例,可以通过将模型适合于后续帧的深度图像中的人类目标内,来跟踪该模型。例如,可以移除一帧中深度图像的背景,以便分离出和用户相对应的人类目标。可以调整模型以便适合于人类目标的边缘内。
提供本概述以便以简化形式介绍在以下具体实施方式中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。此外,所要求保护的主题不限于解决在本公开的任何部分中提及的任何或所有缺点的实现。
附图说明
图1A和1B示出了伴随用户玩游戏的目标识别、分析和跟踪系统的示例实施例。
图2示出了可在目标识别、分析和跟踪系统中使用的捕捉设备的示例实施例。
图3示出可用于解释目标识别、分析和跟踪系统中的一个或多个姿势和/或动画化目标识别、分析和跟踪系统所显示的化身或屏幕上人物的计算环境的示例实施例。
图4示出可用于解释目标识别、分析和跟踪系统中的一个或多个姿势和/或动画化目标识别、分析和跟踪系统所显示的化身或屏幕上人物的计算环境的另一示例实施例。
图5描绘了用于跟踪场景中的用户的示例方法的流程图。
图6示出可被捕捉或观察的深度图像的示例实施例。
图7示出了其中人类目标被扫描的深度图像的示例实施例。
图8示出了深度图像的示例实施例,其中可以为被扫描的人类目标生成一模型。
图9A-9C示出模型被调整以适合于深度图像中分离出的人类目标的示例实施例。
图10A-10C示出模型被调整以适合于深度图像中分离出的人类目标的示例实施例。
说明性实施例的详细描述
如本文中将描述的,用户可通过执行一个或多个姿势和/或运动来控制在诸如游戏控制台、计算机等计算环境上执行的应用程序和/或动画化化身或屏幕上人物。根据一个实施例,姿势和/或运动可由例如捕捉设备来接收。例如,捕捉设备可捕捉场景的深度图像。在一个实施例中,捕捉设备可以确定场景中的一个或多个目标或对象是否对应于诸如用户等人类目标。然后可扫描与人类目标相匹配或相对应的每个目标或对象以确定各个身体部分并且生成与其相关联的模型,诸如骨架模型、网格人类模型等。根据一个实施例,然后可以跟踪模型。例如,可以移除深度图像的背景,以分离出深度图像中可以与用户相关联的人类目标。可以调整模型以便适合于深度图像中的人类目标。
图1A和1B示出伴随用户18玩拳击游戏的目标识别、分析和跟踪系统10的配置的示例实施例。在一示例实施例中,目标识别、分析和跟踪系统10可用于识别、分析和/或跟踪诸如用户18等的人类目标。
如图1A所示,目标识别、分析及跟踪系统10可包括计算环境12。计算环境12可以是计算机、游戏系统或控制台等等。根据一示例实施例,计算环境12可包括硬件组件和/或软件组件,使得计算环境12可用于执行诸如游戏应用、非游戏应用等应用。在一实施例中,计算环境12可包括可执行各种指令的诸如标准化处理器、专用处理器、微处理器等的处理器,这些指令包括,例如,接收深度图像的指令、移除深度图像的背景以分离出人类目标的指令、调整模型以适合在分离出的人类目标内的指令、或任何其他合适的指令,这些将在下面更详细地描述。
如图1A所示,目标识别、分析及跟踪系统10还可包括捕捉设备20。捕捉设备20可以是例如照相机,所述照相机可用于在视觉上监视诸如用户18等的一个或多个用户从而可以捕捉、分析并跟踪一个或多个用户所执行的姿势和/或移动,来执行应用程序中的一个或多个控制命令或动作和/或动画化化身或屏幕上人物,如将在下面更详细地描述的。
根据一个实施例,目标识别、分析及跟踪系统10可连接到可向诸如用户18等用户提供游戏或应用视觉和/或音频的视听设备16,如电视机、监视器、高清电视机(HDTV)等。例如,计算环境12可包括诸如图形卡等视频适配器和/或诸如声卡等音频适配器,这些适配器可提供与游戏应用、非游戏应用等相关联的视听信号。视听设备16可从计算环境12接收视听信号,然后可向用户18输出与该视听信号相关联的游戏或应用视觉和/或音频。根据一个实施例,视听设备16可经由例如,S-视频电缆、同轴电缆、HDMI电缆、DVI电缆、VGA电缆等连接到计算环境12。
如图1A和1B所示,目标识别、分析和跟踪系统10可用于识别、分析和/或跟踪诸如用户18等的人类目标。例如,可使用捕捉设备20来跟踪用户18,从而可以捕捉用户18的姿势和/或移动来动画化化身或屏幕上人物,和/或可将用户18的姿势和/或移动解释为可用于影响计算环境12所执行的应用的控制命令。因此,根据一实施例,用户18可移动他的或她的身体来控制应用和/或动画化化身或屏幕上人物。
如图1A和1B所示,在一示例实施例中,在计算环境12上执行的应用可以是用户18可能正在玩的拳击游戏。例如,计算环境12可使用视听设备16来向用户18提供拳击对手38的视觉表示。计算环境12还可使用视听设备16来提供用户18可通过他的或她的移动来控制的玩家化身40的视觉表示。例如,如图1B所示,用户18可在物理空间中挥拳来使得玩家化身40在游戏空间中挥拳。因此,根据一示例实施例,目标识别、分析和跟踪系统10的计算环境12和捕捉设备20可用于识别和分析物理空间中用户18的重拳从而使得该重拳可被解释为对游戏空间中的玩家化身40的游戏控制和/或该重拳的运动可用于动画化游戏空间中的玩家化身40。
用户18的其他移动也可被解释为其他控制命令或动作,和/或用于动画化玩家化身,如上下快速摆动、闪避、滑步、封堵、用拳猛击或挥动各种不同的有力重拳的控制命令。此外,某些移动可被解释为可对应于除控制玩家化身40之外的动作的控制。例如,玩家可以使用移动来结束、暂停或保存游戏、选择级别、查看高分、与朋友交流等。另外,用户18的全范围运动可以用任何合适的方式来获得、使用并分析以与应用进行交互。
在各示例实施例中,诸如用户18等人类目标可持有一物体。在这些实施例中,电子游戏的用户可手持物体从而可以使用玩家和物体的运动来调整和/或控制游戏的参数。例如,可以跟踪并利用玩家手持球拍的运动来控制电子运动游戏中的屏幕上球拍。在另一示例实施例中,可以跟踪并利用玩家手持物体的运动来控制电子格斗游戏中的屏幕上武器。
根据其他示例实施例,目标识别、分析及跟踪系统10还可用于将目标移动解释为游戏领域之外的操作系统和/或应用控制。例如,事实上操作系统和/或应用的任何可控方面可由诸如用户18等目标的移动来控制。
图2示出可在目标识别、分析及跟踪系统10中使用的捕捉设备20的示例实施例。根据一示例实施例,捕捉设备20可被配置成经由任何合适的技术,包括例如飞行时间、结构化光、立体图像等来捕捉包括深度图像的带有深度信息的视频,该深度信息可包括深度值。根据一实施例,捕捉设备20可将深度信息组织为“Z层”或者可与从深度相机沿其视线延伸的Z轴垂直的层。
如图2所示,捕捉设备20可包括图像相机组件22。根据一个示例实施例,图像相机组件22可以是可捕捉场景的深度图像的深度相机。深度图像可包括所捕捉的场景的二维(2-D)像素区域,其中2-D像素区域中的每一像素可表示深度值,诸如例如以厘米、毫米等计的、所捕捉的场景中的对象距相机的长度或距离。
如图2所示,根据一示例实施例,图像相机组件22可包括可用于捕捉场景的深度图像的IR光组件24、三维(3-D)相机26、和RGB相机28。例如,在飞行时间分析中,捕捉设备20的IR光组件24可以将红外光发射到场景上,然后,可以使用传感器(未示出),用例如三维相机26和/或RGB相机28,来检测从场景中的一个或多个目标和物体的表面反向散射的光。在某些实施例中,可以使用脉冲红外光,使得可以测量出射光脉冲和相应的入射光脉冲之间的时间差并将其用于确定从捕捉设备20到场景中的目标或物体上的特定位置的物理距离。附加地,在其他示例性实施例中,可将出射光波的相位与入射光波的相位进行比较来确定相移。然后可以使用该相移来确定从捕捉设备到目标或物体上的特定位置的物理距离。
根据另一示例实施例,可使用飞行时间分析,通过经由包括例如快门式光脉冲成像在内的各种技术来随时间分析反射光束的强度以间接地确定从捕捉设备20到目标或物体上的特定位置的物理距离。
在另一示例实施例中,捕捉设备20可使用结构化光来捕捉深度信息。在这一分析中,图案化光(即,被显示为诸如网格图案或条纹图案等已知图案的光)可经由例如IR光组件24被投影到场景上。在落到场景中的一个或多个目标或物体的表面上时,作为响应,图案可变形。图案的这种变形可由例如3-D相机26和/或RGB相机28来捕捉,然后可被分析来确定从捕捉设备到目标或物体上的特定位置的物理距离。
根据另一实施例,捕捉设备20可包括两个或更多物理上分开的相机,这些相机可从不同角度查看场景以获得视觉立体数据,该视觉立体数据可被解析以生成深度信息。
捕捉设备20还可包括话筒30。话筒30可包括可接收声音并将其转换成电信号的换能器或传感器。根据一个实施例,话筒30可以被用来减少目标识别、分析及跟踪系统10中的捕捉设备20和计算环境12之间的反馈。另外,话筒30可用于接收也可由用户提供的音频信号,以控制可由计算环境12执行的诸如游戏应用、非游戏应用等应用。
在一示例实施例中,捕捉设备20还可以包括可与图像相机组件22进行可操作的通信的处理器32。计算环境32可包括可执行各种指令的标准化处理器、专用处理器、微处理器等,这些指令包括,例如,接收深度图像的指令、移除深度图像的背景以分离出人类目标的指令、调整模型以适合在分离出的人类目标内的指令、或任何其他合适的指令,这些将在下面更详细地描述。
捕捉设备20还可以包括存储器组件34,该存储器组件34可以存储可以由处理器32执行的指令,由三维相机或RGB相机捕捉到的图像或图像的帧,或任何其他合适的信息、图像等等。根据一个示例实施例,存储器组件34可包括随机存取存储器(RAM)、只读存储器(ROM)、高速缓存、闪存、硬盘或任何其他合适的存储组件。如图2所示,在一个实施例中,存储器组件34可以是与图像捕捉组件22和处理器32进行通信的单独的组件。根据另一实施例,存储器组件34可被集成到处理器32和/或图像捕捉组件22中。
如图2所示,捕捉设备20可经由通信链路36与计算环境12进行通信。通信链路36可以是包括例如USB连接、火线连接、以太网线缆连接之类的有线连接和/或诸如无线802.11b、802.11g、802.11a或802.11n连接之类的无线连接。根据一个实施例,计算环境12可以经由通信链路36向捕捉设备20提供时钟,可以使用该时钟来确定何时捕捉例如场景。
另外,捕捉设备20可经由通信链路36向计算环境12提供深度信息和由例如3-D照相机26和/或RGB照相机28捕捉的图像,和/或可由捕捉设备20生成的骨架模型。计算环境12然后可使用该模型、深度信息、以及所捕捉的图像来例如控制诸如游戏或文字处理程序等的应用和/或动画化化身或屏幕上人物。例如,如图2所示,计算环境12可包括姿势库190。姿势库190可包括姿势过滤器集合,每一姿势过滤器包括关于骨架模型可执行(在用户移动时)的姿势的信息。可将由相机26、28和捕捉设备20捕捉的骨架模型形式的数据以及与其相关联的移动与姿势库190中的姿势过滤器进行比较来标识用户(如骨架模型所表示的)何时执行了一个或多个姿势。那些姿势可与应用的各种控制相关联。因此,计算环境12可使用姿势库190来解释骨架模型的移动并基于该移动来控制应用。
图3示出可用于解释目标识别、分析和跟踪系统中的一个或多个姿势和/或动画化目标识别、分析和跟踪系统所显示的化身或屏幕上的人物的计算环境的示例实施例。上面参考图1A-2所描述的诸如计算环境12等计算环境可以是诸如游戏控制台等多媒体控制台100。如图3所示,多媒体控制台100具有含有一级高速缓存102、二级高速缓存104和闪存ROM(只读存储器)106的中央处理单元(CPU)101。一级高速缓存102和二级高速缓存104临时存储数据并因此减少存储器访问周期数,由此改进处理速度和吞吐量。CPU 101可以设置成具有一个以上的内核,以及由此的附加的一级高速缓存102和二级高速缓存104。闪存ROM 106可存储在多媒体控制台100通电时引导过程的初始阶段期间加载的可执行代码。
图形处理单元(GPU)108和视频编码器/视频编解码器(编码器/解码器)114形成用于高速和高分辨率图形处理的视频处理流水线。数据经由总线从图形处理单元108输送到视频编码器/视频编解码器114。视频处理流水线向A/V(音频/视频)端口140输出数据,以便传输到电视机或其他显示器。存储器控制器110连接到GPU 108以方便处理器访问各种类型的存储器112,诸如但不局限于RAM(随机存取存储器)。
多媒体控制台100包括较佳地在模块118上实现的I/O控制器120、系统管理控制器122、音频处理单元123、网络接口控制器124、第一USB主控制器126、第二USB控制器128和前面板I/O子部件130。USB控制器126和128用作外围控制器142(1)-142(2)、无线适配器148、和外置存储器设备146(例如闪存、外置CD/DVD ROM驱动器、可移动介质等)的主机。网络接口124和/或无线适配器148提供对网络(例如,因特网、家庭网络等)的访问,并且可以是包括以太网卡、调制解调器、蓝牙模块、电缆调制解调器等的各种不同的有线或无线适配器组件中任何一种。
提供系统存储器143来存储在引导过程期间加载的应用数据。提供介质驱动器144,该介质驱动器可以包括DVD/CD驱动器、硬盘驱动器,或其他可移动介质驱动器等。介质驱动器144可以内置或外置于多媒体控制台100。应用数据可经由介质驱动器144访问,以由多媒体控制台100执行、回放等。介质驱动器144经由诸如串行ATA总线或其他高速连接(例如IEEE 1394)等总线连接到I/O控制器120。
系统管理控制器122提供涉及确保多媒体控制台100的可用性的各种服务功能。音频处理单元123和音频编解码器132形成具有高保真度和立体声处理的对应的音频处理流水线。音频数据经由通信链路在音频处理单元123与音频编解码器132之间传输。音频处理流水线将数据输出到A/V端口140以供外置音频播放器或具有音频能力的设备再现。
前面板I/O子部件130支持暴露在多媒体控制台100的外表面上的电源按钮150和弹出按钮152以及任何LED(发光二极管)或其他指示器的功能。系统供电模块136向多媒体控制台100的组件供电。风扇138冷却多媒体控制台100内的电路。
CPU 101、GPU 108、存储器控制器110、和多媒体控制台100内的各种其他组件经由一条或多条总线互连,总线包括串行和并行总线、存储器总线、外围总线、和使用各种总线架构中任一种的处理器或局部总线。作为示例,这些架构可以包括外围部件互连(PCI)总线、PCI-Express总线等。
当多媒体控制台100通电时,应用数据可从系统存储器143加载到存储器112和/或高速缓存102、104中并在CPU 101上执行。应用可呈现在导航到多媒体控制台100上可用的不同媒体类型时提供一致的用户体验的图形用户界面。在操作中,介质驱动器144中包含的应用和/或其他媒体可从介质驱动器144启动或播放,以向多媒体控制台100提供附加功能。
多媒体控制台100可通过将该系统简单地连接到电视机或其他显示器而作为独立系统来操作。在该独立模式中,多媒体控制台100允许一个或多个用户与该系统交互、看电影、或听音乐。然而,随着通过网络接口124或无线适配器148可用的宽带连接的集成,多媒体控制台100还可作为更大网络社区中的参与者来操作。
当多媒体控制台100通电时,可以保留设定量的硬件资源以供多媒体控制台操作系统作系统使用。这些资源可以包括存储器保留量(例如,16MB)、CPU和GPU周期保留量(例如,5%)、网络带宽保留量(例如,8kbs)等。因为这些资源是在系统引导时保留的,所以所保留的资源从应用的角度而言是不存在的。
具体而言,存储器保留优选地足够大,以包含启动内核、并发系统应用和驱动程序。CPU保留优选地为恒定,使得若所保留的CPU用量不被系统应用使用,则空闲线程将消耗任何未使用的周期。
对于GPU保留,通过使用GPU中断来调度代码来将弹出窗口呈现为覆盖图以显示由系统应用生成的轻量消息(例如,弹出窗口)。覆盖图所需的存储器量取决于覆盖区域大小,并且覆盖图优选地与屏幕分辨率成比例缩放。在并发系统应用使用完整用户界面的情况下,优选使用独立于应用分辨率的分辨率。定标器可用于设置该分辨率,从而无需改变频率并引起TV重新同步。
在多媒体控制台100引导且系统资源被保留之后,就执行并发系统应用来提供系统功能。系统功能被封装在上述所保留的系统资源中执行的一组系统应用中。操作系统内核标识是系统应用线程而非游戏应用线程的线程。系统应用优选地被调度为在预定时间并以预定时间间隔在CPU 101上运行,以便为应用提供一致的系统资源视图。进行调度是为了把由在控制台上运行的游戏应用所引起的高速缓存分裂最小化。
当并发系统应用需要音频时,则由于时间敏感性而将音频处理异步地调度给游戏应用。多媒体控制台应用管理器(如下所述)在系统应用活动时控制游戏应用的音频水平(例如,静音、衰减)。
输入设备(例如,控制器142(1)和142(2))由游戏应用和系统应用共享。输入设备不是保留资源,而是在系统应用和游戏应用之间切换以使其各自具有设备的焦点。应用管理器较佳地控制输入流的切换,而无需知晓游戏应用的知识,并且驱动程序维护有关焦点切换的状态信息。相机26、28和捕捉设备20可为控制台100定义额外的输入设备。
图4示出计算环境220的另一示例实施例,该计算环境可以是用于解释目标识别、分析和跟踪系统中的一个或多个姿势和/或动画化目标识别、分析和跟踪系统所显示的化身或屏幕上人物的图1A-2中示出的计算环境12。计算系统环境220只是合适的计算环境的一个示例,并且不旨在对所公开的主题的使用范围或功能提出任何限制。也不应该将计算环境220解释为对示例性操作环境220中示出的任一组件或其组合有任何依赖性或要求。在某些实施例中,所描绘的各种计算元素可包括被配置成实例化本发明的各具体方面的电路。例如,本公开中使用的术语电路可包括被配置成通过固件或开关来执行功能的专用硬件组件。其他示例中,术语电路可包括由实施可用于执行功能的逻辑的软件指令配置的通用处理单元、存储器等。在电路包括硬件和软件的组合的示例实施例中,实施者可以编写体现逻辑的源代码,且源代码可以被编译为可以由通用处理单元处理的机器可读代码。因为本领域技术人员可以明白现有技术已经进化到硬件、软件或硬件/软件组合之间几乎没有差别的地步,因而选择硬件或是软件来实现具体功能是留给实现者的设计选择。更具体地,本领域技术人员可以明白软件进程可被变换成等价的硬件结构,而硬件结构本身可被变换成等价的软件进程。因此,对于硬件实现还是软件实现的选择是设计选择并留给实现者。
在图4中,计算环境220包括计算机241,计算机241通常包括各种计算机可读介质。计算机可读介质可以是能由计算机241访问的任何可用介质,而且包含易失性和非易失性介质、可移动和不可移动介质。系统存储器222包括易失性和/或非易失性存储器形式的计算机存储介质,如只读存储器(ROM)223和随机存取存储器(RAM)260。包含诸如在启动期间帮助在计算机241内的元件之间传输信息的基本例程的基本输入/输出系统224(BIOS)通常储存储在ROM 223中。RAM 260通常包含处理单元259可立即访问和/或目前正在操作的数据和/或程序模块。作为示例而非限制,图4示出了操作系统225、应用程序226、其他程序模块227和程序数据228。
计算机241也可以包括其他可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图4示出了从不可移动、非易失性磁介质中读取或向其写入的硬盘驱动器238,从可移动、非易失性磁盘254中读取或向其写入的磁盘驱动器239,以及从诸如CD ROM或其他光学介质等可移动、非易失性光盘253中读取或向其写入的光盘驱动器240。可在示例性操作环境中使用的其他可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于,磁带盒、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等。硬盘驱动器238通常由例如接口234等不可移动存储器接口连接至系统总线221,而磁盘驱动器239和光盘驱动器240通常由例如接口235等可移动存储器接口连接至系统总线221。
以上讨论并在图4中示出的驱动器及其相关联的计算机存储介质为计算机241提供了对计算机可读指令、数据结构、程序模块和其他数据的存储。在图4中,例如,硬盘驱动器238被示为存储操作系统258、应用程序257、其他程序模块256和程序数据255。注意,这些组件可以与操作系统225、应用程序226、其他程序模块227和程序数据228相同或不同。在此操作系统258、应用程序257、其他程序模块256以及程序数据255被给予了不同的编号,以说明至少它们是不同的副本。用户可以通过输入设备,例如键盘251和定点设备252——通常是指鼠标、跟踪球或触摸垫——向计算机241输入命令和信息。其他输入设备(未示出)可包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等。这些和其他输入设备通常通过耦合至系统总线的用户输入接口236连接至处理单元259,但也可以由其他接口和总线结构,例如并行端口、游戏端口或通用串行总线(USB)来连接。相机26、28和捕捉设备20可为控制台100定义额外的输入设备。监视器242或其他类型的显示设备也通过诸如视频接口232之类的接口连接至系统总线221。除监视器之外,计算机还可以包括可以通过输出外围接口233连接的诸如扬声器244和打印机243之类的其他外围输出设备。
计算机241可以使用到一个或多个远程计算机(如远程计算机246)的逻辑连接,以在联网环境中操作。远程计算机246可以是个人计算机、服务器、路由器、网络PC、对等设备或其他常见网络节点,并且通常包括许多或所有以上关于计算机241所描述的元件,但在图4中仅示出了存储器存储设备247。图2中所描绘的逻辑连接包括局域网(LAN)245和广域网(WAN)249,但还可包括其他网络。这些联网环境在办公室、企业范围计算机网络、内联网和因特网中是常见的。
当用于LAN联网环境中时,计算机241通过网络接口或适配器237连接到LAN 245。当在WAN联网环境中使用时,计算机241通常包括调制解调器250或用于通过诸如因特网等WAN 249建立通信的其他手段。调制解调器250,可以是内置的或外置的,可以经由用户输入接口236或其他适当的机制,连接到系统总线221。在联网环境中,相对于计算机241所描述的程序模块或其部分可被存储在远程存储器存储设备中。作为示例而非限制,图4示出了远程应用程序248驻留在存储器设备247上。应当理解,所示的网络连接是示例性的,并且可使用在计算机之间建立通信链接的其他手段。
图5描绘了用于跟踪模型的示例方法300的流程图。示例方法300可使用例如,参考图1A-4所描述的目标识别、分析和跟踪系统10的捕捉设备20和/或计算环境12来实现。在一示例实施例中,示例方法300可采取可由例如参考图1A-4所描述的目标识别、分析和跟踪系统10的捕捉设备20和/或计算环境12执行的程序代码(即指令)的形式。
根据一实施例,在305,可接收深度图像。例如,目标识别、分析和跟踪系统可包括诸如参考图1A-2描述的捕捉设备20等的捕捉设备。捕捉设备可捕捉或观察可包括一个或多个目标的场景。在一示例实施例中,捕捉设备可以是深度相机,该深度相机被配置成使用诸如飞行时间分析、结构化光分析、立体视觉分析等任何合适的技术来获得场景的深度图像。
深度图像可以是多个观测到的像素,其中每个观测到的像素具有观测到的深度值。例如,深度图像可包括所捕捉的场景的二维(2-D)像素区域,其中2-D像素区域中的每一像素可表示深度值,诸如例如以厘米、毫米等计的、所捕捉的场景中的对象距捕捉设备的长度或距离。
图6示出了可在305处被接收的深度图像400的示例实施例。根据一示例实施例,深度图像400可以是由例如以上参考图2所描述的捕捉设备20的3-D相机26和/或RGB相机28所捕捉的场景的图像或帧。如图6所示,深度图像400可包括与例如诸如参考图1A和1B所描述的用户18等的用户对应的人类目标402以及诸如所捕捉的场景中的墙、桌子、监视器等的一个或多个非人类目标404。如上所述,深度图像400可包括多个观测到的像素,其中每一观测到的像素具有与其相关联的观测到的深度值。例如,深度图像400可包括所捕捉的场景的二维(2-D)像素区域,其中2-D像素区域中的每一像素可具有深度值,诸如例如以厘米、毫米等计的、所捕捉的场景中的对象或目标距捕捉设备的长度或距离。在一实施例中,深度图像400可被着色从而使得深度图像的像素的不同颜色对应于和/或从视觉上描绘了人类目标402和非人类目标404离捕捉设备的不同距离。例如,根据一个实施例,深度图像中与最接近捕捉设备的目标相关联的像素可用红色和/或橙色阴影来着色,而深度图像中与较远的目标相关联的像素可用绿色和/或蓝色阴影来着色。
回头参考图5,在一个实施例中,在305处接收到图像之后,可将该图像降采样到较低的处理分辨率,使得该深度图像可用更少的计算开销来被更容易地使用和/或更快地处理。另外,可从深度图像中移除和/或平滑掉一个或多个高变度和/或含噪声的深度值;可填入和/或重构缺少的和/或移除的深度信息的各部分;和/或可对所接收的深度信息执行任何其他合适的处理,使得该深度信息可用于生成诸如骨架模型等模型,如将在下文更详细描述的。
在315,可扫描深度图像中的人类目标来寻找一个或多个身体部位。例如,在接收到深度图像后,目标识别、分析及跟踪系统可以确定深度图像是否包括诸如上述参考图6描述的人类目标402这样的人类目标,人类目标402对应于例如上述参考图1A一1B描述的诸如用户18这样的用户。在一个实施例中,为了确定深度图像是否包括人类目标,目标识别、分析及跟踪系统可以对深度图像中的每个目标或物体进行填色,然后将每个经填色的目标或物体与和人在各个位置和姿势下的身体模型相关联的图案相比较。然后可以扫描与图案相匹配的经填色的目标(即人类目标),以确定包括诸如和一个或多个身体部分相关联的长度、宽度等测量在内的各个值。例如,可以分离出与图案相匹配的经填色的目标(即人类目标),并且可以创建人类目标的掩膜。可以通过例如对人类目标进行填色来创建掩模,以便人类目标可以与场景元素中的其他目标或物体分开。然后可以分析掩膜以确定一个或多个身体部分的位置。
在一个实施例中,在315处扫描人类目标之前,目标识别、分析及跟踪系统可在310确定深度图像中的人类目标先前是否已被扫描。例如,诸如以上参考图1A-2所描述的捕捉设备20等的捕捉设备可按帧来捕捉场景。每一帧可包括一深度图像。可如上所述分析每一帧的深度图像来确定深度图像是否可包括人类目标。可进一步分析每一帧的深度图像来确定先前是否已经扫描了人类目标来寻找一个或多个身体部位。例如,在310,目标识别、分析及跟踪系统可确定在305接收到的深度图像中的人类目标是否对应于先前在315处扫描的人类目标。在一个实施例中,在310,如果该人类目标不对应于先前扫描的人类目标,则然后可在315处扫描该人类目标。因此,根据一示例实施例,人类目标可以在初始帧和由捕捉设备捕捉的包括人类目标的深度图像内扫描一次。
根据另一实施例,目标识别、分析及跟踪系统可以在包括人类目标的每个接收到的深度图像中扫描人类目标以寻找一个或多个身体部分。然后可以对与例如一个或多个身体部分的测量相关联的扫描结果进行平均,这将在以下更详细地描述。
图7示出深度图像400的示例实施例,深度图像400可以包括可以在例如315被扫描的人类目标402。例如,在深度图像400中找到诸如人类目标402等有效人类目标之后,可移除深度图像中不与人类目标匹配的背景或区域。然后可为人类目标402生成掩膜,该掩膜可包括该人类目标的沿着例如X、Y和Z轴的值。根据一示例实施例,从例如头开始,可以扫描人类目标402的掩膜以获得各个身体部分。
如图7所示,可扫描诸如位、像素等与匹配的人类目标402相关联的信息来确定与人类目标402的身体的各个部位相关联的各个位置,如扫描bp1-扫描bp6。例如,在移除了深度图像中人类目标402周围的背景或区域之后,该深度图像400可包括经分离出的人类目标402。然后可为经分离出的人类目标402生成可包括X、Y和Z值的掩膜。可以扫描人类目标402的掩膜以确定各个身体部分的位置、测量和其他信息。例如,最初可确定人类目标402的掩膜的顶部。如图7所示,人类目标402的掩膜的顶部可以与如扫描bp1所指示的头的顶部的位置相关联。在确定了头的顶部之后,可以向下扫描掩膜继而确定人类目标402的颈的位置、人类目标402的肩的位置,以此类推。
返回图5,在320,然后可基于所述扫描来生成诸如人类目标的骨架模型这样的模型。例如,根据一个实施例,可以使用通过扫描确定的各个点或身体部分来定位诸如骨架模型等模型中的一个或多个关节。一个或多个关节可定义可以对应于人类的身体部位的一个或多个骨骼。因此,根据一示例实施例,在320,可以基于在315通过扫描确定的各个身体部分的位置来生成模型。
图8示出了深度图像的示例实施例,其中可以为被扫描的人类目标402生成诸如骨架模型这样的模型500。根据一示例实施例,模型500可包括一个或多个数据结构,这些数据结构可将例如以上参照图6描述的人类目标402表示为三维模型。每个身体部分可以被表征为一数学向量,该数学向量具有可定义模型500的关节和骨骼的X、Y和Z值。
如图8所示,模型500可包括一个或多个关节j1-j16。根据一示例实施例,关节j1-j16中的每一个可使得在这些关节之间定义的一个或多个身体部位能相对于一个或多个其他身体部位移动。例如,表示人类目标的模型可包括多个刚性和/或可变形身体部位,这些身体部位由一个或多个诸如“骨骼”等结构件来定义,而关节j1-j16位于毗邻骨骼的交叉点处。关节j1-j18可使得与骨骼和关节j1-j18相关联的各个身体部位能够彼此独立地移动。例如,如图8中所示的,关节j5与j8之间定义的骨骼对应于小臂,该小臂可独立于例如关节j13与j15之间的骨骼——其对应于小腿——移动。如图8所示,模型可以被定位或调整以适合在与深度图像400相关联的人类目标402内,使得模型500中的关节j1-j16以及其间定义的骨头可以有与基于例如扫描确定的身体部分的位置相关联的X、Y和Z值。
回过头参照图5,在325,可以移除诸如深度图像的非人类目标这样的背景,以分离出接收到的深度图像中的人类目标。例如,如上所述,目标识别、分析及跟踪系统可以捕捉或观察以帧为单位的场景的深度图像。目标识别、分析及跟踪系统可以分析一帧中的每个接收到的深度图像以确定像素是否可以与深度图像的背景相关联。如果像素可以与诸如一个或多个非人类目标这样的背景对象相关联,则可以从深度图像移除或丢弃该像素,使得可以在深度图像中分离出人类目标。
在330,可以调整模型以适合于接收到的深度图像中的经分离出的人类目标内。例如,如上所述,目标识别、分析及跟踪系统可以在325移除每个接收到的深度图像的背景,使得可以在接收到的深度图像中分离出人类目标。在一个实施例中,目标识别、分析及跟踪系统可以将在例如320生成的模型转置或覆盖到深度图像上,其中人类目标被分离出来。然后,可以调整模型以便适合于接收到的图像中的被分离出的人类目标内。例如,可以基于与接收到的深度图像中的被分离出的人类目标的像素相关联的X、Y和Z值,在X方向、Y方向和/或Z方向上移动和/或转动模型的关节和骨骼,使得可以调整模型以适合于人类目标内。
根据一示例实施例,可以通过确定例如诸如一个或多个关节和骨骼这样的模型的一部分是否可以在可定义被分离出人类目标的边缘之外,调整模型以适合于被分离出的人类目标内。如果例如关节可以在被分离出的人类目标的边缘之外,则可以用被分离出的人类目标的深度值(即Z值)将该关节吸附到最接近的像素。例如,在一个实施例中,如果关节在人类目标之外,则目标识别、分析及跟踪系统可以使用在接收到的深度图像中分离出的人类目标的深度值,来搜索或确定与人类目标的身体部分相关联的最接近的像素。然后,可以基于该搜索或确定,将可能在接收到的深度图像中分离出的人类目标之外的关节吸附到最接近的像素,使得该关节可以被分配到与最接近的像素相关联的X、Y和深度值。根据一示例实施例,然后可以细化关节,使得关节可以被进一步调整,并且被分配到和在距离被分离出目标的相应身体部分的边缘中距或等距离处的像素相关联的X、Y和Z值,这在以下将更详细地描述。
例如,如上所述,目标识别、分析及跟踪系统可以捕捉或观察以帧为单位的深度图像。在一示例实施例中,各帧可以以一定的频率被捕捉,诸如每秒15帧、每秒30帧、每秒45帧等等。根据一个实施例,可以基于一个速率来选择每秒捕捉的帧的频率,所述速率允许目标识别、分析及跟踪系统发现或确定被分离出的人类目标的最接近像素是和同模型的关节和/或骨骼相关联的身体部分相对应的像素,这将在以下更详细地描述。
图9A-9C示出模型被调整以适合于深度图像中分离出的人类目标的示例实施例。根据一示例实施例,在接收到深度图像400a后,目标识别、分析和跟踪系统可以通过移除背景来分离出深度图像400a中的人类目标402。在从深度图像400a移除了背景之后,模型500可以被转置或覆盖到深度图像400a上,被分离出的人类目标402如图9A所示。根据一个实施例,模型500可以在一个位置处被转置或覆盖到深度图像400a上,该位置与例如之前在一个帧内接收到的深度图像中的人类目标402相关联。例如,图9A所示的模型500可以在图8所示的深度图像400中的人类目标402的位置处被转置或覆盖到深度图像400a上。因此,在一个实施例中,图9A中所示的关节j1-j16以及其间定义的骨骼中的每一个可以在之前接收到的深度图像(诸如图8所示的深度图像400)中的人类目标402的关节j1-j16及其间定义的骨骼的X、Y和Z值处,被转置或覆盖到深度图像400a上。
在将模型500覆盖或转置到深度图像400a之上后,目标识别、分析及跟踪系统可以确定模型500的关节和/或骨骼是否可以在与深度图像400a中的被分离出的人类目标402相关联的像素之外。在一个实施例中,为了确定关节和/或骨骼是否可以在像素区域之外,目标识别、分析及跟踪系统可以确定覆盖或转置在深度图像400a的像素之上的每一个关节和/或骨骼是否具有诸如非零深度值、小于或等于捕捉设备可以捕捉或观察到的最大距离的深度值等等这样的有效深度值。(英文语法有问题,根据下文看出来的)例如,如上所述,在接收到深度图像400a之后,可以移除背景404以分离出人类目标402。在一个实施例中,在移除背景404之后,与深度图像中的背景404相关联的每一个像素可以具有分配到的有效深度值,诸如零深度值、负深度值等。因此,根据一个示例实施例,在移除背景404之后,与被分离出的人类目标402相关联的像素可以包括有效深度值,而深度图像400a中的其余像素可以包括无效深度值。
在一个实施例中,目标识别分析及跟踪系统可以基于关节和/或骨骼的X和Y值,来标识深度图像400a中和模型500的每个关节和/或骨骼处在相同位置处的像素。然后,目标识别、分析和跟踪系统可以确定与每个关节和/或骨骼相关联的像素是否可以具有有效深度值。例如,目标识别、分析及跟踪系统可以检查与每个关节和/或骨骼相关联的像素的深度值来确定像素是否具有有效的、非零深度值,使得像素可以与人类目标402相关联或者像素是否具有无效深度值。根据一个实施例,如果在例如关节和/或骨骼的位置处的像素的深度值可能具有诸如非零深度值这样的有效深度值,则目标识别、分析及跟踪系统可以确定该关节和/或骨骼可以位于被分离出的人类目标402的边缘上或者在所述边缘内。或者,如果在例如关节和/或骨骼的位置处的像素的深度值可以具有无效深度值,则目标识别、分析及跟踪系统可以确定该关节和/或骨骼可以在深度图像400a的被分离出的人类目标402之外。
例如,目标识别、分析及跟踪系统可以标识与关节j1-j16和/或其间定义的骨骼中的每一个相关联的像素,以确定关节j1-j16和/或其间定义的骨骼中的每一个是否可以在人类目标402之外。如图9A所示,在一个实施例中,目标识别、分析及跟踪系统可以通过检查与关节j1-j7和j9-j16和/或其间定义的骨骼中的每一个的位置处的深度图像400a的像素相关联的深度值,来确定关节j1-j7和j9-j16和/或其间定义的骨骼中的每一个可以在深度图像400a中的人类目标402的边缘之上或之内。通过检查与关节j8的位置处的深度图像400a的像素相关联的深度值,目标识别、分析及跟踪系统可以进一步确定:关节j8以及在关节j8和j5之间定义的一部分骨骼可以在深度图像400a中的人类目标402的边缘之外。
在一示例实施例中,如果关节和/或骨骼可以在人类目标的边缘之外,则该关节和/或骨骼可以被吸附到具有有效深度值的最接近像素。例如,如图9A所示,目标识别、分析及跟踪系统可以确定,关节j8可以在深度图像400a中的人类目标402的边缘之外。在确定关节j8可以在人类目标402之外后,目标识别、分析及跟踪系统可以标识可具有有效深度值的深度图像400a中最接近关节j8的像素,使得像素可以与人类目标402的边缘相关联。然后,目标识别、分析及跟踪系统可以将关节j8吸附至最接近的像素,使得该关节可以被分配到与该最接近像素相关联的X、Y和深度值。
在一个实施例中,为了标识与诸如关节j8这样的关节最接近的像素,目标识别、分析及跟踪系统可以最初检查和关节j8的位置处的深度图像400a中的像素相邻的第一组像素的深度值。例如,目标识别、分析及跟踪系统可以将在和与关节j8的位置相关联的像素相邻的每个像素的深度值与无效深度值相比较。如果每个相邻像素可以与无效深度值相匹配,则目标识别、分析及跟踪系统可以检查与第一组像素值相邻的第二值像素等等,直到目标识别、分析及跟踪系统可以标识可具有有效深度值的一个或多个像素,诸如像素p1和p2。
在标识了可具有有效深度值的一个或多个像素之后,目标识别、分析及跟踪系统然后可以计算关节j8和具有有效深度值的一个或多个像素(诸如像素p1和p2)之间的距离。例如,目标识别、分析及跟踪系统可以使用与像素p1相关联的X、Y和/或Z值(即深度值)以及与关节j8相关联的X、Y和/或Z值,来计算像素p1和关节j8之间的距离d。目标识别、分析及跟踪系统还可以使用与像素p2相关联的X、Y和/或Z值(即深度值)以及与关节j8相关联的X、Y和/或Z值,来计算像素p2和关节j8之间的距离d’。
然后,目标识别、分析及跟踪系统可以将所计算的距离d和d’相比较以便确定与关节j8最接近的像素,像素p1或p2。根据一示例实施例,基于该比较,目标识别、分析及跟踪系统可以将具有最小所计算距离的像素选择作为最接近于关节j8的像素。例如,在一个实施例中,目标识别、分析及跟踪系统可以计算出距离d的第一值,例如10毫米以及距离d’的第二值,例如15毫米。然后,目标识别、分析及跟踪系统可以将与距离d和d’相关联的第一值10毫米和第二值15毫米相比较。基于该比较,目标识别、分析及跟踪系统可以将像素p1选择作为最接近关节j8的像素。
然后,目标识别、分析及跟踪系统可以如图9B所示将关节j8吸附至像素p1,使得关节j8可以被分配到与像素p1相关联的X、Y和深度值。
根据一示例实施例,如果诸如距离d和d’这样的距离是相等的,则目标识别、分析及跟踪系统可以分析关节j8以确定关节j8可以与模型500的手臂相关联。基于该分析,目标识别、分析及跟踪系统然后可以估计是将关节j8吸附为像素p1还是p2。例如,在确定关节j8可以与模型500的手臂相关联后,由于对人类目标402的手臂最可能处在的位置的估计,目标识别、分析及跟踪系统可以确定向外吸附关节j8。然后,目标识别、分析及跟踪系统可以向外将关节j8吸附至像素p1。
在一个实施例中,在标识了和人类目标402外的关节最接近的像素后,目标识别、分析及跟踪系统可以调整会与人类目标402之外的关节相关的一个或多个关节。例如,肩关节j2、j3和j4可以彼此相关,使得每个关节之间的距离或测量可以与扫描所确定的距离或测量保持相同。如果肩关节j2可以如图9A-9C所示在人类目标402之外,则目标识别、分析及跟踪系统可以如上所述地调整关节j2。根据一示例实施例,目标识别、分析及跟踪系统还可以基于对关节j2的调整来进一步调整关节j3和j4,使得关节j2、j3和j4之间的距离或测量与扫描所确定的距离或测量保持相同。
此外,根据一示例实施例,最初可以通过定位与例如模型500的躯干相关联的关节(诸如人类目标402质心处的关节j6),来调整模型500。例如,目标识别、分析及跟踪系统可以基于扫描所确定的一个或多个测量来计算人类目标402的质心或几何中心。然后,目标识别、分析及跟踪系统可以调整例如关节6,关节6可以在与质心位置相关联的人类目标402的像素处与模型的躯干相关联。然后可以基于对例如关节j6作出的调整,在例如X、Y和Z方向上移动其余的关节j1-j5以及j7-j16,使得关节j1-j5和j7-j16可以基于扫描来保持它们相应的距离和/或测量。
在将关节和/或骨骼的每一个吸附至最接近像素之后,目标识别、分析及跟踪系统然后细化关节和/或骨骼的每一个,使得这些关节和/或骨骼可以距离人类目标的相应身体部分的边缘等距离定位。例如,在将关节j8吸附至像素p1之后,如图9B所示,可以细化关节j1-j16以及其间的骨骼,使得关节j1-j16可以距离人类目标402的身体部分的每个边缘位于等距离,如图9C所示。
在一个实施例,为了细化关节j1-j16,目标识别系统可以基于关节j1-j16和/或其间定义的骨骼的每一个的位置,来计算人类目标402的身体部分的边到边距离。例如,目标识别、分析及跟踪系统可以使用这样的位置来为关节j 8计算边到边距离,所述位置诸如第一边缘e1处的像素p1以及在第二边缘e2处与像素p1并列的像素(例如像素p3)的X、Y和Z(即深度值)。然后,目标识别、分析及跟踪系统可以划分所计算的边到边距离,使得可以生成中点,具有到边缘e1和e2的相等距离d1和d1’。随后,关节j8可以被分配例如距中点的X、Y和Z(即深度)值。因此,根据一示例实施例,目标识别、分析及跟踪系统可以细化每一个关节j1-16,使得模型500的中心位于图9C所示的人类目标420的相应身体部分。
回过头参考图5,在330,通过进一步确定例如一个或多个关节和骨骼是否可以与人类目标的相应身体部分的有效深度值相关联,可以调整模型以适合在被分离出的人类目标内。例如,在一个实施例中,用户(诸如上面参照图1A和1B所述的用户18)可以使他或她的手臂在另一个身体部分之前,使得与用户相关联的人类目标的深度值可以反映出在该人类目标的另一身体部分之前的手臂。在一个实施例中,与模型手臂相关联的关节可以处在在人类目标的边缘内的位置处,但是关节可能不与人类目标的手臂的有效深度值相关联。
如上所述,根据一示例实施例,目标识别、分析及跟踪系统然后检查与关节位置处的像素相邻的一组或更多组像素,以确定该关节可以与人类目标的相应身体部分的有效深度值相关联。例如,目标识别、分析及跟踪系统可以将关节位置处的像素的深度值与第一组相邻像素的深度值相比较。根据一个实施例,如果关节位置处的像素和例如第一组像素中的一个像素的深度值之差可能大于边缘容限值,则目标识别、分析及跟踪系统可以确定可在两个像素间定义的边缘。
然后,目标识别、分析及跟踪系统可以基于与关节相关联的身体部分,来确定是将关节吸附至具有较小深度值的像素、还是具有较接近于捕捉设备的深度值的像素。例如,如上所述,如果关节可以与手臂相关联,则目标识别、分析及跟踪系统可以基于一个估计来将关节吸附至具有较小深度值的像素,所述估计是由目标识别、分析及跟踪系统作出的关于边缘可以与深度图像中的人类目标的手臂相关联的估计。在一个实施例中,目标识别、分析及跟踪系统可以基于例如身体部分的位置来作出估计,所述身体部分诸如与之前捕捉的帧相关联的深度图像中的手臂。目标识别、分析及跟踪系统还可以基于一个或多个已存储的身体姿势来作出估计。例如,目标识别、分析及跟踪系统可以包括模型的可能身体姿势的分层结构。目标识别、分析及跟踪系统可以将模型的已经用之前捕捉的帧的深度图像调整的姿势与已存储的身体姿势相比较,以确定是将关节吸附至具有较小深度值的像素、还是较接近于捕捉设备的像素。
图10A-10C示出模型被调整以适合于深度图像400b中分离出的人类目标内的示例实施例。如图10A所示,关节j10可以处在深度图像400b中人类目标402内的具有有效深度值的位置处。在一个实施例中,如上所述,目标识别、分析及跟踪系统可以确定例如关节j10是否可以与人类目标402的手臂的有效深度值相关联。例如,目标识别、分析及跟踪系统可以将关节j10位置处的像素的深度值与包括像素p3在内的一组相邻像素相比较。如果例如在关节j10位置处的像素和该组相邻像素中的像素p3之间的差大于边缘容限值,则目标识别、分析及跟踪系统可以确定在这两个像素间定义了一个边缘。例如,边缘容限值可以是20毫米。如果关节j10位置处的像素的深度值可以是10毫米,而像素p3的深度值可以是70毫米,则目标识别、分析及跟踪系统可以确定可以在这两个像素之间定义边缘e3。
目标识别、分析及跟踪系统然后可以确定是否要将关节j10吸附至像素p3。例如,如上所述,目标识别、分析及跟踪系统可以基于目标识别、分析及跟踪系统作出的关于边缘e3可以与深度图像400b中人类目标402的手臂相关联的估计,确定要将关节j10吸附成像素p3。
如果目标识别、分析及跟踪系统可以确定关节j3应被吸附至像素p3,则目标识别、分析及跟踪系统可以调整关节j10,使得关节j10可以被分配例如像素p3的X、Y和Z(即深度)值。目标识别、分析及跟踪系统然后可以如上所述地细化关节j1-j16。
回头参考图5,在335处,可以处理经调整的模型。例如,在一个实施例中,目标识别、分析及跟踪系统可以通过例如生成建模(包括调整)的运动捕捉文件,来处理经调整的模型。
目标识别、分析和跟踪系统还可以通过将应用于经调整的模型的一个或多个运动或移动映射到化身或游戏人物来处理经调整的模型,使得可对该化身或游戏人物制作动画来模拟诸如以上参考图1A和1B描述的用户18等用户。例如,然后可响应于对经调整的模型的改变来改变屏幕上人物的视觉外观。
在一个实施例中,经调整的模型可以通过将经调整的模型提供给诸如参照图1A-4描述的计算环境12这样的计算环境,来处理经调整的模型。该计算环境可包括可用于基于骨架模型中的各个身体部位的位置来确定要在应用内执行的控制的姿势库。
应该理解,此处所述的配置和/或方法在本质上是示例性的,且这些具体实施例或示例不被认为是限制性的。此处所述的具体例程或方法可表示任何数量的处理策略中的一个或更多个。由此,所示出的各个动作可以按所示顺序执行、按其他顺序执行、并行地执行等等。同样,可以改变上述过程的次序。
本发明的主题包括各种过程、系统和配置的所有新颖和非显而易见的组合和子组合、和此处所公开的其他特征、功能、动作、和/或特性、以及其任何和全部等效物。

Claims (15)

1.一种用于跟踪用户的模型的设备,所述设备包括:
相机组件(22),所述相机组件接收场景的深度图像(400a、400b);以及
处理器(32),所述处理器执行计算机可执行指令,所述计算机可执行指令包括用于以下操作的指令:
从所述相机组件接收深度图像(400a、400b);
移除所述深度图像(400a、400b)的背景以分离出人类目标(402);以及
调整所述模型(500)以适合在所分离出的人类目标(402)内。
2.如权利要求1所述的设备,其特征在于,所述模型(500)包括具有关节(j1-j16)和骨骼的骨架模型,所述调整模型(500)以适合在所分离出的人类目标(402)内的指令包括:调整关节(j1-j16)或骨骼以适合在所分离出的人类目标(402)内的指令。
3.如权利要求2所述的设备,其特征在于,所述调整模型(500)以适合在所分离出的人类目标(402)的第一边缘内的指令包括用于以下操作的指令:
确定所述模型(500)的关节(j1-j16)是否在所分离出的人类目标(402)的边缘之外;
将所述关节(j1-j16)吸附至最接近的像素;以及
基于所述最接近的像素来细化所分离出的人类目标(402)内的关节(j1-j16)。
4.如权利要求3所述的设备,其特征在于,所述将关节(j1-j16)吸附至最接近的像素的指令包括用于以下操作的指令:
检查和与关节(j1-16)位置相关联的深度图像(400a、400b)中的像素相邻的一组像素,以确定该组像素中的至少一个像素是否具有有效深度值;以及
计算与关节(j1-j16)位置相关联的深度图像(400a、400b)中的像素以及具有有效深度值的该组像素中的每个像素之间的距离;以及
从所计算的距离中选择最短距离作为最接近的像素。
5.如权利要求3所述的设备,其特征在于,所述将关节(j1-j16)吸附至最接近的像素的指令还包括用于向关节(j1-j16)分配与最接近像素相关联的X值、Y值和Z值的指令。
6.如权利要求3所述的设备,其特征在于,所述基于最接近像素在所分离出的人类目标(402)内细化关节(j1-j16)的指令包括用于以下操作的指令:
确定一像素,该像素距离与最接近像素相关联的第一边缘以及与最接近像素对面的像素相关联的人类目标(402)的第二边缘等距离;以及
向所述模型(500)的所述部分分配所述像素的X值、Y值和Z值,所述像素在与最接近像素相关联的人类目标(402)的第一边缘以及与最接近像素对面的像素相关联的人类目标(402)的第二边缘之间等距离。
7.一种其上存储有用于跟踪与用户相关联的模型的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令包括用于以下操作的指令:
从所述相机组件接收深度图像(400a、400b);
移除所述深度图像(400a、400b)的背景以分离出人类目标(402);
确定所述模型(500)的一部分是否在所分离出的人类目标(402)的边缘之外;以及
将所分离出的人类目标(402)的边缘之外的模型(500)的所述部分吸附至所分离出的人类目标(402)的最接近像素。
8.如权利要求7所述的计算机可读存储介质,其特征在于,所述模型(500)的所述部分包括以下的至少一个:关节(j1-j16)和骨骼。
9.如权利要求7所述的计算机可读存储介质,其特征在于,所述将所分离出的人类目标(402)的边缘之外的模型(500)的所述部分吸附至所分离出的人类目标(402)的最接近像素的指令还包括用于以下操作的指令:
检查和与所述模型(500)的所述部分的位置相关联的深度图像(400a、400b)中的像素相邻的一组像素,以确定该组像素中的至少一个像素是否具有有效深度值;以及
计算与所述模型(500)的所述部分的位置相关联的深度图像(400a、400b)中的像素以及具有有效深度值的该组像素中的每个像素之间的距离;以及
从所计算的距离中选择最短距离作为最接近的像素。
10.如权利要求7所述的计算机可读存储介质,其特征在于,所述将所分离出的人类目标(402)的边缘之外的模型(500)的所述部分吸附至所分离出的人类目标(402)的最接近像素的指令还包括:用于向所述模型(500)的所述部分分配与所述最接近像素相关联的X值、Y值和Z值的指令。
11.如权利要求7所述的计算机可读存储介质,其特征在于还包括用于在所分离出的人类目标(402)内细化所述模型(500)的所述部分的指令,所述细化包括:向所述模型(500)的所述部分分配一个像素的X值、Y值和Z值,该像素在与最接近像素相关联的人类目标(402)的第一边缘以及与最接近像素对面的像素相关联的人类目标(402)的第二边缘之间等距离。
12.一种用于跟踪与用户相关联的模型(500)的系统,所述系统包括:
捕捉设备(20),所述捕捉设备包括接收场景的深度图像(400a、400b)的相机组件;以及
与所述捕捉设备操作上通信的计算设备(12),所述计算设备包括一处理器,所述处理器移除所述深度图像(400a、400b)的背景以分离出人类目标(402)、确定所述模型(500)的关节(j1-j16)是否在所分离出的人类目标(402)的边缘之外、以及将在所分离出的人类目标(402)的边缘之外的所述模型(500)的关节(j1-j16)调整至所分离出的人类目标(402)的最接近像素。
13.如权利要求12所述的系统,其特征在于,所述处理器通过向所述模型(500)的关节(j1-j16)分配与所述最接近像素相关联的X值、Y值和Z值,来将所分离出的人类目标(402)的边缘之外的所述模型(500)的关节(j1-j16)调整至所分离出的人类目标(402)的最接近像素。
14.如权利要求13所述的系统,其特征在于,所述处理器还在所分离出的人类目标(402)内细化所述模型(500)的经调整的关节(j1-j16)。
15.如权利要求14所述的系统,其特征在于,所述处理器通过将关节(j1-j16)调整为距离与最接近像素相关联的第一边缘和人类目标(402)的第二边缘等距离,在所分离出的人类目标(402)内细化所述模型(500)的经调整的关节(j1-j16)。
CN2010800246603A 2009-05-29 2010-05-24 用于跟踪模型的系统和方法 Active CN102448562B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US18249209P 2009-05-29 2009-05-29
US61/182,492 2009-05-29
US12/484,592 2009-06-15
US12/484,592 US8320619B2 (en) 2009-05-29 2009-06-15 Systems and methods for tracking a model
PCT/US2010/035899 WO2010138431A2 (en) 2009-05-29 2010-05-24 Systems and methods for tracking a model

Publications (2)

Publication Number Publication Date
CN102448562A true CN102448562A (zh) 2012-05-09
CN102448562B CN102448562B (zh) 2013-05-29

Family

ID=43220263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800246603A Active CN102448562B (zh) 2009-05-29 2010-05-24 用于跟踪模型的系统和方法

Country Status (3)

Country Link
US (3) US8320619B2 (zh)
CN (1) CN102448562B (zh)
WO (1) WO2010138431A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460077A (zh) * 2018-11-19 2019-03-12 深圳博为教育科技有限公司 一种自动跟踪方法、自动跟踪设备及自动跟踪系统
WO2019057164A1 (zh) * 2017-09-21 2019-03-28 腾讯科技(深圳)有限公司 虚拟交互场景中目标定位方法及装置

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101238608B1 (ko) 2004-07-30 2013-02-28 익스트림 리얼리티 엘티디. 이미지 프로세싱을 기반으로 한 3d 공간 차원용 시스템 및 방법
US8872899B2 (en) * 2004-07-30 2014-10-28 Extreme Reality Ltd. Method circuit and system for human to machine interfacing by hand gestures
US8681100B2 (en) 2004-07-30 2014-03-25 Extreme Realty Ltd. Apparatus system and method for human-machine-interface
US8928654B2 (en) 2004-07-30 2015-01-06 Extreme Reality Ltd. Methods, systems, devices and associated processing logic for generating stereoscopic images and video
US9046962B2 (en) 2005-10-31 2015-06-02 Extreme Reality Ltd. Methods, systems, apparatuses, circuits and associated computer executable code for detecting motion, position and/or orientation of objects within a defined spatial region
US20070285554A1 (en) * 2005-10-31 2007-12-13 Dor Givon Apparatus method and system for imaging
DE202005018902U1 (de) * 2005-12-02 2007-04-12 Bauerfeind Ag Einlegesohle für Schuhe
EP2342642A1 (en) * 2008-09-04 2011-07-13 Extreme Reality Ltd. Method system and software for providing image sensor based human machine interfacing
US8295546B2 (en) 2009-01-30 2012-10-23 Microsoft Corporation Pose tracking pipeline
US8294767B2 (en) * 2009-01-30 2012-10-23 Microsoft Corporation Body scan
US8320619B2 (en) 2009-05-29 2012-11-27 Microsoft Corporation Systems and methods for tracking a model
CA2774867A1 (en) 2009-09-21 2011-03-24 Extreme Reality Ltd. Methods circuits apparatus and systems for human machine interfacing with an electronic appliance
US8878779B2 (en) 2009-09-21 2014-11-04 Extreme Reality Ltd. Methods circuits device systems and associated computer executable code for facilitating interfacing with a computing platform display screen
US7961910B2 (en) 2009-10-07 2011-06-14 Microsoft Corporation Systems and methods for tracking a model
US8963829B2 (en) 2009-10-07 2015-02-24 Microsoft Corporation Methods and systems for determining and tracking extremities of a target
US8564534B2 (en) 2009-10-07 2013-10-22 Microsoft Corporation Human tracking system
JP6203634B2 (ja) 2010-04-09 2017-09-27 ゾール メディカル コーポレイションZOLL Medical Corporation Ems装置通信インタフェースのシステム及び方法
CN102614663A (zh) * 2011-01-30 2012-08-01 德信互动科技(北京)有限公司 多人游戏实现装置
KR101920473B1 (ko) * 2011-07-27 2018-11-22 삼성전자주식회사 센서 융합 기반으로 3차원 위치와 방향을 추정하는 장치 및 방법
WO2013069023A2 (en) * 2011-11-13 2013-05-16 Extreme Reality Ltd. Methods systems apparatuses circuits and associated computer executable code for video based subject characterization, categorization, identification and/or presence response
US9628843B2 (en) * 2011-11-21 2017-04-18 Microsoft Technology Licensing, Llc Methods for controlling electronic devices using gestures
US9389681B2 (en) * 2011-12-19 2016-07-12 Microsoft Technology Licensing, Llc Sensor fusion interface for multiple sensor input
US9584806B2 (en) 2012-04-19 2017-02-28 Futurewei Technologies, Inc. Using depth information to assist motion compensation-based video coding
JP2015533248A (ja) 2012-09-28 2015-11-19 ゾール メディカル コーポレイションZOLL Medical Corporation Ems環境内で三次元対話をモニタするためのシステム及び方法
US9378576B2 (en) * 2013-06-07 2016-06-28 Faceshift Ag Online modeling for real-time facial animation
US9516263B2 (en) 2013-08-02 2016-12-06 Apple Inc. Automatic configuration of the logical orientation of multiple monitors based on captured images
PL3045017T3 (pl) * 2013-09-10 2017-09-29 Philips Lighting Holding B.V. Zewnętrzne układy sterowania oświetleniem w oparciu o treści stron trzecich
US9811916B1 (en) * 2013-09-25 2017-11-07 Amazon Technologies, Inc. Approaches for head tracking
US20160262685A1 (en) 2013-11-12 2016-09-15 Highland Instruments, Inc. Motion analysis systemsand methods of use thereof
US9607573B2 (en) * 2014-09-17 2017-03-28 International Business Machines Corporation Avatar motion modification
CN104751513A (zh) * 2015-03-12 2015-07-01 深圳市同洲电子股份有限公司 一种建立人体骨骼模型的方法及装置
US9903691B1 (en) * 2016-08-31 2018-02-27 Elwha Llc Electro-shock projectile launcher
CN109977884B (zh) * 2019-03-29 2021-05-11 北京易达图灵科技有限公司 目标跟随方法和装置
EP3869395A1 (en) * 2020-02-21 2021-08-25 Accenture Global Solutions Limited Identity and liveness verification
US11727637B2 (en) * 2020-12-15 2023-08-15 Kwangwoon University Industry-Academic Collaboration Foundation Method for generating 3D skeleton using joint-based calibration acquired from multi-view camera
WO2022251548A1 (en) 2021-05-27 2022-12-01 Linda Bernardi Selecting supplemental audio segments based on video analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1395231A (zh) * 2001-07-04 2003-02-05 松下电器产业株式会社 图像信号编码方法、图像信号编码设备和存储媒体
CN1764931A (zh) * 2003-02-11 2006-04-26 索尼电脑娱乐公司 实时运动捕捉的方法和设备

Family Cites Families (218)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4288078A (en) * 1979-11-20 1981-09-08 Lugo Julio I Game apparatus
US4695953A (en) * 1983-08-25 1987-09-22 Blair Preston E TV animation interactively controlled by the viewer
US4630910A (en) * 1984-02-16 1986-12-23 Robotic Vision Systems, Inc. Method of measuring in three-dimensions at high speed
US4627620A (en) * 1984-12-26 1986-12-09 Yang John P Electronic athlete trainer for improving skills in reflex, speed and accuracy
US4645458A (en) * 1985-04-15 1987-02-24 Harald Phillip Athletic evaluation and training apparatus
US4702475A (en) * 1985-08-16 1987-10-27 Innovating Training Products, Inc. Sports technique and reaction training system
US4843568A (en) * 1986-04-11 1989-06-27 Krueger Myron W Real time perception of and response to the actions of an unencumbered participant/user
US4711543A (en) * 1986-04-14 1987-12-08 Blair Preston E TV animation interactively controlled by the viewer
US4796997A (en) * 1986-05-27 1989-01-10 Synthetic Vision Systems, Inc. Method and system for high-speed, 3-D imaging of an object at a vision station
US5184295A (en) * 1986-05-30 1993-02-02 Mann Ralph V System and method for teaching physical skills
US4751642A (en) * 1986-08-29 1988-06-14 Silva John M Interactive sports simulation system with physiological sensing and psychological conditioning
US4809065A (en) * 1986-12-01 1989-02-28 Kabushiki Kaisha Toshiba Interactive system and related method for displaying data to produce a three-dimensional image of an object
US4817950A (en) * 1987-05-08 1989-04-04 Goo Paul E Video game control unit and attitude sensor
US5239463A (en) * 1988-08-04 1993-08-24 Blair Preston E Method and apparatus for player interaction with animated characters and objects
US5239464A (en) * 1988-08-04 1993-08-24 Blair Preston E Interactive video system providing repeated switching of multiple tracks of actions sequences
US4901362A (en) * 1988-08-08 1990-02-13 Raytheon Company Method of recognizing patterns
US4893183A (en) * 1988-08-11 1990-01-09 Carnegie-Mellon University Robotic vision system
JPH02199526A (ja) * 1988-10-14 1990-08-07 David G Capper 制御インターフェース装置
US4925189A (en) * 1989-01-13 1990-05-15 Braeunig Thomas F Body-mounted video game exercise device
US5229756A (en) * 1989-02-07 1993-07-20 Yamaha Corporation Image control apparatus
US5469740A (en) * 1989-07-14 1995-11-28 Impulse Technology, Inc. Interactive video testing and training system
JPH03103822U (zh) * 1990-02-13 1991-10-29
US5101444A (en) * 1990-05-18 1992-03-31 Panacea, Inc. Method and apparatus for high speed object location
US5148154A (en) * 1990-12-04 1992-09-15 Sony Corporation Of America Multi-dimensional user interface
US5534917A (en) * 1991-05-09 1996-07-09 Very Vivid, Inc. Video image based control system
US5417210A (en) * 1992-05-27 1995-05-23 International Business Machines Corporation System and method for augmentation of endoscopic surgery
US5295491A (en) * 1991-09-26 1994-03-22 Sam Technology, Inc. Non-invasive human neurocognitive performance capability testing method and system
US6054991A (en) 1991-12-02 2000-04-25 Texas Instruments Incorporated Method of modeling player position and movement in a virtual reality system
DE69229474T2 (de) 1991-12-03 2000-03-02 French Sportech Corp Interaktives videosystem zur beobachtung und zum training der leistungsfähigkeit einer person
US5875108A (en) 1991-12-23 1999-02-23 Hoffberg; Steven M. Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
JPH07325934A (ja) 1992-07-10 1995-12-12 Walt Disney Co:The 仮想世界に向上したグラフィックスを提供する方法および装置
US5999908A (en) 1992-08-06 1999-12-07 Abelow; Daniel H. Customer-based product design module
US5320538A (en) * 1992-09-23 1994-06-14 Hughes Training, Inc. Interactive aircraft training system and method
IT1257294B (it) 1992-11-20 1996-01-12 Dispositivo atto a rilevare la configurazione di un'unita' fisiologicadistale,da utilizzarsi in particolare come interfaccia avanzata per macchine e calcolatori.
US5495576A (en) * 1993-01-11 1996-02-27 Ritchey; Kurtis J. Panoramic image based virtual reality/telepresence audio-visual system and method
US5690582A (en) 1993-02-02 1997-11-25 Tectrix Fitness Equipment, Inc. Interactive exercise apparatus
JP2799126B2 (ja) 1993-03-26 1998-09-17 株式会社ナムコ ビデオゲーム装置及びゲーム用入力装置
US5405152A (en) * 1993-06-08 1995-04-11 The Walt Disney Company Method and apparatus for an interactive video game with physical feedback
US5454043A (en) * 1993-07-30 1995-09-26 Mitsubishi Electric Research Laboratories, Inc. Dynamic and static hand gesture recognition through low-level image analysis
US5423554A (en) * 1993-09-24 1995-06-13 Metamedia Ventures, Inc. Virtual reality game method and apparatus
US5980256A (en) 1993-10-29 1999-11-09 Carmein; David E. E. Virtual reality system with enhanced sensory apparatus
JP3419050B2 (ja) 1993-11-19 2003-06-23 株式会社日立製作所 入力装置
US5347306A (en) * 1993-12-17 1994-09-13 Mitsubishi Electric Research Laboratories, Inc. Animated electronic meeting place
JP2552427B2 (ja) 1993-12-28 1996-11-13 コナミ株式会社 テレビ遊戯システム
US5577981A (en) * 1994-01-19 1996-11-26 Jarvik; Robert Virtual reality exercise machine and computer controlled video system
US5580249A (en) * 1994-02-14 1996-12-03 Sarcos Group Apparatus for simulating mobility of a human
US5597309A (en) 1994-03-28 1997-01-28 Riess; Thomas Method and apparatus for treatment of gait problems associated with parkinson's disease
US5385519A (en) * 1994-04-19 1995-01-31 Hsu; Chi-Hsueh Running machine
US5524637A (en) * 1994-06-29 1996-06-11 Erickson; Jon W. Interactive system for measuring physiological exertion
US5563988A (en) * 1994-08-01 1996-10-08 Massachusetts Institute Of Technology Method and system for facilitating wireless, full-body, real-time user interaction with a digitally represented visual environment
US6714665B1 (en) 1994-09-02 2004-03-30 Sarnoff Corporation Fully automated iris recognition system utilizing wide and narrow fields of view
US5516105A (en) * 1994-10-06 1996-05-14 Exergame, Inc. Acceleration activated joystick
US5638300A (en) 1994-12-05 1997-06-10 Johnson; Lee E. Golf swing analysis system
JPH08161292A (ja) 1994-12-09 1996-06-21 Matsushita Electric Ind Co Ltd 混雑度検知方法およびそのシステム
US5594469A (en) * 1995-02-21 1997-01-14 Mitsubishi Electric Information Technology Center America Inc. Hand gesture machine control system
US5682229A (en) 1995-04-14 1997-10-28 Schwartz Electro-Optics, Inc. Laser range camera
US6205231B1 (en) * 1995-05-10 2001-03-20 Identive Corporation Object identification in a moving video image
US5913727A (en) 1995-06-02 1999-06-22 Ahdoot; Ned Interactive movement and contact simulation game
JP3481631B2 (ja) 1995-06-07 2003-12-22 ザ トラスティース オブ コロンビア ユニヴァーシティー イン ザ シティー オブ ニューヨーク 能動型照明及びデフォーカスに起因する画像中の相対的なぼけを用いる物体の3次元形状を決定する装置及び方法
IL114278A (en) * 1995-06-22 2010-06-16 Microsoft Internat Holdings B Camera and method
US5682196A (en) 1995-06-22 1997-10-28 Actv, Inc. Three-dimensional (3D) video presentation system providing interactive 3D presentation with personalized audio responses for multiple viewers
CN100524015C (zh) * 1995-06-22 2009-08-05 3Dv系统有限公司 生成距景物距离的图象的方法和装置
US5702323A (en) 1995-07-26 1997-12-30 Poulton; Craig K. Electronic exercise enhancer
US6098458A (en) 1995-11-06 2000-08-08 Impulse Technology, Ltd. Testing and training system for assessing movement and agility skills without a confining field
US6308565B1 (en) 1995-11-06 2001-10-30 Impulse Technology Ltd. System and method for tracking and assessing movement skills in multidimensional space
US6073489A (en) 1995-11-06 2000-06-13 French; Barry J. Testing and training system for assessing the ability of a player to complete a task
US6430997B1 (en) 1995-11-06 2002-08-13 Trazer Technologies, Inc. System and method for tracking and assessing movement skills in multidimensional space
US6176782B1 (en) 1997-12-22 2001-01-23 Philips Electronics North America Corp. Motion-based command generation technology
US5933125A (en) 1995-11-27 1999-08-03 Cae Electronics, Ltd. Method and apparatus for reducing instability in the display of a virtual environment
US5925189A (en) 1995-12-06 1999-07-20 Applied Materials, Inc. Liquid phosphorous precursor delivery apparatus
US5641288A (en) 1996-01-11 1997-06-24 Zaenglein, Jr.; William G. Shooting simulating process and training device using a virtual reality display screen
JP2000510013A (ja) 1996-05-08 2000-08-08 リアル ヴィジョン コーポレイション 位置検出を用いたリアルタイムシミュレーション
US6173066B1 (en) 1996-05-21 2001-01-09 Cybernet Systems Corporation Pose determination and tracking by matching 3D objects to a 2D sensor
US5989157A (en) 1996-08-06 1999-11-23 Walton; Charles A. Exercising system with electronic inertial game playing
JP2001504605A (ja) 1996-08-14 2001-04-03 ラティポフ,ヌラフメド,ヌリスラモビチ 空間内のユーザの位置及び方向性を追跡及び表示するための方法、ユーザに対し仮想環境を提示するための方法及びこれらの方法を実現するためのシステム
JP3064928B2 (ja) 1996-09-20 2000-07-12 日本電気株式会社 被写体抽出方式
DE69626208T2 (de) 1996-12-20 2003-11-13 Hitachi Europ Ltd Verfahren und System zur Erkennung von Handgesten
US6009210A (en) 1997-03-05 1999-12-28 Digital Equipment Corporation Hands-free interface to a virtual reality environment using head tracking
US6100896A (en) 1997-03-24 2000-08-08 Mitsubishi Electric Information Technology Center America, Inc. System for designing graphical multi-participant environments
US5877803A (en) 1997-04-07 1999-03-02 Tritech Mircoelectronics International, Ltd. 3-D image detector
US6215898B1 (en) 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
JP3077745B2 (ja) 1997-07-31 2000-08-14 日本電気株式会社 データ処理方法および装置、情報記憶媒体
US6188777B1 (en) 1997-08-01 2001-02-13 Interval Research Corporation Method and apparatus for personnel detection and tracking
US6289112B1 (en) 1997-08-22 2001-09-11 International Business Machines Corporation System and method for determining block direction in fingerprint images
US6720949B1 (en) 1997-08-22 2004-04-13 Timothy R. Pryor Man machine interfaces and applications
AUPO894497A0 (en) 1997-09-02 1997-09-25 Xenotech Research Pty Ltd Image processing method and apparatus
WO1999015863A1 (en) 1997-09-24 1999-04-01 3Dv Systems, Ltd. Acoustical imaging system
EP0905644A3 (en) 1997-09-26 2004-02-25 Matsushita Electric Industrial Co., Ltd. Hand gesture recognizing device
US6141463A (en) 1997-10-10 2000-10-31 Electric Planet Interactive Method and system for estimating jointed-figure configurations
US6101289A (en) 1997-10-15 2000-08-08 Electric Planet, Inc. Method and apparatus for unencumbered capture of an object
US6130677A (en) 1997-10-15 2000-10-10 Electric Planet, Inc. Interactive computer vision system
US6072494A (en) 1997-10-15 2000-06-06 Electric Planet, Inc. Method and apparatus for real-time gesture recognition
AU9808298A (en) 1997-10-15 1999-05-03 Electric Planet, Inc. A system and method for generating an animatable character
AU1099899A (en) 1997-10-15 1999-05-03 Electric Planet, Inc. Method and apparatus for performing a clean background subtraction
US6181343B1 (en) 1997-12-23 2001-01-30 Philips Electronics North America Corp. System and method for permitting three-dimensional navigation through a virtual reality environment using camera-based gesture inputs
US6159100A (en) 1998-04-23 2000-12-12 Smith; Michael D. Virtual reality game
US6077201A (en) * 1998-06-12 2000-06-20 Cheng; Chau-Yang Exercise bicycle
US20010008561A1 (en) 1999-08-10 2001-07-19 Paul George V. Real-time object tracking system
US7036094B1 (en) 1998-08-10 2006-04-25 Cybernet Systems Corporation Behavior recognition system
US6681031B2 (en) 1998-08-10 2004-01-20 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
US6801637B2 (en) 1999-08-10 2004-10-05 Cybernet Systems Corporation Optical body tracker
US7121946B2 (en) 1998-08-10 2006-10-17 Cybernet Systems Corporation Real-time head tracking system for computer games and other applications
US6950534B2 (en) * 1998-08-10 2005-09-27 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
IL126284A (en) 1998-09-17 2002-12-01 Netmor Ltd System and method for three dimensional positioning and tracking
EP0991011B1 (en) 1998-09-28 2007-07-25 Matsushita Electric Industrial Co., Ltd. Method and device for segmenting hand gestures
US6501515B1 (en) * 1998-10-13 2002-12-31 Sony Corporation Remote control system
WO2000034919A1 (en) 1998-12-04 2000-06-15 Interval Research Corporation Background estimation and segmentation based on range and color
US6147678A (en) 1998-12-09 2000-11-14 Lucent Technologies Inc. Video hand image-three-dimensional computer interface with multiple degrees of freedom
WO2000036372A1 (en) 1998-12-16 2000-06-22 3Dv Systems, Ltd. Self gating photosurface
US6570555B1 (en) 1998-12-30 2003-05-27 Fuji Xerox Co., Ltd. Method and apparatus for embodied conversational characters with multimodal input/output in an interface device
US6363160B1 (en) 1999-01-22 2002-03-26 Intel Corporation Interface using pattern recognition and tracking
US7003134B1 (en) * 1999-03-08 2006-02-21 Vulcan Patents Llc Three dimensional object pose estimation which employs dense depth information
US6299308B1 (en) 1999-04-02 2001-10-09 Cybernet Systems Corporation Low-cost non-imaging eye tracker system for computer control
US6614422B1 (en) 1999-11-04 2003-09-02 Canesta, Inc. Method and apparatus for entering data using a virtual input device
US6503195B1 (en) 1999-05-24 2003-01-07 University Of North Carolina At Chapel Hill Methods and systems for real-time structured light depth extraction and endoscope using real-time structured light depth extraction
US6476834B1 (en) 1999-05-28 2002-11-05 International Business Machines Corporation Dynamic creation of selectable items on surfaces
US6873723B1 (en) 1999-06-30 2005-03-29 Intel Corporation Segmenting three-dimensional video images using stereo
US6738066B1 (en) 1999-07-30 2004-05-18 Electric Plant, Inc. System, method and article of manufacture for detecting collisions between video images generated by a camera and an object depicted on a display
US7113918B1 (en) 1999-08-01 2006-09-26 Electric Planet, Inc. Method for video enabled electronic commerce
US7050606B2 (en) 1999-08-10 2006-05-23 Cybernet Systems Corporation Tracking and gesture recognition system particularly suited to vehicular control applications
WO2001018563A1 (en) * 1999-09-08 2001-03-15 3Dv Systems, Ltd. 3d imaging system
US6690618B2 (en) 2001-04-03 2004-02-10 Canesta, Inc. Method and apparatus for approximating a source position of a sound-causing event for determining an input used in operating an electronic device
US20030132950A1 (en) 2001-11-27 2003-07-17 Fahri Surucu Detecting, classifying, and interpreting input events based on stimuli in multiple sensory domains
US7006236B2 (en) * 2002-05-22 2006-02-28 Canesta, Inc. Method and apparatus for approximating depth of an object's placement onto a monitored region with applications to virtual interface devices
US7050177B2 (en) * 2002-05-22 2006-05-23 Canesta, Inc. Method and apparatus for approximating depth of an object's placement onto a monitored region with applications to virtual interface devices
DE19960180B4 (de) * 1999-12-14 2006-03-09 Rheinmetall W & M Gmbh Verfahren zur Herstellung eines Sprenggeschosses
US6674877B1 (en) * 2000-02-03 2004-01-06 Microsoft Corporation System and method for visually tracking occluded objects in real time
US6663491B2 (en) 2000-02-18 2003-12-16 Namco Ltd. Game apparatus, storage medium and computer program that adjust tempo of sound
US6633294B1 (en) 2000-03-09 2003-10-14 Seth Rosenthal Method and apparatus for using captured high density motion for animation
EP1152261A1 (en) 2000-04-28 2001-11-07 CSEM Centre Suisse d'Electronique et de Microtechnique SA Device and method for spatially resolved photodetection and demodulation of modulated electromagnetic waves
US6956576B1 (en) * 2000-05-16 2005-10-18 Sun Microsystems, Inc. Graphics system using sample masks for motion blur, depth of field, and transparency
US6640202B1 (en) 2000-05-25 2003-10-28 International Business Machines Corporation Elastic sensor mesh system for 3-dimensional measurement, mapping and kinematics applications
US6731799B1 (en) 2000-06-01 2004-05-04 University Of Washington Object segmentation with background extraction and moving boundary techniques
US6788809B1 (en) 2000-06-30 2004-09-07 Intel Corporation System and method for gesture recognition in three dimensions using stereo imaging and color vision
JP2002058045A (ja) 2000-08-08 2002-02-22 Komatsu Ltd 現実の物体をバーチャル3次元空間に登場させるためのシステム及び方法
US20020024517A1 (en) * 2000-07-14 2002-02-28 Komatsu Ltd. Apparatus and method for three-dimensional image production and presenting real objects in virtual three-dimensional space
US7227526B2 (en) 2000-07-24 2007-06-05 Gesturetek, Inc. Video-based image control system
US7058204B2 (en) 2000-10-03 2006-06-06 Gesturetek, Inc. Multiple camera control system
JP3725460B2 (ja) * 2000-10-06 2005-12-14 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
US7039676B1 (en) 2000-10-31 2006-05-02 International Business Machines Corporation Using video image analysis to automatically transmit gestures over a network in a chat or instant messaging session
US6678413B1 (en) * 2000-11-24 2004-01-13 Yiqing Liang System and method for object identification and behavior characterization using video analysis
US7116330B2 (en) * 2001-02-28 2006-10-03 Intel Corporation Approximating motion using a three-dimensional model
US6539931B2 (en) * 2001-04-16 2003-04-01 Koninklijke Philips Electronics N.V. Ball throwing assistant
US8035612B2 (en) 2002-05-28 2011-10-11 Intellectual Ventures Holding 67 Llc Self-contained interactive video display system
US7259747B2 (en) 2001-06-05 2007-08-21 Reactrix Systems, Inc. Interactive video display system
AU2002315456A1 (en) 2001-06-22 2003-01-08 Canesta, Inc. Method and system to display a virtual input device
JP3420221B2 (ja) 2001-06-29 2003-06-23 株式会社コナミコンピュータエンタテインメント東京 ゲーム装置及びプログラム
US6937742B2 (en) 2001-09-28 2005-08-30 Bellsouth Intellectual Property Corporation Gesture activated home appliance
US20030165048A1 (en) 2001-12-07 2003-09-04 Cyrus Bamji Enhanced light-generated interface for use with electronic devices
WO2003071410A2 (en) 2002-02-15 2003-08-28 Canesta, Inc. Gesture recognition system using depth perceptive sensors
US20030169906A1 (en) 2002-02-26 2003-09-11 Gokturk Salih Burak Method and apparatus for recognizing objects
US7310431B2 (en) * 2002-04-10 2007-12-18 Canesta, Inc. Optical methods for remotely measuring objects
US7607509B2 (en) 2002-04-19 2009-10-27 Iee International Electronics & Engineering S.A. Safety device for a vehicle
US7003136B1 (en) * 2002-04-26 2006-02-21 Hewlett-Packard Development Company, L.P. Plan-view projections of depth image data for object tracking
US7710391B2 (en) 2002-05-28 2010-05-04 Matthew Bell Processing an image utilizing a spatially varying pattern
US7348963B2 (en) 2002-05-28 2008-03-25 Reactrix Systems, Inc. Interactive video display system
US7170492B2 (en) 2002-05-28 2007-01-30 Reactrix Systems, Inc. Interactive video display system
US7489812B2 (en) 2002-06-07 2009-02-10 Dynamic Digital Depth Research Pty Ltd. Conversion and encoding techniques
US7646372B2 (en) * 2003-09-15 2010-01-12 Sony Computer Entertainment Inc. Methods and systems for enabling direction detection when interfacing with a computer program
US7883415B2 (en) * 2003-09-15 2011-02-08 Sony Computer Entertainment Inc. Method and apparatus for adjusting a view of a scene being displayed according to tracked head motion
US7623115B2 (en) * 2002-07-27 2009-11-24 Sony Computer Entertainment Inc. Method and apparatus for light input device
US7151530B2 (en) * 2002-08-20 2006-12-19 Canesta, Inc. System and method for determining an input selected by a user through a virtual interface
US7227893B1 (en) * 2002-08-22 2007-06-05 Xlabs Holdings, Llc Application-specific object-based segmentation and recognition system
US7576727B2 (en) 2002-12-13 2009-08-18 Matthew Bell Interactive directed light/sound system
JP4235729B2 (ja) 2003-02-03 2009-03-11 国立大学法人静岡大学 距離画像センサ
DE602004006190T8 (de) 2003-03-31 2008-04-10 Honda Motor Co., Ltd. Vorrichtung, Verfahren und Programm zur Gestenerkennung
US8072470B2 (en) 2003-05-29 2011-12-06 Sony Computer Entertainment Inc. System and method for providing a real-time three-dimensional interactive environment
JP4355341B2 (ja) * 2003-05-29 2009-10-28 本田技研工業株式会社 深度データを用いたビジュアルトラッキング
EP3190546A3 (en) 2003-06-12 2017-10-04 Honda Motor Co., Ltd. Target orientation estimation using depth sensing
US7874917B2 (en) * 2003-09-15 2011-01-25 Sony Computer Entertainment Inc. Methods and systems for enabling depth and direction detection when interfacing with a computer program
WO2005041579A2 (en) 2003-10-24 2005-05-06 Reactrix Systems, Inc. Method and system for processing captured image information in an interactive video display system
JP3847753B2 (ja) * 2004-01-30 2006-11-22 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理方法、記録媒体、コンピュータプログラム、半導体デバイス
KR100519781B1 (ko) * 2004-02-18 2005-10-07 삼성전자주식회사 객체 추적 방법 및 그 장치
US20050215319A1 (en) * 2004-03-23 2005-09-29 Harmonix Music Systems, Inc. Method and apparatus for controlling a three-dimensional character in a three-dimensional gaming environment
WO2005104010A2 (en) 2004-04-15 2005-11-03 Gesture Tek, Inc. Tracking bimanual movements
US7308112B2 (en) * 2004-05-14 2007-12-11 Honda Motor Co., Ltd. Sign based human-machine interaction
US7704135B2 (en) 2004-08-23 2010-04-27 Harrison Jr Shelton E Integrated game system, method, and device
WO2006025137A1 (ja) * 2004-09-01 2006-03-09 Sony Computer Entertainment Inc. 画像処理装置、ゲーム装置および画像処理方法
EP1645944B1 (en) * 2004-10-05 2012-08-15 Sony France S.A. A content-management interface
JP4449723B2 (ja) * 2004-12-08 2010-04-14 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
KR20060070280A (ko) 2004-12-20 2006-06-23 한국전자통신연구원 손 제스처 인식을 이용한 사용자 인터페이스 장치 및 그방법
CN101198964A (zh) 2005-01-07 2008-06-11 格斯图尔泰克股份有限公司 使用红外图案照射创建对象的三维图像
EP2487624B1 (en) 2005-01-07 2020-02-19 Qualcomm Incorporated(1/3) Detecting and tracking objects in images
EP1849123A2 (en) 2005-01-07 2007-10-31 GestureTek, Inc. Optical flow based tilt sensor
US7526101B2 (en) * 2005-01-24 2009-04-28 Mitsubishi Electric Research Laboratories, Inc. Tracking objects in videos with adaptive classifiers
US8009871B2 (en) * 2005-02-08 2011-08-30 Microsoft Corporation Method and system to segment depth images and to detect shapes in three-dimensionally acquired data
US7598942B2 (en) 2005-02-08 2009-10-06 Oblong Industries, Inc. System and method for gesture based control system
KR100688743B1 (ko) * 2005-03-11 2007-03-02 삼성전기주식회사 멀티 레이어 커패시터 내장형의 인쇄회로기판의 제조방법
JP4686595B2 (ja) * 2005-03-17 2011-05-25 本田技研工業株式会社 クリティカルポイント解析に基づくポーズ推定
BRPI0613165A2 (pt) 2005-05-17 2010-12-21 Gesturetek Inc saìda de sinal sensìvel à orientação
EP1752748B1 (en) 2005-08-12 2008-10-29 MESA Imaging AG Highly sensitive, fast pixel for use in an image sensor
US20080026838A1 (en) 2005-08-22 2008-01-31 Dunstan James E Multi-player non-role-playing virtual world games: method for two-way interaction between participants and multi-player virtual world games
US7450736B2 (en) 2005-10-28 2008-11-11 Honda Motor Co., Ltd. Monocular tracking of 3D human motion with a coordinated mixture of factor analyzers
GB2431717A (en) * 2005-10-31 2007-05-02 Sony Uk Ltd Scene analysis
US7433024B2 (en) * 2006-02-27 2008-10-07 Prime Sense Ltd. Range mapping using speckle decorrelation
US8766983B2 (en) * 2006-05-07 2014-07-01 Sony Computer Entertainment Inc. Methods and systems for processing an interchange of real time effects during video communication
US7721207B2 (en) * 2006-05-31 2010-05-18 Sony Ericsson Mobile Communications Ab Camera based control
US7701439B2 (en) 2006-07-13 2010-04-20 Northrop Grumman Corporation Gesture recognition simulation system and method
US8395658B2 (en) * 2006-09-07 2013-03-12 Sony Computer Entertainment Inc. Touch screen-like user interface that does not require actual touching
JP5395323B2 (ja) 2006-09-29 2014-01-22 ブレインビジョン株式会社 固体撮像素子
US20080134102A1 (en) * 2006-12-05 2008-06-05 Sony Ericsson Mobile Communications Ab Method and system for detecting movement of an object
US8351646B2 (en) * 2006-12-21 2013-01-08 Honda Motor Co., Ltd. Human pose estimation and tracking using label assignment
US7412077B2 (en) 2006-12-29 2008-08-12 Motorola, Inc. Apparatus and methods for head pose estimation and head gesture detection
GB0703974D0 (en) * 2007-03-01 2007-04-11 Sony Comp Entertainment Europe Entertainment device
US7729530B2 (en) 2007-03-03 2010-06-01 Sergey Antonov Method and apparatus for 3-D data input to a personal computer with a multimedia oriented operating system
US7852262B2 (en) 2007-08-16 2010-12-14 Cybernet Systems Corporation Wireless mobile indoor/outdoor tracking system
US7970176B2 (en) * 2007-10-02 2011-06-28 Omek Interactive, Inc. Method and system for gesture classification
WO2009059065A1 (en) 2007-10-30 2009-05-07 Hewlett-Packard Development Company, L.P. Interactive display system with collaborative gesture detection
US20090221368A1 (en) * 2007-11-28 2009-09-03 Ailive Inc., Method and system for creating a shared game space for a networked game
GB2455316B (en) * 2007-12-04 2012-08-15 Sony Corp Image processing apparatus and method
US8149210B2 (en) * 2007-12-31 2012-04-03 Microsoft International Holdings B.V. Pointing device and method
CN101254344B (zh) 2008-04-18 2010-06-16 李刚 场地方位与显示屏点阵按比例相对应的游戏装置和方法
CN201254344Y (zh) 2008-08-20 2009-06-10 中国农业科学院草原研究所 植物标本及种子存贮器
US8659596B2 (en) * 2008-11-24 2014-02-25 Mixamo, Inc. Real time generation of animation-ready 3D character models
US20100195867A1 (en) * 2009-01-30 2010-08-05 Microsoft Corporation Visual target tracking using model fitting and exemplar
US8253746B2 (en) * 2009-05-01 2012-08-28 Microsoft Corporation Determine intended motions
US8320619B2 (en) * 2009-05-29 2012-11-27 Microsoft Corporation Systems and methods for tracking a model
TWI434227B (zh) * 2009-12-29 2014-04-11 Ind Tech Res Inst 動畫產生系統及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1395231A (zh) * 2001-07-04 2003-02-05 松下电器产业株式会社 图像信号编码方法、图像信号编码设备和存储媒体
CN1764931A (zh) * 2003-02-11 2006-04-26 索尼电脑娱乐公司 实时运动捕捉的方法和设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019057164A1 (zh) * 2017-09-21 2019-03-28 腾讯科技(深圳)有限公司 虚拟交互场景中目标定位方法及装置
US10905955B2 (en) 2017-09-21 2021-02-02 Tencent Technology (Shenzhen) Company Limited Target positioning method and apparatus in virtual interactive scene
CN109460077A (zh) * 2018-11-19 2019-03-12 深圳博为教育科技有限公司 一种自动跟踪方法、自动跟踪设备及自动跟踪系统

Also Published As

Publication number Publication date
US20120134575A1 (en) 2012-05-31
US20100303290A1 (en) 2010-12-02
US8320619B2 (en) 2012-11-27
WO2010138431A3 (en) 2011-03-03
US8351652B2 (en) 2013-01-08
US20130100129A1 (en) 2013-04-25
WO2010138431A2 (en) 2010-12-02
CN102448562B (zh) 2013-05-29
US8660310B2 (en) 2014-02-25

Similar Documents

Publication Publication Date Title
CN102448562B (zh) 用于跟踪模型的系统和方法
CN102665838B (zh) 用于确定和跟踪目标的肢端的方法和系统
CN102301398B (zh) 用于捕捉场景的深度信息的设备、方法和系统
CN102413885B (zh) 用于对运动捕捉应用模型跟踪的系统和方法
CN102135798B (zh) 仿生学运动
CN102448564B (zh) 环境和/或目标分割
CN102549619B (zh) 人类跟踪系统
CN102596340B (zh) 用于将动画或运动应用到角色的系统和方法
CN102448565B (zh) 将骨架数据实时重新定标到游戏化身的系统和方法
CN102741885B (zh) 装饰显示环境
CN102448563B (zh) 用于处理场景的深度信息的方法和设备
CN102576463B (zh) 用于移除图像的背景的系统和方法
CN102576466A (zh) 用于跟踪模型的系统和方法
CN102129293B (zh) 在运动捕捉系统中跟踪用户组
CN102129709A (zh) 可视化深度
CN102681657A (zh) 交互式内容创建
CN102087738A (zh) 用于为目标跟踪处理图像的系统和方法
CN102184531A (zh) 深度图置信过滤
CN102622774A (zh) 起居室电影创建
CN102591456B (zh) 对身体和道具的检测

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150506

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150506

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.