Kinect学习（五）：提取带用户ID的深度数据

在前面的一篇文章中讨论了如何从Kinect获取深度图：Kinect学习（四）：提取深度数据。
这里要对其进行拓展，Kinect可以获取两种格式的深度图：

不带用户ID的深度数据，也是存储在16位的变量中，但是只使用了前12位，用来表示深度。
带用户ID的深度数据，16位，前3位表示用户ID，最多可以识别6个人，后13位表示深度；

在前一篇文章（Kinect学习（四）：提取深度数据）中是使用的就是前者，这里要使用后者。通过带用户ID的深度数据，我们可以很轻易地得到用户在图像中的位置与深度信息，利于后续的抠图等等的操作。

惯例，先上代码。

#include <Windows.h> #include <iostream> #include <NuiApi.h> #include <opencv2/opencv.hpp>  using namespace std; using namespace cv;  typedef struct structBGR {     BYTE blue;     BYTE green;     BYTE red; } BGR;  // 处理深度数据的每一个像素，如果属于同一个用户的ID，那么像素就标为同种颜色，不同的用户，   // 其ID不一样，颜色的标示也不一样，如果不属于某个用户的像素，那么就采用原来的深度值 BGR Depth2RGB(USHORT depthID) {     //每像素共16bit的信息，其中最低3位是ID（所捕捉到的人的ID），剩下的13位才是信息      USHORT realDepth = (depthID & 0xfff8) >> 3; //深度信息，高13位     USHORT player = depthID & 0x0007;   //提取用户ID信息，低3位      //因为提取的信息是距离信息，为了便于显示，这里归一化为0-255     BYTE depth = (BYTE)(255 * realDepth / 0x1fff);      BGR color_data;     color_data.blue = color_data.green = color_data.red = 0;      //RGB三个通道的值都是相等的话，就是灰度的       //Kinect系统能够处理辨识传感器前多至6个人物的信息，但同一时刻最多只有2个玩家可被追踪（即骨骼跟踪）     switch (player)     {     case 0:         color_data.blue = depth / 2;         color_data.green = depth / 2;         color_data.red = depth / 2;         break;     case 1:         color_data.red = depth;         break;     case 2:         color_data.green = depth;         break;     case 3:         color_data.blue = depth;         break;     case 4:         color_data.blue = depth;         color_data.green = depth;         color_data.red = depth / 4;         break;     case 5:         color_data.blue = depth;         color_data.green = depth / 4;         color_data.red = depth;         break;     case 6:         color_data.blue = depth / 4;         color_data.green = depth;         color_data.red = depth;         break;     }      return color_data; }   int main(int argc, char * argv[]) {     cv::Mat img;     img.create(240, 320, CV_8UC3);      // 1、初始化NUI     HRESULT hr = NuiInitialize(NUI_INITIALIZE_FLAG_USES_DEPTH_AND_PLAYER_INDEX);     if (FAILED(hr))     {         cout << "NuiIntialize failed" << endl;         return hr;     }      // 2、定义事件句柄        // 创建读取下一帧的信号事件句柄，控制KINECT是否可以开始读取下一帧数据       HANDLE nextDepthFrameEvent = CreateEvent(NULL, TRUE, FALSE, NULL);     HANDLE depthStreamHandle = NULL;    // 保存图像数据流的句柄，用以提取数据       // 3、打开Kinect设备的深度图数据通道，使用depthStreamHandle保存该数据流的句柄，以便于后续读取     hr = NuiImageStreamOpen(NUI_IMAGE_TYPE_DEPTH_AND_PLAYER_INDEX, NUI_IMAGE_RESOLUTION_320x240, 0, 2, nextDepthFrameEvent, &depthStreamHandle);     if (FAILED(hr))     {         cout << "Could not open color image stream video" << endl;         NuiShutdown();         return hr;     }     cv::namedWindow("depthImage", CV_WINDOW_AUTOSIZE);      // 4、开始读取深度数据     while (1)     {         const NUI_IMAGE_FRAME * pImageFrame = NULL;          // 4.1、无限等待新的数据，等到后就返回         if (WaitForSingleObject(nextDepthFrameEvent, INFINITE) == 0)         {             // 4.2、从刚才打开数据流的流句柄中得到该帧的数据，读取到的数据地址存在pImageFrame             hr = NuiImageStreamGetNextFrame(depthStreamHandle, 0, &pImageFrame);             if (FAILED(hr))             {                 cout << "Could not get depth image" << endl;                 NuiShutdown();                 return hr;             }              INuiFrameTexture * pTexture = pImageFrame->pFrameTexture;             NUI_LOCKED_RECT LockedRect;              // 4.3、提取数据帧到LockedRect，它包括了两个数据对象：pitch每行字节数，pBits第一个字节地址             //并锁定数据，这样当我们读数据的时候，kinect就不会去修改它              pTexture->LockRect(0, &LockedRect, NULL, 0);             // 4.4、确认得到的数据是否有效             if (LockedRect.Pitch != 0)             {                 //4.5、将数据转换为OpenCV的Mat格式                  for (int i = 0;i < img.rows;i++)                 {                     uchar * ptr = img.ptr<uchar>(i);                      //深度图像数据含有两种格式，这里像素的低12位表示一个深度值，高4位未使用；                     //这里是第二种：既表示深度值又含有人物序号，则像素值的高13位保存了深度值，低三位保存用户序号，                     //注意这里需要转换，因为每个数据是2个字节，存储的同上面的颜色信息不一样，                     uchar *pBufferRun = (uchar*)(LockedRect.pBits) + i * LockedRect.Pitch;                     USHORT * pBuffer = (USHORT*)pBufferRun;                      for (int j = 0;j < img.cols;j++)                     {                         // ptr[j] = 255 - (uchar)(255 * pBuffer[j] / 0x0fff);   //直接将数据归一化处理                         // ptr[j] = (uchar)(255 * pBuffer[j] / 0x0fff); //直接将数据归一化处理                          BGR rgb = Depth2RGB(pBuffer[j]);                         ptr[3 * j] = rgb.blue;                         ptr[3 * j + 1] = rgb.green;                         ptr[3 * j + 2] = rgb.red;                     }                 }                  cv::imshow("depthImage", img);             }             else             {                 cout << "Buffer length of received texture is bogus\r\n" << endl;             }              // 5、这帧已经处理完了，将其解锁，更新下一帧数据             pTexture->UnlockRect(0);             // 6、释放这一阵数据，准备接受下一帧             NuiImageStreamReleaseFrame(depthStreamHandle, pImageFrame);         }          if (cv::waitKey(20) == 27)         {             break;         }     }      // 7、关闭NUI连接     NuiShutdown();       return 0; } }

代码的套路大体上与Kinect学习（四）：提取深度数据总是一样的，只有少部分不同。一样的地方不做赘述了，请自行查阅代码。

NUI初始化的参数要改为：NUI_INITIALIZE_FLAG_USES_DEPTH_AND_PLAYER_INDEX；
打开深度图数据流时的图像类型改为：NUI_IMAGE_TYPE_DEPTH_AND_PLAYER_INDEX；

由于这里的深度数据格式与之前不同，所以另外定义了一个函数来处理带用户ID的深度数据。
首先是自定义了一个结构体：

typedef struct structBGR {     BYTE blue;     BYTE green;     BYTE red; } BGR;

用来表示一个像素的RGB值。

然后，定义深度数据处理函数：

// 处理深度数据的每一个像素，如果属于同一个用户的ID，那么像素就标为同种颜色，不同的用户，   // 其ID不一样，颜色的标示也不一样，如果不属于某个用户的像素，那么就采用原来的深度值 BGR Depth2RGB(USHORT depthID) {     //每像素共16bit的信息，其中最低3位是ID（所捕捉到的人的ID），剩下的13位才是信息      USHORT realDepth = (depthID & 0xfff8) >> 3; //深度信息，高13位     USHORT player = depthID & 0x0007;   //提取用户ID信息，低3位      //因为提取的信息是距离信息，为了便于显示，这里归一化为0-255     BYTE depth = (BYTE)(255 * realDepth / 0x1fff);      BGR color_data;     color_data.blue = color_data.green = color_data.red = 0;      //RGB三个通道的值都是相等的话，就是灰度的       //Kinect系统能够处理辨识传感器前多至6个人物的信息，但同一时刻最多只有2个玩家可被追踪（即骨骼跟踪）     switch (player)     {     case 0:         color_data.blue = depth / 2;         color_data.green = depth / 2;         color_data.red = depth / 2;         break;     case 1:         color_data.red = depth;         break;     case 2:         color_data.green = depth;         break;     case 3:         color_data.blue = depth;         break;     case 4:         color_data.blue = depth;         color_data.green = depth;         color_data.red = depth / 4;         break;     case 5:         color_data.blue = depth;         color_data.green = depth / 4;         color_data.red = depth;         break;     case 6:         color_data.blue = depth / 4;         color_data.green = depth;         color_data.red = depth;         break;     }      return color_data; }

从低13位提取出深度数据，高3位提取出ID号。根据ID和深度的不同显示不同的颜色。

文章来源: Kinect学习（五）：提取带用户ID的深度数据

标签

kinect

depth

图像像素