创建CV数据集总共分几步?这款移动端APP帮你分分钟完成

二次信任 提交于 2020-10-15 01:28:36

  机器之心报道

  参与:陈萍、魔王

  

创建数据集涉及许多费时费力的工作,那么有没有办法能够轻松实现数据集创建呢?这款不久前上架 Google Play 的 APP,可以让你在移动端轻松创建计算机视觉数据集。

  数据集是进行模型训练的前提,它的质量直接影响到后续模型的准确率。

  目前我们可以在网络上搜索到大量制作好的数据集,那么如何快速制作属于自己的数据集呢?

  最近有一款简易小工具 Manthano 在 Google Play 上架了。这款 APP 支持在移动端直接操作,几分钟内即可创建自己的计算机视觉数据集,并支持在任何需要的地方做数据标注

  

  Manthano APP 界面及功能展示。

  如果你刚刚涉足计算机视觉领域,或者要做目标检测方面的研究,那么这款 APP 非常适合你创建属于自己的 CV 数据集。

  数据集的制作离不开三步:

  收集图像

  标注图像

  下载标注

  这三步看起来简单,实则工作量巨大。单就图像注释这一块就要耗费大量的人力、物力,因为训练模型需要的数据量可以从几百张到几十万张图片不等。

  因此,简单便捷的图像标注工具显得尤为重要。这款标注工具 Manthano 支持从手机或 Web 界面(app.manthano.ai)上传图像,进而创建数据集。

  

  Manthano 下载链接:https://play.google.com/store/apps/details?id=www.app.manthano.ai

  只需三步,创建属于自己的 CV 数据集

  那么,使用 Manthano 创建数据集的具体步骤是什么呢?

  Manthano 在博客中介绍了创建以下三个类别数据集的步骤:

  树莓派 3

  摄像头

  Arduino Uno 开发板

  收集图像

  首先是收集图像。为这三个类别的对象拍摄照片,并使照片中的背景、角度和位置略有不同。为每个类别大约拍摄 30 张照片,并上传至 Manthano app。

  

  在 Manthano App 中上传图像。

  标注图像

  接下来,就需要对图像进行标注了。

  尽量在对象周围绘制边界框。不要假设对象背后可能有什么,仅注释看到的内容。使用 Finger Offset 功能,以最大程度地避免手指影响边界框的绘制。

  

  图像标注过程。

  下载标注

  最后转到控制面板(app.manthano.ai),然后将图像和标注下载到桌面。

  

  至此,只需简单的三步,整个数据集即可制作完成。

  现在,你可以在机器学习模型中使用自己创建的数据集了。

  用户反馈

  这款 app 由 ManthanoAI 团队开发,该团队旨在为机器学习视场提供移动端标注工具和标注解决方案。

  Manthano 发布后在 reddit 上引发热议,相关帖子热度高达 700+。

  不过对于这款实用 APP,网友也提出了自己的建议,主要涉及以下几个方面:

  何时支持其他操作系统?

  目前 Manthano 只能在 Android 平台进行使用,网友希望后续能够上线 iOS 版本。

  

  增加功能

  也有人提出其他优化建议,例如增加「删除标签」功能。

  

  提高稳定性

  还有用户表示在自己的手机上使用 Manthano APP 时,会出现崩溃现象,无法执行图像标注。

  对此,开发者表示将尽量维护软件稳定性,并快速迭代新版本。

  

  从使用者的反馈来看,这款标注工具还是很实用的。读者不妨实际操作一下,切身体会在 Android 手机上分分钟创建数据集的快乐。

  https://medium.com/swlh/create-your-custom-bounding-box-dataset-by-using-mobile-annotation-58232cfaa7ca

  https://www.reddit.com/r/MachineLearning/comments/hu006c/we_have_created_a_mobile_annotation_tool_for/

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!