Teddy

关于双目立体视觉的三大基本算法SAD、SSD、SGBM及发展现状的总结

对着背影说爱祢 提交于 2020-08-18 07:53:07
双目立体视觉一直是机器视觉研究领域的发展热点和难点,“ 热 ”是因为双目立体视觉有着及其广阔的应用前景,且随着光学、计算机科学等学科的不断发展,双目立体技术将不断进步直到应用到人类生活的方方面面。“ 难 ”则是因为收到摄像机、镜头等硬件设备及一些相关算法的限制,双目立体视觉的研究及如何更好的应用到生产实际中仍有待在座的各位去进行突破。 一.简介 双目立体视觉是机器视觉中的一个重要分支,自上世纪60年代中期开创以来,经过几十年的发展,如今在机器人视觉、航空测绘、军事应及医学成像、工业检测上应用极其广泛。双目立体视觉基于视差原理并利用成像设备从不同的位置获取被测物体的左右两幅图像,然后根据三角测量原理计算空间点在二维图像的位置偏差,最后再利用位置偏差进行三维重建来获取被测物体的三维几何信息(本文不对双目立体视觉的数学原理进行详细介绍)。 二.双目立体视觉的三大基本算法的原理及其代码实现(基于opencv) 双目立体视觉中常用的基于区域的局部匹配准则主要有图像序列中对应像素差的绝对值之和SAD(sum of absolute differences)、对应像素差的平方之和SSD(sum of squared differences)及半全局匹配算法SGM(semi—global matching)。 2.1 SAD (sum of absolute differences)的原理

Serverless 实战:用 20 行 Python 代码轻松搞定图像分类和预测

帅比萌擦擦* 提交于 2020-05-08 16:30:39
图像分类是人工智能领域的一个热门话题,通俗来讲,就是根据各自在图像信息中反映的不同特征,把不同类别的目标区分开。图像分类利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,代替人的视觉判读。 在实际生活中,我们也会遇到图像分类的应用场景,例如我们常用的通过拍照花朵来识别花朵信息,通过人脸匹对人物信息等。通常,图像识别或分类工具都是在客户端进行数据采集,在服务端进行运算获得结果。因此,一般都会有专门的 API 来实现图像识别,云厂商也会有偿提供类似的能力: 华为云图像标签 腾讯云图像分析 本文将尝试通过一个有趣的 Python 库,快速将图像分类的功能搭建在云函数上,并且和 API 网关结合,对外提供 API 功能,实现一个 Serverless 架构的 " 图像分类 API"。 入门 ImageAI 首先,我们需要一个依赖库: ImageAI 。 什么是 ImageAI 呢?其官方文档是这样描述的: ImageAI 是一个 python 库,旨在使开发人员能够使用简单的几行代码构建具有包含深度学习和计算机视觉功能的应用程序和系统。 ImageAI 本着简洁的原则,支持最先进的机器学习算法,用于图像预测、自定义图像预测、物体检测、视频检测、视频对象跟踪和图像预测训练。ImageAI 目前支持使用在 ImageNet-1000 数据集上训练的 4

生成ssh_key

旧巷老猫 提交于 2020-04-05 22:09:56
#生成包含mail的sshkey ssh-keygen -t rsa -C "your_email@example.com" #文件存放路径和文件名 Enter file in which to save the key (/Users/teddy/.ssh/id_rsa): /Users/teddy/.ssh/id_rsa_proj1 #不设置密码 Enter passphrase (empty for no passphrase): Enter same passphrase again: 密匙文件存放在 C:/Users/teddy/.ssh/ 下 来源: oschina 链接: https://my.oschina.net/teddyIH/blog/3216599

20 行代码:Serverless 架构下用 Python 轻松搞定图像分类

柔情痞子 提交于 2020-03-12 18:42:20
「图像分类」是人工智能领域的一个热门话题,我们在实际生活中甚至业务的生产环境里,也经常遇到图像分类相似的需求,如何能快速搭建一个图像分类或者内容识别的 API 呢? 我们考虑使用 Serverless Framework 将图像识别模块部署到腾讯云云函数 SCF 上。 这里我们会用到一个图像相关的库: ImageAI ,官方给了一个简单的 demo: from imageai.Prediction import ImagePrediction import os execution_path = os.getcwd() prediction = ImagePrediction() prediction.setModelTypeAsResNet() prediction.setModelPath(os.path.join(execution_path, "resnet50_weights_tf_dim_ordering_tf_kernels.h5")) prediction.loadModel() predictions, probabilities = prediction.predictImage(os.path.join(execution_path, "1.jpg"), result_count=5 ) for eachPrediction, eachProbability