计算机视觉

Datawhale 计算机视觉基础-图像处理(下)- Task01 Harris特征点检测器-兴趣点检测

六月ゝ 毕业季﹏ 提交于 2020-08-10 18:11:10
Datawhale 计算机视觉基础-图像处理(下)- Task01 Harris特征点检测器-兴趣点检测 1. 基础知识 1.1角点的介绍 2.Harris角点检测算法原理 2.1 算法核心思想 2.2 算法原理 3.OpenCV实现 3.1 API 3.2 代码示例 参考链接 1. 基础知识 1.1角点的介绍 在图像处理领域中,特征点又被称为兴趣点或者角点,它通常具有旋转不变性和光照不变性和视角不变性等优点,是图像的重要特征之一,常被应用到目标匹配、目标跟踪、三维重建等应用中。 点特征主要指图像中的明显点,如突出的角点、边缘端点、极值点等等,用于点特征提取的算子称为兴趣点提取(检测)算子,常用的有Harris角点检测、FAST特征检测、SIFT特征检测及SURF特征检测。 那么如何进行判断呢? 可以使用滑动窗口在图像中滑动: (1)如果沿着各个方向移动,窗口内像素值均没有太大变化,则它是平坦区域。 (2)如果沿着水平方向移动(梯度方向),像素值会发生跳变;沿着边缘移动(平行于边缘) ,像素值不会发生变化;则它表示一个边缘特征(Edges)。 (3)如果无论朝哪个方向移动,像素值都会发生很大变化,则它就是一个角。 下图中由左到右分别代表上述三种情况: 同时,角点也有多种类型,如下图所示: 2.Harris角点检测算法原理 2.1 算法核心思想

这些opencv的书籍和网站里,肯定有你不知道的宝藏

人走茶凉 提交于 2020-08-10 16:45:13
跟大家分享一些opencv的书籍和网站。 都是我从入门到现今四处收集到的,曾经因为命令行操作不当把磁盘给清空了,但幸好电子书都找回来了,然后我就都上传到网盘存起来了。 今天拿来分享给大家,有了这些根本不需要去买任何实体书了(除非特别喜欢看实体书哈)。 书籍 先给大家贴个图: 大部分是我到处搜集来的,还有一些是花钱在某鱼上买来的,今天把下载链接分享给大家(链接七天有效,如果失效了可以公众号【opencv视觉实践】后台回复【视觉电子书】获取) 链接:https://pan.baidu.com/s/12RVddWedpFukuVNU1WQCmQ 提取码:0tnv 复制这段内容后打开百度网盘手机App,操作更方便哦 1:《Opencv3编程入门-毛星云》 这本书是我的入门书籍,但也仅限于入门,大家看完一遍后一定要入手其他书籍或者做一些实战项目进行练手,否则只能在入门水平徘徊。 2:《学习opencv3》 这本书作者就是opencv库的开发者,此书比较厚但也更全面,适合看完《Opencv3编程入门-毛星云》进一步补充和进阶。 3:《OpenCV计算机视觉编程攻略.第3版》 这本书真的是宝藏书籍,包含很多实战案例,第三版是目前最新版本了。 4:《OpenCV-python中文官方文档410》 这本书是翻译的英文版opencv-python的官方教程,嗯,官方的,不多介绍了。 5:《OpenCV

除了PS,原来这个也可以轻松实现图像处理!

为君一笑 提交于 2020-08-10 10:15:35
全世界只有 3.14 % 的人关注了 爆炸吧知识 在我们生活中,常见的图像处理软件有Adobe Photoshop、Adobe Illustrator等。 然而,并非只有软件才能实现图像处理,通过编程手段也是能实现的 ! 今天,小天将要带着大家走进计算机视觉,了解如何通过编程手段实现图像处理! 所谓计算机视觉,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。 在近些年发展普及的“人脸识别”和“无人驾驶”,其实都属于计算机视觉的范畴, 图像处理是一门借助计算机对图像进行分析从而获得所需结果的技术,一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。 而 OpenCV是计算机视觉应用中使用最广泛的库之一。 OpenCV 是英特尔开源的跨平台计算机视觉库。 也就是说,它是一套包含从图像预处理到预训练模型调用等大量视觉 API 的库,并可以处理图像识别、目标检测、图像分割和行人再识别等主流视觉任务。 而OpenCV-Python是OpenCV的python API。OpenCV-Python不仅速度快,也易于编码和部署(由于前端的Python包装器)。 这使其成为执行计算密集型计算机视觉程序的绝佳选择。 OpenCV( 开源计算机视觉库,Open Source Computer Vision

三年前打败了柯洁的人工智能,真的改变这个世界了吗?

空扰寡人 提交于 2020-08-10 09:52:16
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 编者按:本文来自微信公众号“资本侦探”(ID:deep_insights),作者:李婷婷,36氪经授权发布。 核 心 要 点 近几年人工智能风口再起,实际上是技术发展、数据沉淀以及场景延展等多个因素,厚积薄发的结果。 人工智能商业化变现困难的根本原因,仍是底层研究的制约下难以规模化落地的现实。 新基建的加持,对于人工智能底层研究的投入、应用场景的拓展等将大有裨益。 能让马云、马化腾、李彦宏等业界大佬共同看好的方向,除了人工智能,可能很难找到第二个。 在7月9日举行的2020世界人工智能大会云端峰会上,“三马”(马云、马化腾、马斯克)、“二宏”(李彦宏、张文宏)少见地隔空同台。此外,还有包括七位图灵奖得主、一位诺贝尔奖得主在内的550多位业界、学术界嘉宾汇聚一堂。 大会上,以联合国数字合作高级别小组联合主席的身份出席的马云,就疫情期间社会经历的大动荡发表了自己的感悟,他认为,世界已经巨变,技术变革提前并且加速,与其担忧,不如担当,“为活下去而做的创新才是真正最强大和不可阻挡的动力”。 马云有此感叹,一定程度上是因为在疫情危机中,依赖人力、线下运转的传统行业遭受极大冲击,以人工智能为代表的新兴科技彰显出其重要性与必须性。例如,复旦大学附属华山医院感染科主任张文宏提到,

引用量比肩ImageNet的数据集下线!给黑人标N*gger,MIT道歉

混江龙づ霸主 提交于 2020-08-10 09:43:34
      大数据文摘出品    作者:刘俊寰、牛婉杨   抵制种族歧视最紧张的关头, MIT 忽然被牵扯了进去。   在一篇名为《LARGE IMAGE DATASETS: A PYRRHIC WIN FOR COMPUTER VISION?》的论文中,研究者发现,MIT正在使用的一个高引用 图片数据集Tiny Images存在强烈种族歧视和厌女症标签 。   这个数据库内,当黑人或猴子出现时,标签显示为N*gger这一对黑人的蔑称词汇;此外,身穿比基尼或抱着孩子的妇女的图片被标记为b*tch等这一侮辱性词汇。      这一曝光引发了学术圈的激烈争议。得知消息后,麻省理工学院 迅速下线了这一数据集 ,并发布公告称,由该数据集训练出的AI系统,会潜在地使用种族主义、厌女症和其他激进术语来描述对象, 请所有研究员暂停使用和训练 。   比如,利用Tiny Images训练的机器学习模型,能够自动识别并列出静止图像中的人和物体,当用户输入公园照片,系统会标注出照片中的儿童、成人、宠物、野餐点、花草和树木。但同时,由于在组合训练集时采用的方法,系统也可能将女性标记为妓女,黑人和亚裔的标记也多带有贬义色彩的词语。   使用该数据集训练出的神经网络的 应用程序、网站和其他产品 ,都很有可能在最终分析照片和视频时出现带有歧视性的术语。   下线该数据库后,MIT还表示,将

第二次作业:卷积神经网络 part 2

こ雲淡風輕ζ 提交于 2020-08-10 09:25:36
第二次作业:卷积神经网络 part 2 【第一部分】 问题总结 在编写网络的时候,bn层是否可以无脑添加?什么时候添加bn层比较好? conv层的padding,stride怎么计算?什么时候stride=1什么时候=2 有些混乱。。 数据处理时 transforms.Normalize((0.1307,), (0.3081,) 为什么要这样正交化?这两个数是怎么算出来的? 在之前第二周的作业part1有一个ResNet的代码实现,课程里老师有提到下采样,但没有详细讲解,只说了“stride=1就不下采样,stride=2已经下采样了。“ 这句话我并不是很理解。 shortcut 具体在哪些地方可以使用?我理解的Resnet的f(x) + x = y 是 shortcut是否正确? 对于计算机视觉专业,有哪些经典的深度学习的项目作为入门练手比较好? 【第二部分】 代码练习 具体的论文学习在往期作业中,以下仅为代码实现 MobileNet V1 链接 MobileNet V2 链接 HybridSN 高光谱分类 链接 【第三部分】 论文学习 《Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising》 链接 《Squeeze-and-Excitation Networks》 链接

ECCV 2020 | 基于对抗一致性,非匹配图像转换效果真假难辨

拜拜、爱过 提交于 2020-08-10 04:21:01
      本 文介绍的 是ECCV 2020 论 文《Unpaired Image-to-Image Translation using Adversarial Consistency Loss》,论文作者来自北大。本论文解读首发于知乎(https://zhuanlan.zhihu.com/p/156092551)。   作者 | Hyperplane PKU   编辑 | 丛 末       论文地址: https://arxiv.org/abs/2003.04858    1    问题引入   在图像处理、图形学和计算机视觉中有大量问题是将一个图片域的图片转换到另一个图片域,比如前一阵刷屏朋友圈的换脸应用。这种问题可以统称为图像到图像转换(image-to-image translation)[1]。目前基于深度学习,特别是生成对抗网络(generative adversarial networks, GANs)[2] 的方法在图像到图像转换中取得了很大的进步。   然而,目前的主流方法有若干局限性,导致不能支持很多应用。其中最大的一个局限性是目前的主流方法基于循环一致性损失(cycle consistency loss,以下简称cycle loss)[2]。Cycle loss 缺陷的主要原因在于其要求转换回来的图片要和原图完全一致(图2右侧 , )

做目标检测,这6篇就够了:CVPR 2020目标检测论文盘点

走远了吗. 提交于 2020-08-10 02:20:51
   CVPR 2020 会议上,有哪些目标检测论文值得关注?   目标检测是计算机视觉中的经典问题之一。凭借大量可用数据、更快的 GPU 和更好的算法,现在我们可以轻松训练计算机以高精度检测出图像中的多个对象。   前不久结束的 CVPR 2020 会议在推动目标检测领域发展方面做出了一些贡献,本文就为大家推荐其中 6 篇有价值的目标检测论文。       论文清单   A Hierarchical Graph Network for 3D Object Detection on Point Clouds   HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection   Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud   Camouflaged Object Detection   Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector   D2Det: Towards High-Quality Object Detection and Instance Segmentation    1. A Hierarchical

NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing....

痴心易碎 提交于 2020-08-09 23:30:28
from: https://blog.csdn.net/sinat_26917383/article/details/54908389 一、NLP标注工具 来源: 《构想:中文文本标注工具(附开源文本标注工具列表)》 Chinese-Annotator 来源: https://github.com/crownpku/Chinese-Annotator 能不能构建一个中文文本的标注工具,可以达到以下两个特点: 标注过程背后含有智能算法,将人工重复劳动降到最低; 标注界面显而易见地友好,让标注操作尽可能简便和符合直觉。 答案是可以的。事实上很多标注工具已经做到了这一点,最先进的如Explosion.ai的Prodigy;然而开发了著名的NLP开源包Spacy的explosion.ai选择了将Prodigy闭源,而Spacy支持中文也仍然遥遥无期。我们希望构建一个开源的中文文本标注工具,而本文很多的技术灵感正是来自Prodigy文档。 流程: 用户标一个label 主动学习的后台算法分为online和offline部分。online部分即时更新模型,可使用诸如SVM、bag of words等尽可能快的传统方法;offline部分当标注数据积累到一定数量时更新模型,可使用准确度较高的深度学习模型。 模型更新后,对尽可能多的example做预测,将确信度排序

推荐几个(抖音/阿里/腾讯)年薪100W大佬的硬核公众号

﹥>﹥吖頭↗ 提交于 2020-08-09 23:22:53
学习如逆水行舟,不进则退; 只有坚持不断的学习,才能保持进步。 今天给大家精心挑选的这几个优质的公众号,感兴趣的可以关注。 深度学习算法和计算机视觉 ▲▲▲ 深度学习算法与计算机视觉是国内少数聚焦于计算机视觉方向的公众号。分享深度学习、计算机视觉、图像处理、机器学习、Python、人工智能等相关领域的前沿、干货笔记,立志成为全国最具影响力的计算机视觉分享平台。强烈推荐大家关注! GitHubDaily ▲▲▲ 专注于分享与计算机科学相关的学习资源、 开发工具、 技术资讯等内容。从 2015 年创建至今,获得了 IT 圈内多位知名大佬的关注,其中包括 CSDN 创始人蒋涛、天使投资人李笑来、白帽子黑客余弦,累积分享数千个优质开源项目。每次我都能从 GitHubDaily 这里获取第一手技术资讯、最热门的开源项目、以及丰富的免费编程资源。如果你也玩 GitHub,那你绝对不能错过这个公众号!关注后,后台回复「1024」可获取数百个优质项目的汇总资源。 Java之道 ▲▲▲ 有道无术,术可成; 有术无道,止于道; Java之道公众号致力于为广大Javaer传道授业解惑。 以术识道,以道御术。 本公众号主要分享Java相关的原理知识。 欢迎大家关注。 菜鸟要飞 ▲▲▲ 菜鸟要飞,专注于为程序员过滤、筛选、分享优质的技术资源。这里有学习路线、面试宝典、源码专题、技术精选、开源项目及开发工具