深度学习

【可以玩的】人脸检测 & 人脸关键点检测 & 人脸卡通化

孤者浪人 提交于 2021-01-13 06:47:54
人脸检测历险记 可能跟我一样,人脸检测是很多人学习图像处理的第一个自驱动型的任务,OpenCV刚上手没几天可能就想先跑一跑人脸检测,然后一个坑接着一个坑的往里跳。我个人对人脸检测的大概历程应该是下面这样的: 找一个直接能执行的 OpenCV 的人脸检测程序,直接执行看效果。虽然这貌似是最简单的一步,但是由于最初水平实在太低,所以这一步可能是耗时最长的。当时初学的时候还在用 C++ ,想要直接跑程序,首先你要先配置好环境!曾经因为环境问题尝试了不同版本 OpenCV 未果、重装 VS 未果、重装 Windows 系统仍未果...当年的环境配置简直是不堪回首,说多了都是泪。而且根据我的经验,不论是因为版本还是还是系统问题,在网上找一个直接拿来就能跑的代码实在是太难了... 按照千辛万苦跑起来的程序,自己敲一遍。明明感觉没啥差别,为啥就是跑不起来呢...所有的坑都会自己跳进去,所有的低级错误都会犯不止一遍。 尝试找数据或者标注数据,尝试自己训练一个人脸检测模型, OpenCV 提供了用来训练的 exe ,参数超多,一直感觉很难用...当时可谓是屡败屡战,屡战屡败。 找一个能直接执行的深度学习的人脸检测程序,直接执行看效果。(虽然这貌似是最简单的一步,但是由于最初水平实在太低,所以这一步可能是耗时最长的。当时初学的时候还在用 Caffe ,想要直接跑程序,首先你要先配置好环境! Caffe

同济版《线性代数》引发激烈争议!

百般思念 提交于 2021-01-13 05:52:32
来自:机器之心 你的线性代数,过了没? 不论是结构力学还是人脸识别,理工类型的科研,深究之后就会发现到处都是线性代数的身影。这样一门课程,要是在大一的时候学不好,可是会要命的。 在国内上过大学的理科同学应该都见过《线性代数》(同济版),就算没有学过,也是听过它的大名。作为一名过来人,只能说,晦涩难懂,章节混杂... 即使不少 985、211 走过高考独木桥的学生,每到期末考试,也要默默祈祷不要挂科。现在想起一些内容:相似矩阵、线性变换、特征值、特征向量…… 真是一个头两个大。 作为一本大学教材,让学习者如此后怕,是该考虑一下教材问题了。如今已经毕业多年,没想到最近在知乎上看到一篇文章《《线性代数》(同济版)——教科书中的耻辱柱》,点赞量快突破五千。对于这篇文章,大家有时间可以读一下,看看是不是同意作者的观点。 线性代数真的很重要,这是很多工程技术人员走上工作岗位的最大感受。好多算法都用到线性代数的知识,就比如现在非常热门的深度学习,它的底层实现方式用到好多线性代数方面的知识。如果底层基础打不好,不明白其中的原理,算法实现方式真的很难理解,更不可能去创新了。好的教材才能起到事半功倍的效果。 目前这本教材已更新了好几版,每次更新的内容看起来也是无关紧要,如果有下次版本更新,还是希望制定教材的老师们听取一下广大学生的建议。 同济版《线性代数》何以引发众怒? 一直以来,同济版《线性代数

AI火爆干货最全整理!五套深度学习和算法学习教程和三套Python学习视频!!!限时无套路免费领取!

北城以北 提交于 2021-01-13 00:44:02
点击蓝色“ AI专栏 ”关注我 哟 选择“ 星标 ”,重磅干货,第一时间送达 这是站长第 31 期免费送丰富宝贵的干货资源与教程 本期绝对是 满满的干货 ! 获取更多资源请关注 【AI专栏】 先上车pa 01 PART 五套深度学习算法教程! 作为AI 初学者来说,最大的问题就是: 资料太多!!!看不完!!! 不知道如何取舍!!!人的精力有限!!! 因此,本次站长就为各位站友把 高效有用 的入门和进阶学习材料整理好了, 并限时无套路免费送给各位站友!!! AI学习不仅仅在于模型掌握了多少,更多的在于你的算法分析和设计能力、工程实践能力、算法模型的优化能力。 5本享誉全球的AI好书和项目 免费 送给大家 !!! 机器学习基础 《机器学习基础》来了, 一书吃透机器学习! 先总体来看,这本书分为17个章节: 从每一个章节的设置可以看出这份教材设置的非常细致,将机器学习中的基础概念拆分开来讲,想深入了解吃透深度学习的基础,按这个目录来学也是个不错的选择。 【AI专栏】 只做 干货!!! 在这里没有任何套路!你只需要 长按下方二维码 回复【 2020 】 加站长微信即可立即获取 五套深度学习和算法学习教程和三套Python学习视频!!! 现在关注他,还有机会添加他的个人微信号,进行一对一的交流,坑位有限(微信号有 5000 人的限制),大家抓紧吧! PyTorch官方教程中文版

使用Python+OpenCV+dlib为人脸生成口罩

送分小仙女□ 提交于 2021-01-12 13:05:08
来源:深度学习与计算机视觉 本文约4800字,建议阅读6分钟本文试图用OpenCV和dlib库来实现这个过程,在这里我们综合生成5种类型的口罩来绘制人脸图像。 本文使用OpenCV dlib库生成口罩 口罩已经被证明是防止COVID-19传播的最好的防御措施之一,然而,这也导致了基于面部特征(包括鼻子、嘴和下巴线)的面部识别算法的失效。 在全球有传染病之前,面部识别系统通过对检测到的不同面部特征进行比较测量来验证两幅图像中的人脸。当一个人的鼻子、嘴和脸颊上戴上口罩,大大减少了通常用来识别他/她的身份的信息。 将需要重新训练或重新设计有效的识别系统,以识别受管制地区的口罩脸。为了做到这一点,需要一个大的口罩数据集来训练深度学习模型,以检测戴口罩的人和不戴口罩的人。 目前,可用于训练和评估人脸识别系统的图像数据集是有限的。据报道,美国国家标准与技术研究所(NIST)的研究通过将口罩(各种颜色、大小和位置)叠加在没有带口罩人脸的图像上来解决这个问题。 https://www.cnet.com/news/face-masks-are-thwarting-even-the-best-facial-recognition-algorithms-study-finds/?ftag=COS-05-10aaa0b&TheTime=2020-07-27T22%3A23%3A21&PostType

今天的卷积网络,Yann LeCun在93年就已经玩得很溜了

牧云@^-^@ 提交于 2021-01-12 09:58:27
2卷积神经网络的成功是否超出了其发明者的想象?Yann LeCun 说:「是的,我们一直在尝试更加疯狂的写法,而它的进步却从未中断过。」 机器之心报道,作者:泽南、张倩。 手写数字识别是很多人入门神经网络时用来练手的一个项目,但就是这么简单的一个项目,最近在 reddit 上又火了一把,因为在 MIT 计算机科学和人工智能实验室,有人挖到了一个「祖师爷」级别的视频…… https://v.qq.com/x/page/p32191o2g0v.html ​ v.qq.com 这段视频录制于 1993 年,主人公是图灵奖得主 Yann LeCun(杨立昆)。彼时 LeCun 才 32 岁,刚刚进入贝尔实验室工作,而视频里机器学习识别的第一段数字 201-949-4038,是 LeCun 在贝尔实验室里的电话号码。 从这段视频中我们可以看到,LeCun 在 90 年代初创造的文本识别系统已经达到了惊人的速度和准确率,这在当时的条件下是非常难能可贵的。 这段视频由贝尔实验室自适应系统研究部门主任 Larry Jackel 拍摄(Larry 当时是 LeCun 的 boss,现任英伟达自动驾驶顾问)。视频中出镜的还有实验室负责人 Rich Howard(Larry 的 boss)和研究工程师 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson

面经 | 面试题目记录(美团)

*爱你&永不变心* 提交于 2021-01-12 09:10:23
以下内容带有部分提示性答案 无论是查找博客还是翻阅论文 大家还是要参照最全面的讲解哦~ 一、开发基础 TCP/IP C++虚函数 由两个部分组成的,虚函数指针与虚函数表 C++允许用户使用虚函数 (virtual function) 来完成“运行时决议 ” 这一操作,这与一般的“编译时决定 ” 有着本质的区别 “静态存储”和“动态存储” 静态存储:全局变量 动态存储:函数的形式参数 红黑树的原理 并发和并行的区别 https://www.jianshu.com/p/cbf9588b2afb 内存不够的情况下如何以最快速度进行排序 (海量数据类问题) 二、机器学习方向 讲一下LR (sigmoid) SVM介绍一下?为什么可以使用对偶来求解原始问题? 核函数了解吗?核函数解决什么问题? 为什么高斯核函数可以拟合无限维 (无穷泰勒展开) ID3缺点 (信息增益对可取值数目较多的属性有所偏好) 朴素贝叶斯公式 抽象一个分类问题[m个样本,n个特征,k种标签],问先验概率后验概率分别是什么 使用贝叶斯的前提条件 (贝叶斯公式没有前提条件) 使用朴素贝叶斯的前提条件 (所有特征相互独立的) GDBT和RF区别 三、深度学习方向 介绍熟悉的深度学习模型,并介绍优缺点 模型中方差,偏差怎么定义的 偏差,方差和过拟合,欠拟合的关系 怎么解决模型的方差偏大问题 降低模型的复杂度 减少数据维度:降噪

2013—2019,李彦宏的AI启示录

我的未来我决定 提交于 2021-01-12 08:44:25
从移动互联网转型,到O2O战略无功而返,再到加速AI商业化,百度将近10年的转型到底暗藏着什么样的逻辑? 文| Alter 事实证明,李彦宏是个称职的人工智能布道师。 2019年3月4号,全国“两会”正式拉开帷幕,第七次参加两会的李彦宏提交了三个提案,几乎全部和AI相关。同时还在媒体采访中谈及人工智能行业存在的问题和挑战、百度的人工智能商业化进展,以及数据孤岛、车路协同、AI伦理等焦点话题。 把范围再扩大一些,不管是百度自家的百度世界大会、AI开发者大会,还是乌镇互联网大会、IT领袖峰会等公开场合,李彦宏的发言也大多和AI相关,并贡献了“人工智能是互联网下一幕”、“互联网只是人工智能的开胃菜”等旗帜鲜明的观点。 可如果回到2012年去采访李彦宏,听到的答案很可能是:“搜索是百度成功的所有秘密”。那时候BAT还站在同一起跑线上,百度长于技术,阿里精于运营,腾讯依赖产品,移动互联网转型还只是个理念,远没有到谈论互联网下半场的时候。 李彦宏的“两会”提案史,也是百度的转型史,从一家搜索巨头到人工智能企业,李彦宏本身也从中文搜索引擎的奠基人,转身成为人工智能布道者。为何会出现这样的蜕变,可以猜到的答案有很多,但李彦宏七年提案的内容,可能是揭开谜底的新视角。 当然,一切都要从百度的转型说起。 第一阶段:2010—2014年,寻求转型的百度 2010年6月8日凌晨1点,乔布斯在Moscone

被吹的神乎其神的Python都能干什么

送分小仙女□ 提交于 2021-01-12 06:54:43
文末领取免费学习福利 1. 前言 最近几年 Python 被吹的神乎其神,很多同学都不清楚 Python 到底能干什么就盲目去学习 Python,今天小胖哥就 Python 的应用领域来简单盘点一下,让想学习 Python 的同学找对方向。 2. Python 的特点 这里就谈谈自己的看法,首先 Python 是跨平台语言,语法很简洁,很短的代码干更多的事。另外它是脚本语言,随时随地写一段脚本就可以处理数据,十分方便。同时它也是面向对象语言,对初学者十分友好。Python 在处理各个领域的类库也十分丰富,爬虫、机器学习、数据处理、图像处理等等满足了大部分领域的需要。更重要的是 Python 是一种“胶水语言”,可以轻松调用主流的 C、C++、Java 类库。但是这就是 Python 被 “吹”起来的原因吗?当然不是!如果一门语言没有实际用武之地,即使它再优秀也没有意义,也不可能优秀。 3. Python 的使用领域 接下来我们就来看看 Python 在哪些领域有实际的运用。 3.1 数据爬虫 当今互联网数据成为任何一家公司最核心的资产,但是互联网的信息非常海量,未来快速获取有用的公开信息,爬虫就派上了用场。而 Python 语言非常善于编写爬虫,通过 requests 库抓取网页数据,使用 BeautifulSoup 解析网页并清晰和组织数据就可以快速精准获取数据

JSIS3D:具有多任务点向网络和多值条件随机场的3D点云联合语义-实例分割

无人久伴 提交于 2021-01-12 04:22:29
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 标题: JSIS3D: Joint Semantic-Instance Segmentation of 3D Point Clouds with Multi-Task Pointwise Networks and Multi-Value Conditional Random Fields (Oral) 作者:Quang-Hieu Pham, Duc Thanh Nguyen, Binh-Son Hua, Gemma Roig, Sai-Kit Yeung 来源:CVPR2019 编译:于振洋 审核:王志勇 摘要 深度学习技术已成为2D图像上大多数与视觉相关的任务的通用模型,然而它的力量尚未在3D空间的任务中得到充分体现,例如3D场景理解。在这项工作中,作者将3D点云的语义和实例分割问题结合起来进行同时处理。 具体来说,作者开发了同时执行的多任务逐点网络两项任务:预测3D点的语义类别,以及将点嵌入到高维向量中同一对象实例的点由相似的嵌入表示。然后,作者提出一个多值条件随机字段模型,用于合并语义和实例标签,并在共同优化标签时制定语义和实例分割问题模型。对提出的方法进行了全面评估和与不同室内场景下现有方法的比较数据集,包括S3DIS和SceneNN。实验结果表明,提出的联合语义-实例分割方案在其单个组件上具有鲁棒性

清华大学发布首个自动图机器学习工具包AutoGL,开源易用可扩展,支持自定义模型

时间秒杀一切 提交于 2021-01-12 02:27:50
机器之心报道 机器之心编辑部 如何应用自动机器学习 (AutoML) 加速图机器学习任务的处理?清华大学发布全球首个开源自动图学习工具包:AutoGL (Auto Graph Learning),支持在图数据上全自动进行机器学习。 人工智能的蓬勃发展离不开数据、算力、算法这三大要素。而在浩瀚的数据中,有一种数据结构既普遍又复杂,它就是图(graph)。 图是一种用于描述事物之间关系的结构,其基本构成元素为节点和连接节点的边。 很多不同领域的研究问题都可以很自然地建模成图机器学习,例如蛋白质建模、物理系统模拟、组合优化等基础研究;社交媒体分析、推荐系统、虚假新闻检测等互联网应用;以及金融风控、知识表征、交通流量预测、新药发现等。 社交网络图示例。 图结构丰富且具有与生俱来的导向能力,因此非常适合机器学习模型。同时,它又无比复杂,难以进行大规模扩展应用。而且不同的图数据在结构、内容和任务上千差万别,所需要的图机器学习模型也可能相差甚远,这就导致不同任务的模型自动化面临巨大挑战。 如何设计最优的图自动机器学习模型 ,是一个尚未解决的难题。 图 + AutoML = ? 自动机器学习 (AutoML) 旨在将机器学习的过程自动化,在降低机器学习使用门槛的同时,提升机器学习的效果。但现有的自动机器学习工具,无法考虑图数据的特殊性,因此无法应用在图机器学习模型中。 为了解决该问题