机器学习

AI产品经理的入门必修课——案例篇(1)

筅森魡賤 提交于 2020-12-09 00:59:49
作者介绍 @毛毛 产品经理 集颜值和才华于一身。 对AI了解深入,经验丰富。 前面介绍了「AI产品经理需要具备的能力和对数据、算法需要理解的程度」、「机器学习的实际训练过程」,后面将围绕AI产品在当前环境下的热门应用来进行探讨,涵盖了语音识别、图像识别、NLP自然语言处理、知识图谱等产品化落地的场景。 1 人工智能与「人工」智能 人每天做的最多的事情就是看、听、说、思考、决策,这是人这个复杂系统需要具备的能力,那么如果要做像人一样的智能机器,最基础要解决的问题便是图像处理的能力、声音的处理能力、口语的处理能力、逻辑推理能力,具备了这些能力之后,人才能做更多的事情,同理机器也就能做更多的事情。 机器学习作为人工智能的实现手段之一,核心是用算法来解析数据、从数据中学习规律,再对现实世界中的事件做出决策和预测。由于强依赖数据,对于数据的处理和应用便显得极为重要。AI场景中需要面临大量的非结构化数据的处理,涉及了大量的人力工作在里面。在当前发展的阶段,我更愿意称它为「人工」智能。 2 如何构建AI产品 构建AI产品需要经历的几个核心阶段,简单概括为业务梳理阶段,准备数据阶段,设计产品研发方案阶段。 业务梳理 不同的行业有不同的行业背景,在设计产品方案之前需要了解自身所处行业的业务逻辑及面临的需求痛点,AI产品本质上解决的是效率问题,不管是提高信息生产的效率还是信息传递的效率

【AI 工程】Hidden Technical Debt in Machine Learning Systems(一)

妖精的绣舞 提交于 2020-12-09 00:41:10
文章目录 复杂模型侵蚀边界(Complex Models Erode Boundaries) 数据依赖成本甚于代码依赖(Data Dependencies Cost More than Code Dependencies) 参考文献 这是一篇2015年提出的论文,但是我今天看还是对现实的实践具有指导作用。本文从传统软件工程的技术债引出机器学习系统的技术债,并且比较了两者不同。 不同点具体为: 传统的软件技术债都是 代码 层面的,但是机器学习系统 代码 层面、 系统 层面都有。 具体的比较方面如下: 复杂模型侵蚀边界(Complex Models Erode Boundaries) 传统的软件开发,可以用 封装和设计模式 等方法将整个工程分为多个模块解偶,这种系统的输入、输出的影响是确定的,但是机器学习系统各个模块的输出改变,输出是不确定的。这就造成了边界不清晰,各部分耦合非常严重,主要有如下方面: Entanglement(纠缠): CACE principle: Changing Anything Changes Everything 这种情况是说ML system的的输入、学习率、学习器等互相依赖的情况,比如输入数据改变,这些组成成分也会改变,这在传统的软件工程中,改变是确定的,但是机器学习中却不清楚系统的变化方向。 作者提出的改进点为: 1、隔离模型 2

AI狂欢日到来!WAVE SUMMIT+2020深度学习开发者峰会报名启动

隐身守侯 提交于 2020-12-08 16:57:14
怎样的冬日,才是最美好的呢?白居易说:“绿蚁新醅酒,红泥小火炉”。而对于开发者来讲,自然便是“WAVE SUMMIT+,狂欢与AI”。 没错,就在 12月20日 ,属于所有AI开发者的狂欢日!WAVE SUMMIT+2020深度学习开发者峰会盛大开启!让我们再次相约,嗨翻岁末~ 此次大会由深度学习技术及应用国家工程实验室与百度联合主办,既有前沿技术解析与产业落地的干货,也有美酒和音乐的派对狂欢。同时,百度开源深度学习平台 飞桨 也会在这次大会上带来重磅更新,新老朋友们千万不要错过! 议程前瞻: 一场AI界的真正狂欢 聚焦产业共进、人才共育、开源共建,本次《WAVE SUMMIT+2020深度学习开发者峰会》将于 12月20日上午9点 正式开启,全天活动狂欢到晚。而此次活动选址,放在了北京最具艺术气息的 798艺术园区751罐 。 12月20日上午9点,WAVE SUMMIT+2020深度学习开发者峰会将正式揭幕。百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰将做开幕致辞,百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜,来自高校的著名专家学者、企业界和开源社区负责人将共聚盛会,带来精彩发言。 同时, 飞桨 还将带来最新的升级发布,作为集 深度学习 核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体的功能完备、开源开放的产业级深度学习平台,

新型支架状电极允许人类思想操作计算机

三世轮回 提交于 2020-12-08 11:44:06
来源:IEEE电气电子工程师 本文 约1100字 ,建议阅读 5 分钟 第一批接受“支架”的人类证明,家用脑-计算机接口系统是可行的。 Illustration: Synchron 据悉,两名患有神经肌肉疾病的澳大利亚人在他们的大脑中植入了支架状的电极,使他们能够利用自己的思想操作电脑,从而恢复了一些个人独立性。 据发明者介绍,这是这种被称为“stentrode”的装置首次被植入人体。该系统还使脑-机接口(brain-computer interfaces,BCI)在现实世界中的使用变得更加可行 -- 这种设备使大脑和计算机之间的直接通信变得更加可行。 近日,Neurointerventional Surgery杂志对这一研究成果进行了描述。“这篇论文代表了第一个完全植入式的商业BCI系统,病人可以带回家使用,”开发这种设备的墨尔本Synchron的创始人Tom Oxley说。 研究人员已经进行了超过15年的实验来感知人脑活动并将其直接转换成计算机命令。这些系统大多涉及开放性脑外科手术,并将硬件从头部突出,以便在实验室中对系统进行研究。这是高度实验性的,只有少数人做过。 Stentrode提供了一种将电极连接到大脑的侵入性较小的方法。这个装置被挤进导管,放在颈部的颈静脉里。从那里导管蜿蜒穿过血管,直到到达大脑的运动皮层。然后它释放支架,支架上有16个电极接触点,跳出一个管状支架后

机器学习 | 基于机器学习的银行电话营销客户购买可能性预测分析

三世轮回 提交于 2020-12-08 10:05:05
数据集: uci下载的某家银行电话营销与是否购买定期存储的数据 。 模拟目标: 知道客户数据 , 预测购买理财产品概率 我认为将电话营销的数据消除只保留基本属性可以模拟实际银行能够获取的数据 。 电话营销数据代表一些对用户决定由影响但是获取难度较大的数据 。 比如说,买房 、 买车 、 小孩上学,这些数据银行不能立刻获得,或者获取成本较高。这里不使用这些数据参与预测。虽然预测准确度会降低,但是更符合实际情况。 然后定期存储是一种产品,可以当做一种理财,如果能对一种进行预测行进实现和验证,那么可以扩展到多种产品的预测 数据情况 , 见下 表 Age 年龄 Job 工作 Marital 婚姻情况 Education 教育情况 Default 违约情况 - no 无违约 yes 有违约 Balance 账户余额 House 是否买房子 - no 无房产 yes 有房子 Loan 贷款 - no 无贷款 yes 有贷款 数据处理 数据清洗常规套路 ( 空值检查,去重,去异常值 ) 由于数据集较好,基本不需要处理,但实现数据很有可能需要清洗,比如说,年龄缺失不能简单补0。 balance处理的尝试 1.balance的分布在较大值较少,需要处理 2.balance不处理 对数据one-hot encoding,对yes,no等2分类用0,1替换 处理之后数据为 使用lightgbm建模

蚂蚁金服招人!机器学习算法/JAVA开发/产品

让人想犯罪 __ 提交于 2020-12-08 08:27:07
欢迎大家关注蚂蚁集团数字金融业务线的工作机会。在这里你将接触十亿级的平台型用户数据 以及 业界领先的金融科技算法和产品。你的每一个贡献都将影响大部分国人和世界各地的用户。本组目前开放的职位如下文所述(有数十HC)。无论你是否匹配以下岗位,都可以 加我的微信OwlLite 沟通关于 职业发展、我司岗位机会、组内业务情况、简历要求和修改、面试经验/改进和流程 等方面的问题。如果你自信已经达到了对应岗位的要求,可以将简历(包含 可联系到的 手机号)发送到 miaoqianwen.mqw@antgroup.com (本内容长期有效)。注意,岗位要求非硬性标准。 1.消费金融风控算法(杭州/上海) 职位描述 从花呗、借呗、互联网银行等金融信用业务出发,打造世界一流的信用风险控制、资金管理、产品转化等多种核心智能能力。 岗位要求 在以下一个或多个领域有扎实的理论技术基础和5年以上相关工作经验,是该领域的资深/高级专家,领域包括但不限于数据挖掘、机器学习(CV/NLP等)、搜索推荐、广告系统、自然语言处理、运筹优化等; 具有较强的业务敏感度和学习能力,对公司业务有全局理解和创新思考;同时具有横向协同整合资源,结合业务和技术创新,形成完整的解决方案能力。有互联网、金融领域等行业经验者优先; 具有结合大数据与人工智能技术支持业务创新的经验,主导重大项目或课题的立项并落地完整解法取得突出业务成果

手推公式+项目实操复现!《机器学习》完整详解

China☆狼群 提交于 2020-12-08 06:31:28
相信很多朋友对机器学习算法都有所了解,有尝试学习并利用机器学习算法以及工具做一些AI产品! 但是仅仅停留在“调包”的阶段。 想去深入理解一些算法的核心内涵却被 XGBoost | GBDT 等算法劝退了! 为了满足全民学习AI的需求,给大家推荐一款轻松入门 机器学习算法课程 , 涵盖 17大经典机器学习算法模型,21+案例练习,8大项目实战 。 今日开课,限 100个 体验名额 01 十七大经典算法模型 | K-NN最近邻 | 线性回归 | 逻辑回归 | | 凸优化 | 朴素贝叶斯 | 支持向量机 | | 决策树 | 随机森林 | GBDT | | XGBoost | 矩阵分解 | K-Means | | GMM | 主题模型 | EM | 聚类 | PCA | 02 21个项目案例讲解 01、回归分析身高预测 02、 利用KNN筛选简历 03、 二手车价格预估 04、 量化投资之股票价格预测 05、 预测广告点击率 06、 利用L1正则模拟神经科学中的稀疏性 07、 垃圾邮件分类 08、 员工离职率预测 09、 基于随机森林的疾病分析 10、 利用GBDT解决搜索中的排序问题 11、 人脸识别 12、 基于聚类的消费群分类 13、 内容推荐算法的电影推荐引擎 14、 基于协同过滤算法的音乐推荐引擎 15、 搭建OCR识别引擎 16、 利用聚类算法压缩图片 17、

联智通达:工控主板在工业自动化中的应用

╄→гoц情女王★ 提交于 2020-12-08 06:28:32
大家都知道随着科技的发展对于工控主板的用途和应用大大超出了工业自动化的范围,而对于本文联智通达小编将仅坚持工业自动化范围内的应用。首先跟随联智通达小编看一下制造以及工业PC的应用以及如何使该领域的工业自动化受益。   制造业:   坚固的工业PC为大规模生产提供了最佳的硬件平台,它超出了普通人工的劳动限制。机器自动化已经实现了大规模生产,互联网已经实现了通信。工业PC系统从婴儿期开始就摇摇欲坠,现在已经被许多制造商高度依赖,不仅用于机器视觉和机器人指导,而且还具有从机器和设备收集有价值的数据以进行预防性维护的能力。   包装检验和质量控制:   当然,制造中的另一个主要应用是视觉控制的质量保证,它以比人类可能的速度更高的速度和更高的精度运行。利用机器视觉和包装检查系统,制造商以及食品包装厂可以自动进行质量保证他们的产品的发展速度很快。3D机器视觉是视觉行业的最新进步。得益于强大的多核CPU,CPU能够以超快的速度处理额外的Z维度的计算,在对象上提供更深的多维数据,从而可以100%保证质量。这将质量控制提升到了一个新的水平,其中系统的通过或失败决定可能取决于更多参数,例如比例,形状,表面,尺寸等。   资产追踪:   制造业并不是唯一开始严重依赖工业PC的行业。零售和医疗保健部门还具有工业PC硬件的日常运行功能,因为它们具有跟踪和监视资产和流程中不一致和异常情况的能力

手机拍照进化论:为什么需要图像算法?

对着背影说爱祢 提交于 2020-12-08 03:21:54
更好的手机拍照效果需要图像算法的加持,为了让大家有更好的了解,接下来的系列,我们准备了几篇科普、视频和图说,一起来看看吧~~~ >>>> 人类进入智能手机时代后,摄影方式也发生了巨大变化:用来拍照的不再只是镜头和传感器了,背后还加载着一系列的图像算法,它可以用更快的速度处理图像,并获得更好的拍摄效果。 好作品只能依赖专业摄影师的时代过去了,图像算法引入到手机拍照应用后,让人人拍出好照片成为可能。 紫光展锐拥有自主研发的图像算法团队,而且这些算法已普遍应用在展锐的芯片平台里。目前,展锐的图像算法团队已经超过了200人,分布在美国、印度、中国台湾、上海和北京等多个国家和地区。 更好的手机拍照效果需要图像算法的加持,为了让大家有更好的了解,接下来的系列,我们准备了几篇科普、视频和图说,一起来看看吧~~~ 这事得从人类对色彩的感知能力说起… 人类对色彩的感知能力是漫长进化过程中产生的一项重要能力,它使得我们眼中的世界五彩斑斓。颜色是怎么呈现出来的呢?它是光线通过眼睛成像到视网膜上,由视网膜上的视细胞感知光信号的强弱,视觉神经对信号的传播,再由大脑处理所产生的视觉感受。颜色的产生极其复杂,人类所获得的色彩感受不但取决于光的物理特性,还受心理等因素影响。 首先,我们先来了解一下颜色的物理特性。肉眼所见到的光线(一般波长范围是380-780nm,见图1),是电磁波谱中人眼可以感知到的部分

干货!105页《机器学习手推公式》开源PDF

为君一笑 提交于 2020-12-08 01:41:32
周志华《机器学习》一书是很多人的入门必备教材,这里有详细的机器学习手推公式,为方便大家学习,将PDF下载下来方便大家学习。 周志华机器学习手推笔记部分内容展示 资料领取 扫码后台回复: 公式 ,即可获取电子版 来源: oschina 链接: https://my.oschina.net/u/4313143/blog/4777252