深度学习

最新校招京东、百度、头条算法面试真题分享

蓝咒 提交于 2020-08-11 13:00:53
1 .京东面试经历 面试的京东的商品推荐的算法岗,在北辰大厦(奥森旁边),面试难度总体来说比较简单。 ①:到公司之后先做了一个小时的笔试题目 ,包括四个简答题和两个编程题,简答题主要是 C语言相关的。 Map和Set的插入和查找的复杂度是多少,Set是否可以存储类 递归和循环可以互相转换吗? epull和select的原理以及区别? 什么时候会调用构造函数和析构函数?父类的构造函数可以是virtual的吗? 编程题也特别简单,一道题是一个有序的数组,寻找数组的中的两个数它们的和是否等 于某 个值target,返回True或者False,要求O(n)的复杂度。 另一道题目是一个数组,两个相邻下标的数组的值的差的绝对值为1,然后在这个数组中寻找 某个值是否在这个数组中,是的话返回下标,否则返回-1。 ②:第一轮面试也特别简单 ,主要就是聊了聊自己的论文是怎么做的,实习的时候干了啥, 然后再出了一道编程题,一个无序数组,只有0,1,2,然后你要对这个数组进行排序,要求 O(n)复杂度。(荷兰国旗问题) ③:第二轮面试也是主要是聊了聊自己的论文 ,然后推导SVM的原理,然后logistic和SVM 的区别,Attention注意力机制的原理,RNN的公式等。 还有一个编程题反转链表。 面试完三天拿到了口头offer,感觉总体来说还是比较简单的。 今天收到了京东的录用函

X-PU区别浅谈

放肆的年华 提交于 2020-08-11 12:34:22
本文浅显的讲解下X-PU之间的区别,CPU、GPU、TPU、NPU、BPU、DPU。  CPU     CPU( Central Processing Unit, 中央处理器) 就是机器的 “大脑” ,也是布局谋略、发号施令、控制行动的 “总司令官 ”。   CPU的结构主要包括运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, Control Unit)、寄存器(Register)、高速缓存器(Cache)和它们之间通讯的数据、控制及状态的总线。   简单来说就是: 计算单元、控制单元和存储单元 ,架构如下图所示:   从字面上我们也很好理解, 计算单元 主要执行算术运算、移位等操作以及地址运算和转换; 存储单元 主要用于保存运算中产生的数据以及指令等; 控制单元 则对指令译码,并且发出为完成每条指令所要执行的各个操作的控制信号。   所以一条指令在CPU中执行的过程是这样的:读取到指令后,通过指令总线送到控制器(黄色区域)中进行译码,并发出相应的操作控制信号;然后运算器(绿色区域)按照操作指令对数据进行计算,并通过数据总线将得到的数据存入数据缓存器(大块橙色区域)。过程如下图所示:   是不是有点儿复杂?没关系,这张图完全不用记住,我们只需要知道,CPU遵循的是 冯诺依曼架构 ,其核心就是: 存储程序,顺序执行。   讲到这里

【视频回放与课件】零基础入门AI开发

半城伤御伤魂 提交于 2020-08-11 12:21:22
今天上午,受广州图书馆邀请,在第一讲《零代码上手人工智能》的基础上,以《零基础入门AI开发》为主题,分四步解锁人工智能学习的概念与开发工具,让您在一小时内轻松掌握人工智能开发要领。本次课程内容主要包括:1.认识人工智能;2.学习什么是机器学习;3.什么是深度学习;4.介绍开发工具。课程的最后也给新入门人工智能的学习者一些小的建议,供大家参考。现将视频回放与课件分享给大家。如有问题,可以通过留言或公众号后台与我交流。 目标对象:面向所有对人工智能与深度学习感兴趣的人。 视频回放 《零基础入门AI开发》视频一 《零基础入门AI开发》视频二 《零基础入门AI开发》视频三 课件 如需回顾上一讲《零代码上手人工智能》,可点击原文链接查阅视频回放与PPT,或扫描下方二维码通过cctalk观看回顾。 微信扫码,观看回顾 来源: oschina 链接: https://my.oschina.net/u/4311964/blog/4291204

我们真的需要那么多标注数据吗?半监督学习技术近年来的发展历程及典型算法框架的演进...

ε祈祈猫儿з 提交于 2020-08-11 12:20:20
即使在大数据时代,获取大批量高质量的标注数据在实际中往往成本高昂。半监督学习技术作为一类可以同时有效利用有标签数据和无标签数据的学习范式,有希望大大降低监督任务对于标签数据的需求。本文从 2013 年所提出的 Pseudo-Label 开始,至 2019 年 Google 所提出的 UDA 技术为止, 详细介绍了半监督学习近年来的发展历程 ,重点关注各技术在核心思想、方法论上的演进。文章最后对半监督学习中涉及到的部分关键细节,如领域外数据等问题进行了详细讨论。 关于作者 李渔,熵简科技联合创始人,博士毕业于清华大学电子工程系,以第一作者身份发表学术论文 10 余篇,申请专利 6 项,致力于将先进的自然语言处理及深度学习技术真正落地于金融资管领域,让科技赋能产业。 目前负责熵简科技 NLP 技术中台的建设,包括层次化的分层架构、大数据泛采体系、持续部署的后台支持以及前沿算法的领域内落地等,为熵简科技的各大业务线提供底层技术支持和可落地的解决方案。 个人知乎专栏: https://zhuanlan.zhihu.com/c_1215573707772649472 目录 1. 为什么要了解半监督学习 1.1 什么是半监督学习 1.2 半监督学习有什么用 2. 典型技术方案的演进历程 3. 部分关键细节的讨论 3.1 类别外数据的处理 3.2 一致性正则的数学选择 3.3 错误标记数据的影响

记一次有趣的挖矿病毒

自闭症网瘾萝莉.ら 提交于 2020-08-11 11:31:42
0 前言 本病毒使用了去符号表、敏感信息混淆、int 0x80执行系调函数、sh -c 执行bash脚本获取相关信息等技术来做免杀处理,但是不足的点也很明显: 1)top命令可以直接查看病毒进程占用cpu比率。 2)crontab -l可以发现病毒的定时任务。 3)没有去掉特征字符,核心代码修改自github某著名挖矿源码。 注:由于网络安全法的规定,本文未将病毒链接放出。 1 背景 某一天,一个朋友突然微信过来一个病毒(绝对不是无中生友~)。截图是朋友给的检查结果以及时间。看图的样子,这个病毒静态检测起来比较复杂?? 2 病毒分析 拿到病毒第一件事,查壳。还好,这个病毒只是一个标准的压缩壳,没有做什么大的变化。 (x86版本x64版本代码一样,习惯用x86分析) 脱壳:upx –d filename 一切顺利。如果病毒作者自己修改upx的壳的话,标准的upx –d是脱不掉的,需要单步跟随一步步dump吧。病毒分析是一个耐心的活,考验的是细心。还有一点,此病毒全程没有符号表,这给逆向的人员带来很多麻烦,很多函数都需要一点点跟进才行。对于linux病毒,如果单纯使用gdb调试的话,很容易陷入局部,不能整体把控。此时,IDA的动态调试功能就凸显出来了。使用IDA的动态调试既简单又有效,可以节省大量时间。 方法: 1)将ida dbgsrv目录下的linux

为什么我们建立机器学习工程平台,而不是数据科学平台?

别等时光非礼了梦想. 提交于 2020-08-11 11:03:07
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 大约一年前,我们中的一些人开始研究开源机器学习平台 Cortex 。我们的动机很简单:鉴于从模型中构建应用程序是一种可怕的体验,充满了胶水代码和样板,我们需要一个工具,能将这些都予以抽象化。 虽然我们对自己在 Cortex 上的工作感到非常自豪,但我们只是过去一年来加速趋势的一部分,那就是机器学习工程生态系统的发展。公司雇佣机器学习工程师的速度比以往任何时候都要快,发布的项目也越来越好。 尽管这让我们感到很兴奋,但我们仍然经常听到这样一个问题:“什么是机器学习工程?” 在本文中,我想为读者们解释什么是机器学习工程,以及为机器学习工程师构建一个平台意味着什么。 什么是机器学习工程?为什么它不是数据科学? 让我们先从更多人熟悉的数据科学的背景来定义机器学习工程。 要给数据科学下一个定义,还不会让人愤怒评论,这很难,但我还是会试着下一个定义: 从广义上讲,数据科学是一门应用科学过程从数据中获得见解的学科。 机器学习工程是一门利用机器学习构建应用程序的学科。 显然,这里有很多重叠之处。两者都是封装了机器学习的学科。不同之处主要在于目标。顾名思义,数据科学是一门科学,而机器学习工程是一门工程学科。 这种区别在大多数学科中都存在。想一想生物学和生物医学工程。工程学科显然离不开科学家的工作

滴滴推理引擎IFX:千万规模设备下AI部署实践

帅比萌擦擦* 提交于 2020-08-11 10:53:21
桔妹导读:「滴滴技术」将于本月开始,联合各技术团队为大家带来精彩分享。你想了解的技术干货,深度专访,团队及招聘将于每周三与你准时见面。本月为「滴滴云平台事业群分享月」,在今天的内容中,云平台事业群-机器学习平台团队与你聊一聊AI技术在滴滴平台上的实践思考。IFX 团队经过 2年多的奋斗,已将 AI 部署服务于公司安全、地图、车载、普惠、车服、IT等业务团队,覆盖司乘 APP,桔视设备,代驾记录仪,AIBox(边缘计算 AI 盒子),国际化司乘 APP 等智能化需求的场景,覆盖千万级别设备,千亿级别日活调用量。 1.背景 随着人工智能技术的发展,深度学习技术在工业界得到了广泛的应用。数据、算法、算力三个维度的协同发展,逐步将 AI 推向成熟期,并且渗透到生活的方方面面。 滴滴拥有海量出行大数据,同时拥有大量的司乘端手机用户、桔视设备(车载摄像头)、GPU 集群等算力平台,对云、边、端 AI 能力的发掘将迎来一个黄金时代。滴滴机器学习团队从 2018 年 9 月开始调研和搭建自研推理引擎平台 IFX,在 2018 年 12 月开始对内提供服务,并在司机端和乘客端 APP 中落地。经历了 2 年的发展,IFX 已经在公司的大量业务中得到应用,服务于订单和准入的关键路径,司乘支付绑卡、实名认证、金融安全、提现等业务流程,高危场景识别,费用判责,追尾碰撞检测,定位导航,路网更新等业务场景

黄埔学院三期开学,百度吴甜:复合型人才将弥补技术与业务落地的“鸿沟”

丶灬走出姿态 提交于 2020-08-11 10:39:13
6月6日,由百度与深度学习技术及应用国家工程实验室共同打造的“黄埔学院”在京迎来第三期开学礼。百度集团副总裁、深度学习技术及应用国家工程实验室副主任、黄埔学院院长吴甜现场致辞并参与授旗仪式。BV百度风投CEO刘维、百度 飞桨 总架构师于佃海、百度深度学习技术平台部高级总监马艳军、百度AI技术生态部总监刘倩、百度深度学习技术平台部主任架构师毕然,与来自一汽大众、联想、TCL、中国工商银行、国家卫星气象中心、中国石油规划总院、太平洋保险等企业的81位学员以 线上+线下 的方式参与了开学典礼。 开学礼现场,吴甜在致辞中分享到: “新基建” 今年被首次写入了政府工作报告,‘加速产业智能化转型’站上了时代背景中越来越重要的位置,而人才培养是产业智能化当中非常重要的话题。百度黄埔学院旨在培养 “首席AI架构师” ,他们是产业化过程当中,既懂应用场景、又懂AI技术、能够把AI技术应用起来,解决场景当中实际问题的复合型人才。这也是每一位黄埔学院学员的成长目标。” 百度集团副总裁、深度学习技术及应用国家工程实验室副主任、黄埔学院院长吴甜致辞 BV百度风投CEO刘维从专业角度为学员分享了国内外宏观趋势的洞察。他说到,AI深入实体经济构建大变革商业时代刚刚开始,各行各业都面临着效率模型的挑战,AI是重塑业务模式、推动产业变革的机遇,黄埔学院的AI一线从业者通过 模式创新

重磅! 2020年最新计算机视觉学习路线教程

浪子不回头ぞ 提交于 2020-08-11 10:38:57
这篇文章主要是基于我自己的经验,侧重于计算机视觉学习资源的介绍,如果大家按照这个路线去学,相信这将在很大程度上促进提高你的计算机视觉知识水平。 在开始学习计算机视觉之前,我们先来了解有关机器学习和python基础知识。 框架(Frameworks) 虽然你不必从一开始就去考虑选择何种框架,但是实践应用新的知识是必要的。 对应框架并没有太多选择,主要为: pytorch 或 keras (TensorFlow)。Pytorch可能需要编写更多代码,但在返回方面具有很大的灵活性,因此我们可以先学习如何使用pytorch。此外,大多数深度学习研究人员也普遍使用pytoch。 Albumentation (图像增强库)和 catalyst (框架,pytorch顶部的高级API)在我们学习计算机视觉的过长中也是很常用的工具,我们也可以先学习和使用它们,尤其是第一个。 硬件 Nvidia GPU 10xx +:($ 300 +) Kaggle内核(免费) :每周仅30个小时 ( https://www.kaggle.com/kernels) Google Colab(免费):12小时的会话限制,每周限制的使用时长不定 ( https://colab.research.google.com/notebooks/intro.ipynb#recent=true) 理论与实践 在线课程

创龙Xilinx Zynq-7000系列SoC高性能处理器SATA接口

拥有回忆 提交于 2020-08-11 10:26:51
CPU CPU为 Xilinx Zynq-7000 SOC,兼容XC7Z0 35 /XC7Z0 45 /XC7Z 100 ,平台升级能力强,以下为 Xilinx Zynq-7000 特性参数: ZYNQ Z-7045-C6678新伙伴 TLZ7xH-EVM评估板 芯片架构: XC7Z045/XC7Z100-2FFG900I,集成PS端双核ARM Cortex-A9 + PL端Kintex-7架构28nm可编程逻辑资源。PS端主频最高可达1GHz,单核运算能力高达2.5DMIPS/MHz。 外设资源: 1x FMC(HPC)、2x CameraLink(Base/Medium/Full)、2x CAMERA、4x SFP+、1x PCIe Gen2、1x SATA、2x HDMI、2x SGMII 支持PS、PL端通信、高速AD采集与处理、CameraLink视频采集与处理 应用领域: 雷达探测 目标追踪 电子对抗 定位导航 图像处理 水下探测 光电探测 深度学习 SATA接口 开发板引出了 一个 7 pin SATA 硬 盘接口,硬件及引脚如图: 来源: oschina 链接: https://my.oschina.net/u/4169033/blog/4277464