h2

新AI芯片介绍(1):Groq

≯℡__Kan透↙ 提交于 2020-03-24 11:19:31
3 月,跳不动了?>>> 最近被迫在家干活也出不了门,趁现在把之前听的AI芯片的演讲都总结一下。我先从Groq开始,这个算是最新也最不出名的,但是我觉得潜力很大。主要基于他们的whitepaper 跟之前我拍下来的slides,还有其它的一些比较细的report https://groq.com/wp-content/uploads/2019/10/Groq_Whitepaper_2019Oct.pdf ​ groq.com A Look Inside the Groq Approach to AI Inference ​ www.nextplatform.com Groq的背景是之前TPU的一个TL跳出来自己做的,还有CRAY的人,所以technical还是很强的。我先说我跟Groq没关系啊,所以肯定有一些不是完全准确的信息。废话不多说我们开始跟着whitepaper的逻辑过一遍。 为什么做AI芯片难 市场对于AI运算的需求正在增加,同时业务逻辑也变的越来越复杂。但是如果为了配合越发复杂的逻辑,芯片本身也越来越复杂的话,功耗也会同时增加。对于推理的workload来说,其实这些增加的复杂度本身是没有什么价值的。比如就算GPU本身,也是一开始为了rendering而优化的,也不完全是为了推理而设计的架构(老黄警告)。 Groq的逻辑 Groq这个公司是觉得没有必要搞得这么复杂

Python 识别文本情感就这么简单

你。 提交于 2020-03-24 11:00:53
3 月,跳不动了?>>> 很多同学都对自然语言处理感兴趣,但是却不知道应该从哪里下手。Python实用宝典曾写过一篇文章(《 短文本分类识别自杀倾向 》),教你从构建数据集到训练数据,再到测试数据,整个流程确实需要耐心的人才能成功走通。 不过现在有了paddlehub,我们可以先省略掉构建数据集和训练数据这两个步骤,直接拿模型过来分类。一旦简单版的分类成功了,你就会有动力继续前进,继续学习如何训练属于自己的模型。 今天我们用paddlehub中比较简单的情感倾向分析模型 senta_lstm 来对文本做一个简单的积极和消极的分类。 1.准备 为了实现这个实验,Python是必不可少的,如果你还没有安装Python,建议阅读我们的这篇文章哦: 超详细Python安装指南 。 然后,我们需要安装paddlepaddle, 进入他们的官方网站就有详细的指引: https://www.paddlepaddle.org.cn/install/quick 根据你自己的情况选择这些选项,最后一个CUDA版本,由于本实验不需要训练数据,也不需要太大的计算量,所以直接选择CPU版本即可。选择完毕,下方会出现安装指引,不得不说,Paddlepaddle这些方面做的还是比较贴心的(就是名字起的不好)。 不过虽然它里面写了这么多,大部分人用一句话安装,打开CMD(Win+R)或者Terminal

今日 Paper | 视觉目标;联合学习;面部反欺;在元学习等

女生的网名这么多〃 提交于 2020-03-24 11:00:16
3 月,跳不动了?>>> 目录 CVPR 2020 | 检测视频中关注的视觉目标 CVPR 2020 | D3Feat:密集检测和3D局部特征描述的联合学习 CVPR 2020 | 搜索中央差分卷积网络以进行面部反欺 模型的密度估计能力、序列生成能力、BLEU分数之间到底是什么关系 在元学习和具体任务的学习之间寻找平衡 CVPR 2020 | 检测视频中关注的视觉目标 论文名称:Detecting Attended Visual Targets in Video 作者:Chong Eunji /Wang Yongxin /Ruiz Nataniel /Rehg James M. 发表时间:2020/3/5 论文链接: https://paper.yanxishe.com/review/13533?from=leiphonecolumn_paperreview0320 推荐原因 这篇论文被CVPR 2020接收,要解决的是检测视频中关注目标的问题。具体来说,目标是确定每个视频帧中每个人的视线,并正确处理帧外的情况。所提的新架构有效模拟了场景与头部特征之间的动态交互,以推断随时间变化的关注目标。同时这篇论文引入了一个新数据集VideoAttentionTarget,包含现实世界中复杂和动态的注视行为模式。在该数据集上进行的实验表明,所提模型可以有效推断视频中的注意力

虚拟机linux安装wget小问题

Deadly 提交于 2020-03-24 10:55:20
3 月,跳不动了?>>> 记录一下在虚拟机vmware中安装apache hadoop 2.6.5过程中遇见的小问题: 1、默认安装的centos没有wget,也没有yum命令,于是无法下载安装包: 第一种方案:在windows中下载wget的.rpm文件,使用虚拟机的共享服务将安装包拷贝到虚拟机中,没有产生/mnt/hgfs文件夹,搜索了网上的信息后并没有解决这个问题,于是采用第二种方案; 第二种方案:使用xftp软件连接虚拟机中的centos,直接将wget的安装文件拖拽到虚拟机中,这里需要设置虚拟机中的网络适配器为“仅主机模式”,成功 2、使用wget下载软件时,遇见一个错误,wget不能解析主机域名,无法下载: 需要将虚拟机的网络适配器再设置成NAT模式 3、yum的下载安装除去其本身安装包外,还需要另外3个安装包,参考: https://www.cnblogs.com/AI-Algorithms/p/3585175.html?utm_source=tuicool 接下来配置yum的源为阿里云(中间过程可能要重启虚拟机),就可以使用yum下载并配置jdk,最后使用wget下载hadoop-2.6.5,配置环境变量并更改配置文件,教程都是百度的了~,后面的过程比较顺利,没有遇见什么问题。当然如果不打算使用yum安装jdk,也可以直接去oracle官网下载jdk。 点赞 1

在字节跳动我是如何当面试官(持续更新)

不打扰是莪最后的温柔 提交于 2020-03-24 10:54:29
3 月,跳不动了?>>> 前言 由于疫情关系,最近在各大网络技术交流平台看到很多同学的工作情况内心还是蛮触动的( 降薪 、 变相裁员 、 辞退 等)。可能这并不是当下一个普遍的现象,但仍然使我感受到Android开发这碗青春饭不好混。于此同时联系我内推的同学很多都处于待业状态,能感受到他们内心的迷茫和焦灼。于是内心一直有声音督促我,赶紧写点面试相关的东西出来吧,哪怕对大家只有一丝丝的帮助。当然这次我会以面试官的角度出发(可能不是一个优秀的面试官),让大家更加了解字节跳动的面试注意事项、重点面试题解析等。接下来我会从以下两个模块来讲解: 面试注意点 面试题解析 面试注意点 01 代码能力 是研发面试考察的核心! 其实说句老实话,研发面试所考察的最核心的能力就是...... 代码能力 ! 代码能力是计算机专业的基础 。能否在有限时间内写出清晰简洁、逻辑清晰的代码,不仅可以考察出候选人是否有扎实的基本功,也可以让面试官对候选人在未来是否能够胜任相应的岗位工作有一个基础判断。 面试两场之后我发现,有的候选人刚开始聊项目聊得非常开心,一些细节问题回答得都挺不错的,可一旦到了手写代码这一关,连二分查找都写不出来的大有人在。 平时写的代码多不多,面试之前有没有做过准备,有经验的面试官一眼就可以判断出来。所以这里给大家 分享三点建议: 1、加强基本功,增加代码量 多看优秀的源代码,认真从效率

使用Cassandra和Spark 2.0实现Rest API服务

寵の児 提交于 2020-03-24 10:51:31
3 月,跳不动了?>>> 阿里云智能数据库事业部 OLAP 平台团队现向 2021 届海内外院校应届毕业生(毕业时间在2020年11月-2021年10月之间)招聘大数据系统工程师,有机会转正,有意请加 iteblog 微信内推。   在这篇文章中,我将介绍如何在 Spark 中使用Akka-http并结合 Cassandra 实现REST服务,在这个系统中 Cassandra 用于数据的存储。   我们已经见识到 Spark 的威力,如果和 Cassandra 正确地结合可以实现更强大的系统。我们先创建一个 build.sbt 文件,内容如下: name := "cassandra-spark-akka-http-starter-kit" version := "1.0" scalaVersion := "2.11.8" organization := "com.iteblog" val akkaV = "2.4.5" libraryDependencies ++= Seq( "org.apache.spark" % "spark-core_2.11" % "2.0.0", "org.apache.spark" % "spark-sql_2.11" % "2.0.0", "com.typesafe.akka" %% "akka-http-core" % akkaV, "com

01.k-近邻算法(KNN)

落花浮王杯 提交于 2020-03-24 10:28:53
3 月,跳不动了?>>> 参考: 机器学习实战教程 机器学习实战书籍下载 - - 密码:qi7q k-近邻算法 公式编辑器 drawio画流程图 百度思维导图 纸上得来终觉浅,绝知此事要躬行 文章目录 1.算法理论 2.实践 1.knn分类 2.knn回归 总结 1.算法理论 k-近邻算法 是一种特征搜索的方法(相似性搜索): 1、准备训练集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ( x 3 , y 3 ) , . . . ( x n , y n ) } D=\{(x_1,y_1),(x_2,y_2),(x_3,y_3),...(x_n,y_n)\} D = { ( x 1 ​ , y 1 ​ ) , ( x 2 ​ , y 2 ​ ) , ( x 3 ​ , y 3 ​ ) , . . . ( x n ​ , y n ​ ) } 数据集量化 (将文本数据转成数字) 特征做归一化 (训练集与测试集都做) 2、每个测试样本与训练集中所有样本计算距离,按距离排序查找k个样本 可以使用的距离度量方法有: 欧式距离 (常用) 闵可夫斯基距离 曼哈顿距离 切比雪夫距离 马哈拉洛比斯距离 相似度度量 向量空间余弦相似度 皮尔森相关系数 3、统计这k个样本 分类 投票机制(少数服从多数) 回归 距离加权平均(类似于插值方式, 距离越小权重越大 ) 2.实践

吴恩达机器学习

↘锁芯ラ 提交于 2020-03-24 10:27:28
3 月,跳不动了?>>> 参考: 吴恩达机器学习 梯度下降法及其Python实现 梯度下降法(BGD,SGD,MSGD)python+numpy具体实现 Octave Octave 的函數列表 在线公式编辑器 1、绪论:初识机器学习 什么是机器学习 监督学习 课时4 无监督学习 数据聚类 第2章 单变量线性回归 模型描述 代价函数 代价函数(一) 代价函数(二) 梯度下降 梯度下降知识点总结 线性回归的梯度下降 线性回归梯度下降公式总结 Hypothesis: h θ = θ 0 + θ 1 x Parameters: θ 0 , θ 1 Cost Function: J ( θ 0 , θ 1 ) = 1 2 m ∑ m i = 1 ( h θ ( x ( i ) ) − y ( i ) ) 2 Goal: m i n i m i z e J ( θ 0 , θ 1 ) Gradient descent algorithm: θ j : = θ j − α ∂ ∂ θ j J ( θ 0 , θ 1 ) ( f o r j = 0 a n d j = 1 ) Correct:Simultaneous update t e m p 0 : θ 0 − α ∂ ∂ θ 0 J ( θ 0 , θ 1 ) t e m p 1 : θ 1 − α ∂ ∂ θ 1 J ( θ 0 , θ

uniapp app-plus pages.json

人走茶凉 提交于 2020-03-24 09:57:59
3 月,跳不动了?>>> app-plus Object 设置编译到 App 平台的特定样式,配置项参考下方 app-plus App 参考地址 https://uniapp.dcloud.io/collocation/pages app-plus配置编译到 App 平台时的特定样式,部分常用配置 H5 平台也支持。以下仅列出常用,更多配置项参考 WebviewStyles。 titleNView Object 导航栏 ,详见:导航栏 App、H5subNVues Object 原生子窗体,详见:原生子窗体 App 1.9.10 bounce String 页面回弹效果,设置为 "none" 时关闭效果。 App(nvue Android无页面级bounce效果,仅list、recycle-list、waterfall等滚动组件有bounce效果)softinputNavBar String auto iOS软键盘上完成工具栏的显示模式,设置为 "none" 时关闭工具栏。 仅ios生效softinputMode String adjustPan 软键盘弹出模式,支持 adjustResize、adjustPan 两种模式 ApppullToRefresh Object 下拉刷新 AppscrollIndicator String 滚动条显示策略,设置为 "none"

【云栖号案例 | 新零售】汇合营销通过数加平台降低数据使用门槛、提高开发效率

ぐ巨炮叔叔 提交于 2020-03-24 09:14:31
3 月,跳不动了?>>> 云栖号案例库: 【点击查看更多上云案例】 不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策! 公司简介 我们是杭州汇江容海网络有限公司,专注于电商数字化营销。我们公司旗下的汇合营销是一个以精准营销为核心的电商整合营销服务平台,专注于为品牌电商提供淘内、淘外一站式整合营销解决方案,基于大数据挖掘技术、电商人群画像技术、精准定向技术,及丰富的媒介资源,为品牌客户提供全方位、系统化、个性化营销解决方案。 业务痛点 大量的数据统计。 我们公司每天收集到的数据,多的时候一天有20多亿访客浏览轨迹,在DMP业务系统中,需要对每个访客的浏览内容进行分析,打上相应标签并进行统计;同时,数据分析师每天也需要产生各种报表,帮助客户进行广告优化。大量的数据存储、统计和大量的业务需求,这使得开发过程中,既要保证高效率,同时也要降低成本。 实时大数据查询。 广告商在后台的推广组选择标签时,系统需要在毫秒级的时间内显示标签的用户量并预估展现量信息,由于用户选择的标签一般都会比较多、条件比较复杂,并且每个标签的用户也可能重复,从而无法在用户选择标签前做预计算,必须每次在亿级日志表中查询,而且要保证平均延迟不超过1秒。 CTR预估。 CTR预估能够决定广告的精准程度和带来的收益,是广告竞价系统中一个比较核心的部分。在汇合营销