cos

换脸新潮流:BIGO风靡全球的人脸风格迁移技术

三世轮回 提交于 2020-08-16 01:48:50
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 引 1974年,我国的考古学家在陕西省西安市发掘出了兵马俑,并被其神态各异惟妙惟肖的面部表情所震撼。同年,一篇名为《A Parametric Model for Human Faces》论文迈出了人脸属性编辑这一领域的第一步。而半个世纪后的今天,BIGO自主研发的FaceMagic的换脸技术让你随心所欲地化身为兵马俑,世界名画,或者电影里的超级英雄, 产品一推出即风靡全球。 BIGO为了把这项创新技术带给全球用户,研发人员克服了各种挑战。技术挑战主要来源于三个方面:第一是人脸特征迁移技术,我们创新性地尝试把风格迁移的思路用于人脸特征迁移中,克服了当时主流的deep fake、 3D方案等技术的不足。 第二是全球化问题,因为BIGO用户来源于全球各地,为了解决不同人种的肤色、五官结构的差异问题,我们构建了千万量级的全球化的人脸数据集,极大地涵盖肤色、性别、年龄等差异性,力求把全球每一位用户的效果做到最佳 。第三是多属性,多场景的效果优化,我们在不断优化网络结构的同时尝试人脸属性、人脸姿态等约束,并大力提升大规模数据的训练效率,充分挖掘数据的多样性特征,把换脸效果做到更加鲁棒、真实、自然。FaceMagic仍在吸引越来越多人的参与,自上线以来,全球生产总量接近1亿。功能推出后

Word2Vec简明教程:入门、原理及代码实现

核能气质少年 提交于 2020-08-15 17:20:07
Word2Vec简明教程 1. 特征向量 2. 词向量 2.1 例1:King- Man + Woman = Queen 2.2 例2:跨语言同义词共现 3. NNLM 4. Word2Vec 4.1 SkipGram (1)基本概念 (2)数据模型 4.2 CBoW 4.3 Negative Sampling 4.4 Hierarchical Softmax 5. 使用gensim 1. 特征向量 近年来,研究者通过词汇学方法,发现约有五种特质可以涵盖人格描述的所有方面,提出了人格的 大五模式(Big Five) ,俗称人格的海洋(OCEAN),包括以下五个维度: 开放性(Openness):具有想象、审美、情感丰富、求异、创造、智能等特质。 责任心(Conscientiousness):显示胜任、公正、条理、尽职、成就、自律、谨慎、克制等特点。 外倾性(Extroversion):表现出热情、社交、果断、活跃、冒险、乐观等特质。 宜人性(Agreeableness):具有信任、利他、直率、依从、谦虚、移情等特质。 神经质性(Neuroticism):难以平衡焦虑、敌对、压抑、自我意识、冲动、脆弱等情绪的特质,即不具有保持情绪稳定的能力。 通过NEO-PI-R测试可以得出每个维度的打分(1-100),然后将其缩放到 [ − 1 , 1 ] [-1,1] [ − 1 , 1 ]

1分钟教你完美解决地图开发中WebGL着色器32位浮点数精度损失问题

放肆的年华 提交于 2020-08-15 15:53:39
以下内容转载自木的树的文章《WebGL着色器32位浮点数精度损失问题》 作者:木的树 链接: https://www.cnblogs.com/dojo-lzz/p/11250327.html 来源:博客园 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 前言 Javascript API GL 是基于WebGL技术打造的3D版地图API,3D化的视野更为自由,交互更加流畅。 提供丰富的功能接口,包括点、线、面绘制,自定义图层、个性化样式及绘图、测距工具等,使开发者更加容易的实现产品构思。 充分发挥GPU的并行计算能力,同时结合WebWorker多线程技术,大幅度提升了大数据量的渲染性能。最高支持百万级点、线、面绘制,同时可以保持高帧率运行。 同步推出基于Javascript API GL的 位置数据可视化API库 ,欢迎体验。 问题 WebGL浮点数精度最大的问题是就是因为js是64位精度的,js往着色器里面穿的时候只能是32位浮点数,有效数是8位,精度丢失比较严重。 分析 在基础底图中,所有的要素拿到的都是瓦片里面的相对坐标,坐标范围在0-256之间。在每次渲染时都会重新实时计算瓦片相对中心点的一个偏移来计算瓦片自己的矩阵,这种情况下精度损失比较小,而且每个zoom级别都会加载新的瓦片,不会出现精度损失过大问题。 但是对于一些覆盖物,比如marker

量子纠缠2——CHSH不等式

微笑、不失礼 提交于 2020-08-15 11:30:57
问题 有 A lice和 B ob两个人,随机给他们两个数x和y(0或1),然后A和B根据他们得到数(x和y)给两个个数a和b(0或1)。 规则如下: 如果输入的x和y都是1,那么,Alice和Bob给出不一样的数获胜;否则,Alice和Bob给出相同的数获胜。 Alice和Bob在拿到x和y后就不能交谈了,但是在拿到前可以交流。 问: Alice和Bob怎样约定获胜的可能性最大? 一共有以下十六中情况: x y a b result 0 0 0 0 赢 0 0 0 1 输 0 0 1 0 输 0 0 1 1 赢 0 1 0 0 赢 0 1 0 1 输 0 1 1 0 输 0 1 1 1 赢 1 0 0 0 赢 1 0 0 1 输 1 0 1 0 输 1 0 1 1 赢 1 1 0 0 输 1 1 0 1 赢 1 1 1 0 赢 1 1 1 1 输 经典解法 我们可以看到,如果Alice和Bob随机输出a和b,即输出的a和b与输入的x和y无关,那么他们获胜了可能性是50%,也就是0.5。 如果有提前约定呢? 当输入x和y都是0的时候,Alice和Bob可以约定都出0(约定都出1也是一样的道理),这样,输入是(0,0)的25%可能是一定获胜。 但是当你的输入是1的时候,你不知道另一个人是的输入是0还是1。 如果约定出0,即,无论输入是什么都出0,则,获胜的可能性是75%,只有输入是

canvas水波纹效果

六眼飞鱼酱① 提交于 2020-08-15 08:11:32
先看效果 演示效果 自然界中水波纹效果十分麻烦,我这里只是根据水波纹的几个特性,在理想环境下模拟水波纹的扩散效果。 这里应用到的属性有:扩散、波动、折射。 扩散:很好理解,水波纹会从触发原点开始向周围扩散 波动:水波纹就一直波,在切面上观看,就是一个正弦函数的波形图 折射:光在不同介质中传播速度不同导致出现折射效果。 如果在平静条件下,在垂直方向上看水底事物,很正常。 在波动条件下,因为水的上下波动,导致垂直方向上看到的水底物体,因为波的角度不同,导致水下事物反射的光到人眼的时候,出现一些偏移。 找出这个偏移的算法就是这个效果的精髓所在。 看下图: 基本算法如下: 1、 根据公式,正弦函数的波形上的某个点的切线角度。 sople=cos(len)【sople为斜率,len正弦位置距离原点的位置】 2、 len要根据水波纹的波长除以2π算出一个周期下r的值 len=r*PI*2/waveLen【waveLen:水波一个周期的长度】 sople=cos(r*PI*2/waveLen) 3、 知道斜率,求出切线的倾斜角 sopleDeg=atan(sople) sopleDeg = (sopleDeg+360)%360 4、 切线的倾斜角区间为0-360度,入射角区间0-90度 inDeg= sopleDeg%90 5、 根据公式,入射角的正弦比上折射角的正弦为折射率 sin(inDeg

节约60%成本!虎牙直播云端大数据是怎么做到的?

荒凉一梦 提交于 2020-08-14 13:38:43
引言 虎牙是中国第一家上市的游戏直播公司,旗下产品包括知名游戏直播平台虎牙直播、风靡东南亚和南美的游戏直播平台NimoTV等,产品覆盖PC、Web、移动三端。其中,游戏直播平台虎牙直播月活达1.5亿。 如何借助于海量业务数据将全平台的优质内容与终端用户更智能、高效地连接起来,为公司运营和业务发展提供更为有效的数据能力支撑,是虎牙大数据团队(下面简称虎牙)过去和未来一直需要深入思考和探索的重要使命。为了达成以上愿景,虎牙选择与腾讯云EMR团队合作,接入大数据云端解决方案。 本文将通过案例解读,带大家深入了解虎牙云端大数据实践。 一、虎牙直播大数据分析场景 1. 背景介绍 虎牙是中国第一家上市的游戏直播公司,旗下产品包括知名游戏直播平台虎牙直播、风靡东南亚和南美的游戏直播平台NimoTV等,产品覆盖PC、Web、移动三端。其中,游戏直播平台虎牙直播月活达1.5亿。 2. 大数据场景介绍 意识到数据对于业务的重要价值,虎牙很早就成立了近百人的专业大数据团队,这个团队拥有业内卓越的数据技术能力和业务理解力,以应对海量数据的高效存储计算、算法构建、业务价值洞察等领域化工作。 经过多年的建设,该团队围绕数据在各个领域都取得了极为显著的进展,真正让数据成为优质内容与终端用户连接的催化剂。 虎牙大数据团队基于开放Hadoop技术栈快速构建了稳健的全平台大数据平台,以支撑近百P规模的离线

语音信号处理之语音特征提取(1)机器学习的语音处理

本小妞迷上赌 提交于 2020-08-14 13:16:00
本文首先是将 Speech Processing for Machine Learning: Filter banks, Mel-Frequency Cepstral Coefficients (MFCCs) and What's In-Between 这篇2016年4月21号的文章 翻译了一下,然后讲出一点自己的理解和注释。 机器学习的语音处理:滤波器组,梅尔频率倒谱系数(MFCC)以及两者之间的区别 语音处理在任何语音系统中都扮演着重要的角色,无论它是自动语音识别(ASR)还是说话者识别等等。 长期以来,梅尔频率倒谱系数(MFCC)是非常受欢迎的功能。 但是最近,滤波器组正变得越来越流行。 在这篇文章中,我将讨论滤波器组和MFCC,以及为什么滤波器组变得越来越流行。 计算滤波器组和MFCC涉及相同的过程,在这两种情况下,都将计算滤波器组,并通过一些额外的步骤可以获得MFCC。 简而言之,信号会通过预加重滤波器。 然后将其切成(重叠的)帧,并将窗口函数应用于每个帧; 之后,我们在每个帧上进行傅立叶变换(或更具体地说是短时傅立叶变换),并计算功率谱; 然后计算滤波器组。 为了获得MFCC,可将离散余弦变换(DCT)应用于滤波器组,以保留多个所得系数,而其余系数则被丢弃。 两种情况的最后一步是平均归一化。 建立 在本文中,我从此处使用了一个16位PCM wav文件,称为“ OSR

[computer graphics]简单光照模型(Phong和Blinn-Phong)和明暗处理

落爺英雄遲暮 提交于 2020-08-14 13:06:12
简单光照模型(Phong和Blinn-Phong)和明暗处理 支持点光源和平行光,是一种简单光照模型,它将光照分解成了三个部分,分别为 漫反射 镜面反射 环境光 如图所示,是一个简单的几何模型。 \(L\) 是光源方向 \(N\) 是法线方向 \(R\) 是反射方向 \(V\) 是视线方向 \(H\) 是 \(L\) 和 \(V\) 的平分 所有向量都是单位向量 理想漫反射 当光源来自一个方向时,漫反射均匀地向各个方向传播,与视点无关,是由物体表面粗糙不平引起的,漫反射的空间分布是均匀的,也就是说不论从哪个方向看去,同一个点的漫反射光强都是一样的。物体上的点 \(P\) ,法向量为 \(N\) ,入射光强度为 \(I_p\) , \(L\) 为 \(P\) 指向光源的方向。如果所有所有的向量都是单位向量,那么有 \[I_d = I_pK_d\cdot(L\cdot N) \] 其中 \(K_d=(K_{dr},K_{dg},K_{db})\) 这三个分量分别是RGB三原色的漫反射系数,可以反应物体的颜色。同样的 \(I_p=(I_r,I_g,I_b)\) 可以通过分量来设置光源的颜色。 镜面反射 对于理想镜面,反射光集中在一个方向,并遵守反射定律。对于一般的光滑表面,反射光则集中在一个范围内,且反射定律决定的方向光强最大。所以从不同位置观察到的镜面反射光强不同。镜面反射光可表示为

awk

痴心易碎 提交于 2020-08-14 11:20:48
一、前言 awk是处理文本文件的一个应用程序,几乎所有 Linux 系统都自带这个程序。 它依次处理文件的每一行,并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同的文本文件,awk可能是最方便的工具。 awk其实不仅仅是工具软件,还是一种编程语言。不过,本文只介绍它的命令行用法,对于大多数场合,应该足够用了。 二、基本用法 awk的基本用法是下面的格式 #格式 $ awk 动作 文件名 #示例 $awk '{print $0}' demo.txt 上面示例中,demo.txt是awk所要处理的文本文件。前面单引号内部有一个大括号,里面就是每一行的处理动作print $0。其中,print是打印命令,$0代表当前行,因此上面命令的执行结果,就是把每一行原样打印出来。 #下面,我们先用标准输入(stdin)演示上面这个例子。 $ echo 'this is a awk cmd test' | awk '{print $0}' this is a awk cmd test 上面代码中,print $0就是把标准输入this is a awk cmd test,重新打印了一遍。 awk会根据空格和制表符,将每一行分成若干字段,依次用$1、$2、$3代表第一个字段、第二个字段、第三个字段等等。 #下面还是通过标准输入来演示,输出第三个字段 $ echo 'this is a

万物皆可 Serverless 之使用 SCF+COS 快速开发全栈应用

拈花ヽ惹草 提交于 2020-08-14 09:33:06
我一直想做一个网页应用,奈何没有系统学习过前端,直到后来我接触到腾讯云无服务器云函数 SCF,让前端可以快速获得后端的能力同时,一并解决了前端数据请求跨域的问题。 本文来自 Serverless 社区用户「乂乂又又」供稿 没错,云函数 SCF 就是那种一旦用了就无法回到原来那种神奇的东西,让人不禁感叹为什么没有早点遇到 SCF 然后我花了大概一天的时间编写调试上线发布云函数(应用后端),然后又用了一天的时间学了下前端,主要是确定要用到的技术栈(后面我会再讲到这个问题),然后第三天正式开始开发应用,将云函数引入前端调用,测试数据,调整布局,打包网页发布到 coding pages。 所以在我是一个前端初学者的背景下,前后仅花了大概三天的时间,就完成了这样一个比较简单的网页应用 这就是 Severless 的魅力所在,它可以让你快速开发上线全栈应用,无论你是前端或是后端开发者都可以获益许多。 效果展示 首页 视频播放页 更详细的体验可访问 https://wo-cao.cn/ ,仅做测试之用,不要乱搞哦~ 是不是有点跃跃欲试涅?让我们开始吧~ 前端部分 由于初涉前端,前端丰富得让人眼花缭乱的生态让我花费了一整天的时间来确定所要用的框架。 这里大体说下我用到的前端技术栈,帮助小伙伴快速进入实际开发状态,不要像我这个前端小白一样在框架的选择上耗费太多时间 需求 第三方库 html预编译