tianchi

给你10个市场数据调研报告的免费下载网站!以后竞品数据从这里找!

大兔子大兔子 提交于 2020-08-16 01:23:52
前两天老李回答了一个寻找数据源网站的知乎问题,发现大家对此都很感兴趣。于是老李今天多整理了一些免费数据源网站,供大家数据分析练手用^_^ 一、行业数据网站 1、Mob研究院 网址: https://www. mob.com/mobdata/report 介绍: Mob研究院是一家专注于行业现状与趋势研究的机构,涉及20+行业领域,深入挖掘与分析行业现状及变化趋势,输出专业数据报告,并提供定制化研究报告的服务。 评价: 。是我见过的数据报告研究机构当中最为清流的,在各个新媒体平台上风势很大,做的内容也比较有意思,专业性也比较高,可信度也是比较高的; 推荐指数: ★★★★ 网站界面: 2、艾瑞咨询 网址: https://www. iresearch.com.cn/ 介绍: 艾瑞咨询是解决商业决策问题的专业第三方机构,经常发布一些不同行业的数据和产品报告,比如医疗、生产制造、内容营销、教育、零售、B2B、物流、体育、房产、互联网、云服务、文化娱乐等行业。 评价: 这个网站中的报告数据还是比较有可信度,而且是免费的。 推荐指数: ★★★★ 网站界面: 3、豆丁报告网 网址: https:// baogao.docin.com/ 介绍: 豆丁报告网为中国企业提供各行业的行业分析报告、行业研究报告、市场调查报告、行业调研报告、市场研究分析报告等产品和服务。 评价: 这个网站大多数的报告都能看

JindoFS 存储策略和读写优化

 ̄綄美尐妖づ 提交于 2020-08-14 06:22:09
主题: JindoFS 存储策略和读写优化 时间: 2020.6.11 19:00 参与方式: 扫描下方二维码加入钉钉群直接观看 或届时点击链接进入直播间(此链接也是回看链接) https://tianchi.aliyun.com/course/live?spm=5176.12282027.0.0.7088379cvEoTMJ&liveId=41173 讲师: 姚舜扬,花名辰山,阿里巴巴计算平台事业部 EMR 高级开发工程师,目前从事大数据存储方面的开发和优化工作. 直播简介: 本次分享主要介绍数据读写在计算存储分离的场景下所面临的常见问题以及相关的优化手段,并结合应用场景介绍对数据缓存加速的相关技术和策略。 来源: oschina 链接: https://my.oschina.net/u/4363024/blog/4306307

高德智慧景区随身听播放器框架设计与实现

吃可爱长大的小学妹 提交于 2020-08-14 01:50:56
一、背景 “远看山有色,近听水‘ 有 ’ 声 ”,景区语音导览是智慧景区重点业务之一,以用地图可以边走边听景区各景点的语音介绍为主要诉求,实现高德智慧景区地图不仅可以看,还可以听,从而使用户交互体验得到跨越式提高。 我们想要让“技术有温度”,让讲解更加有感情和内涵,最好可以通过讲解构造一个“UGC景区讲解生态圈”,并且还能帮助讲解创作者有一定的收益,以达到“生态圈的正向循环”,让线上导游“天下没有难做的生意”。 试想一下,当游客走进故宫,这时,高德地图的语音包可以播放:“故宫有180万件宝贝,青铜馆、陶瓷馆……”这段话的讲解人,是著名收藏家、古董鉴赏家马未都,是不是更加吸引你关注?另外,当你漫步到延禧宫,语音包则会立刻讲一讲延禧宫与大热的电视剧《延禧攻略》有什么关系,并且有背景音插入,是多么生动形象。 所以,我们开发选型并没有采用传统的TTS技术(由文本内容生成机器语音),而是采用了更加通用音频格式(比如mp3),作为讲解的音频输入源,方便讲解者进行二次创作。本文将简单回顾高德智慧景区随身听播放器的框架设计与实现。 二、架构设计前思考 “夫未战而庙算胜者,得算多也;未战而庙算不胜者,得算少也”,拉开战斗序幕之前我们应该尽量去“庙算”,提前预防和判断并保证技术风险可控,俗称“防火”。“防火”更能看出本事,而“救火”只是能力。开发应尽量做到“不打无准备之仗”。 首先,

6813个户型,细节丰富,阿里巴巴联合学界开源大型3D场景数据集

℡╲_俬逩灬. 提交于 2020-08-12 06:56:38
  机器之心专栏    机器之心编辑部    源于阿里巴巴淘系的工业生产流程,兼具质量与数量,模型包含丰富的几何与纹理细节,阿里巴巴联合学界开源的场景布局数据集 3D-FRONT 将填补大规模高质量 3D 场景布局数据集空白的现状。   近期,阿里巴巴淘系技术部门的赵斌强、贾荣飞等与西蒙弗雷泽大学的张皓教授以及中科院计算所的高林、张凌霄多方共同合作,在 CVPR 2020 的 Workshop“Learning 3D Generative” 中开源了 大型 3D 场景数据集 3D-FRONT(3D Furnished Rooms with layOuts and semaNTics),以填补目前学界在大规模高质量 3D 场景布局数据集上空白的现状 。其中,张皓教授是 CVPR 2020“Learning 3D Generative”Workshop 的核心组织者之一。   接下来我们来看 3D-FRONT 的技术细节。    3D 场景数据将推动基于 AI 的 3D 应用研究      图 1:三维室内场景研究与应用。   3D 与 2D 场景理解是打造未来 AI 世界所研究的基础核心课题,涵盖机器人室内寻路、线上商城、室内设计等室内场景相关的应用。这些应用的背后涉及到语义分割、物体识别、场景生成等深度学习相关的理论与技术

阿里天池全国社保比赛心得

二次信任 提交于 2020-08-11 23:45:34
最近时间都忙于参加阿里天池的全国社会保险大数据应用创新大赛,终于结束,最终全国排名第7,总共是1336只队伍参加,还是很激动进了前10,今天想把一些体悟写一下,希望对后来参加的人有用。这个比赛是完成数据算法模型的开发设计,实现对各类医疗保险基金欺诈违规行为的准确识别,根据给出的数据情况,最开始有两个思路,1.从就诊记录入手,找到可疑的就诊记录,然后拼接到人上 2.直接构造人的可疑程度的行为特征。两者都试过,最终选择了后者,因为题目给出的欺诈标签主要是人的欺诈标签,并没有给出某次就诊行为的欺诈标签。另外,此次的评测指标是F1值,这个非常重要,你要知道你最终排名都是看的这个值。下面我从三个方面讲一下这次比赛的心得。 一、特征 可能没参加比赛前很难理解 特征决定上限 的这个真理,特征特征才是最重要的! 一定要看特征重要度,要不断尝试,有些组合到一起反而降低,有些特征看着不重要,你把他去了 可是结果却会出现下降的情况,因为特征和特征之间是有关系的。 在重要特征做深入处理的收益远大于在次要特征中继续做。 汇总信息有些时候会丢失信息,比如我们最开始将医院数据进行了汇总,计算每个人去一级医院,二级医院,三级医院的个数,反而没有把所有医院的维度扩充好。 观察和了解你的数据很重要。观察数据发现患者同一天在同一个医院有药费,有治疗费分别出现不同的就诊id,包括挂号的费用也是不同的id

阿里天池全国社保比赛心得

坚强是说给别人听的谎言 提交于 2020-08-11 18:10:48
最近时间都忙于参加阿里天池的全国社会保险大数据应用创新大赛,终于结束,最终全国排名第7,总共是1336只队伍参加,还是很激动进了前10,今天想把一些体悟写一下,希望对后来参加的人有用。这个比赛是完成数据算法模型的开发设计,实现对各类医疗保险基金欺诈违规行为的准确识别,根据给出的数据情况,最开始有两个思路,1.从就诊记录入手,找到可疑的就诊记录,然后拼接到人上 2.直接构造人的可疑程度的行为特征。两者都试过,最终选择了后者,因为题目给出的欺诈标签主要是人的欺诈标签,并没有给出某次就诊行为的欺诈标签。另外,此次的评测指标是F1值,这个非常重要,你要知道你最终排名都是看的这个值。下面我从三个方面讲一下这次比赛的心得。 一、特征 可能没参加比赛前很难理解 特征决定上限 的这个真理,特征特征才是最重要的! 一定要看特征重要度,要不断尝试,有些组合到一起反而降低,有些特征看着不重要,你把他去了 可是结果却会出现下降的情况,因为特征和特征之间是有关系的。 在重要特征做深入处理的收益远大于在次要特征中继续做。 汇总信息有些时候会丢失信息,比如我们最开始将医院数据进行了汇总,计算每个人去一级医院,二级医院,三级医院的个数,反而没有把所有医院的维度扩充好。 观察和了解你的数据很重要。观察数据发现患者同一天在同一个医院有药费,有治疗费分别出现不同的就诊id,包括挂号的费用也是不同的id

阿里天池全国社保比赛心得

廉价感情. 提交于 2020-08-11 15:42:38
最近时间都忙于参加阿里天池的全国社会保险大数据应用创新大赛,终于结束,最终全国排名第7,总共是1336只队伍参加,还是很激动进了前10,今天想把一些体悟写一下,希望对后来参加的人有用。这个比赛是完成数据算法模型的开发设计,实现对各类医疗保险基金欺诈违规行为的准确识别,根据给出的数据情况,最开始有两个思路,1.从就诊记录入手,找到可疑的就诊记录,然后拼接到人上 2.直接构造人的可疑程度的行为特征。两者都试过,最终选择了后者,因为题目给出的欺诈标签主要是人的欺诈标签,并没有给出某次就诊行为的欺诈标签。另外,此次的评测指标是F1值,这个非常重要,你要知道你最终排名都是看的这个值。下面我从三个方面讲一下这次比赛的心得。 一、特征 可能没参加比赛前很难理解 特征决定上限 的这个真理,特征特征才是最重要的! 一定要看特征重要度,要不断尝试,有些组合到一起反而降低,有些特征看着不重要,你把他去了 可是结果却会出现下降的情况,因为特征和特征之间是有关系的。 在重要特征做深入处理的收益远大于在次要特征中继续做。 汇总信息有些时候会丢失信息,比如我们最开始将医院数据进行了汇总,计算每个人去一级医院,二级医院,三级医院的个数,反而没有把所有医院的维度扩充好。 观察和了解你的数据很重要。观察数据发现患者同一天在同一个医院有药费,有治疗费分别出现不同的就诊id,包括挂号的费用也是不同的id

【CV实践】图像检索从入门到进阶

痞子三分冷 提交于 2020-08-09 22:30:19
Datawhale分享 作者:阿水,Datawhale成员 简介: 阿水, Datawhale 成员,北京航空航天大学硕士, 多次获得国内外数据竞赛 TOP 名次 图像检索是计算机视觉中基础的应用,可分为文字搜图和以图搜图。借助于卷积神经网络CNN强大的建模能力,图像检索的精度越发提高。 本次分享,将会从基础分享图像检索的原理和流程,并具体讲解图像局部特征和全局特征的差异性,最后以图像检索比赛为案例,进行独家的分享。 注: 今晚7点 在阿里天池直播分享,录播上传后 原链接 可回看 https://tianchi.aliyun.com/course/live?spm=5176.12282027.0.0.8bc1379cPYBoA6&liveId=41152 如需直播PPT,后台回复关键词 阿水 获取 主题大纲 1. 图像检索入门 介绍图像检索的定义、图像检索的典型应用和流程 2. 图像检索特征 介绍图像全局特征和图像局部特征,进而图像检索过程 3. 图像检索案例 以图像检索的应用和竞赛为案例,讲解解决方案 图像检索入门 文字检索与内容检索 CB IR 应用场景 成熟的图像检索应用涉及到相关算法,也是一个工程问题 图像检索的本质是特征提取和相似度计算的过程 图像检索特征 即使相差万里的图像也有可能是相似的 如果图像相似,则图像特征也相似 局部特征与全局特征 简易代码示例 相似度计算

阿里云EDAS 3.0重磅发布,无侵入构建云原生应用

偶尔善良 提交于 2020-08-09 11:09:07
发布会传送门 进入直播间还有好礼等你拿! EDAS产品免费试用: https://www.aliyun.com/activity/middleware/edaspromotiononmay 首届云原生编程挑战赛正式开战!立即报名瓜分330000现金奖: https://tianchi.aliyun.com/specials/promotion/cloudnative#problem-definition 观看《云原生架构师培训课程》领取新用户折扣: https://yqh.aliyun.com/live/AlibabaCloudNative 据介绍,EDAS3.0 围绕微服务治理、K8s 集群纳管、监管控一体化、阿里云其他基础产品集成体验进行了全面升级,包括无侵入(无需修改一行代码)即可兼容Spring Cloud/Dubbo近5年发布的所有版本,使用全套微服务治理能力,例如金丝雀发布、离群实例摘除、服务鉴权、无损下线、限流降级和全链路流控等。此外,EDAS3.0 在提供 K8s 集群托管的基础山,提供了应用实例打散一键多 AZ 高可用部署、应用发布版本管理、发布变更跟踪、应用层机制弹性等全流程的管控能力,帮助用户更高效的管理阿里云上的容器集群。 EDAS产品经理先河在发布会上表示,EDAS3.0 除了在微服务治理和容器纳管上提供了差异化的产品竞争力外

赛题解析|初赛赛道三:服务网格控制面分治体系构建

余生颓废 提交于 2020-08-05 05:26:45
首届云原生编程挑战赛正在报名中,初赛共有三个赛道,题目如下: 赛道一:实现一个分布式统计和过滤的链路追踪 赛道二:实现规模化容器静态布局和动态迁移 赛道三:服务网格控制面分治体系构建 立即报名 (报名时间即日起至06/29): https://tianchi.aliyun.com/specials/promotion/cloudnative#problem-definition 本文主要针对赛道三题目做出剖析,帮助选手更高效的解题。 背景知识 “服务网格” 是近年来非常火热的技术,其全托管的思维非常适合云原生场景。“服务网格” 核心分为控制面与数据面:数据面主要是一个名为 Sidecar 的代理组件,它通过接收控制面发送的路由与控制信息来定向转发或处理数据。这样一些坐落在服务网格里的应用就将整个分布式逻辑交给了底层,自己不用关心了。一旦与底层解耦,灵活性大大增加,更符合云原生的标准。 题目解析 本题的核心考查点还是如何让服务网格的控制面支撑大规模的 Sidecar 实例。为什么会产生这个问题呢?因为在目前服务网格影响最广的实现 Istio 架构中,控制平面 Pilot 负责整个系统的路由转译工作,也就是说所有服务的实例信息都需要通过 Pilot 下发给每一个 Sidecar,当然用户可以通过 SidecarScope 来设置个别 Sidecar 对于系统服务的可见性,但这只会影响到