数据分析能力

整理的机器学习资源大全

假如想象 提交于 2019-12-07 14:48:16
本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。 伯乐在线已在 GitHub 上发起「机器学习资源大全中文版」的整理。欢迎扩散、欢迎加入。 https://github.com/jobbole/awesome-machine-learning-cn C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV —它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。 通用机器学习 MLPack DLib ecogg shark Closure 通用机器学习 Closure Toolbox —Clojure语言库与工具的分类目录 Go 自然语言处理 go-porterstemmer —一个Porter词干提取算法的原生Go语言净室实现 paicehusk —Paice/Husk词干提取算法的Go语言实现 snowball —Go语言版的Snowball词干提取器 通用机器学习 Go Learn — Go语言机器学习库 go-pr —Go语言机器学习包. bayesian —Go语言朴素贝叶斯分类库。 go-galib —Go语言遗传算法库。 数据分析/数据可视化 go-graph —Go语言图形库。 SVGo

资深程序员对于Python各个方向的面试经验分享,非常给力!

99封情书 提交于 2019-12-06 14:23:33
之前早有前辈们说过,"裸辞一时爽,一直裸辞一直爽",这话一点不假,裸辞你要面临没有收入来源,但是每天眼睁睁看着各种花销不断支出的煎熬,我主要是觉得一边在上家公司工作一边去下家面试可能要经常请假,不太方便(事实证明也确实是这样的,面试并不是每次面试都能通过,即使有些一面通过,但还会邀约二面),并且还有点自己的事情需要处理,所以才裸辞,我非常不建议在目前的大环境下裸辞,能好好待还是好好待着。 小编给新手准备了学习资料书籍、包括软件也有都放在这里了http://note.youdao.com/noteshare?id=b5112fabf98b421192c6e34dc56bf080 说一些面试的心得体会: 1、简历制作 我做了两份简历,用两个手机账号,两个简历名字,分别在各个招聘网站投了双份简历,一个是数据分析的简历、一个是web全栈开发的简历,我真正接触python快2年,不管是学习还是工作学到的东西,这两年大概掌握了(前端+django+爬虫+数据分析+机器学习+NLP+Linux)技术,技术水平自我评价一般,够日常一般使用,基于自己掌握的技术可以分成2方面,web和数据分析,所以为了尽快找到工作,就做了web全栈开发+数据分析(含爬虫)2份简历,同时投递 2、面试安排 疯狂投简历,2个账号多个平台同时投,每天接到2-4个面试邀约电话,每天安排2到3家面试,一般上午1家

国外程序员整理的机器学习资源大全

怎甘沉沦 提交于 2019-12-05 21:55:50
 英文原文: awesome-machine-learning   本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。    C++    计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV —它提供C++, C, Python, Java 以及 MATLAB 接口,并支持 Windows, Linux, Android and Mac OS 操作系统。    通用机器学习 MLPack DLib ecogg shark    Closure    通用机器学习 Closure Toolbox —Clojure 语言库与工具的分类目录    Go    自然语言处理 go-porterstemmer —一个 Porter 词干提取算法的原生 Go 语言净室实现 paicehusk —Paice/Husk 词干提取算法的 Go 语言实现 snowball —Go 语言版的 Snowball 词干提取器    通用机器学习 Go Learn — Go 语言机器学习库 go-pr —Go 语言机器学习包. bayesian —Go 语言朴素贝叶斯分类库。 go-galib —Go 语言遗传算法库。    数据分析/数据可视化 go-graph —Go 语言图形库。 SVGo —Go 语言的 SVG 生成库。    Java   

数据埋点是什么?设置埋点的意义是什么?

大憨熊 提交于 2019-12-04 15:47:32
工作之后经常听到数据埋点这个词,但不明白埋点是什么。一下答案参考知乎大神的答案 知乎原文:https://www.zhihu.com/question/36411025 第一个答案 作者:大头鱼 链接: https:// zhuanlan.zhihu.com/p/25 195217 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 所谓埋点就是在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是提供运营的数据支撑,包括访问数(Visits),访客数(Visitor),停留时长(Time On Site),页面浏览数(Page Views)和跳出率(Bounce Rate)。这样的信息收集可以大致分为两种:页面统计(track this virtual page view),统计操作行为(track this button by an event)。 数据埋点的方式 现在埋点的主流有两种方式: 第一种:自己公司研发在产品中注入代码统计,并搭建起相应的后台查询。 第二种:第三方统计工具,如友盟、神策、Talkingdata、GrowingIO等。 如果是产品早期,通常会使用第二种方式来采集数据,并直接使用第三方分析工具进行基本的分析。而对于那些对数据安全比较重视,业务又相对复杂的公司则通常是使用第一种方式采集数据

详解阿里云数据中台,一篇文章全面了解大数据“网红”

。_饼干妹妹 提交于 2019-12-02 19:17:03
作者:谭虎、陈晓勇 [ 更多内容详见数据中台官网 https://dp.alibaba.com ] 一直想写一篇关于数据中台正面文章,现在有闲时做些总结,想充分诠释一下DT内部人如何看待数据中台。 数据中台的概念是最早由阿里巴巴首次提出,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。 数据中台的定义 阿里巴巴数据中台是阿里云上实现数据智能的最佳实践,它是由数据中台方法论+组织+工具所组成,数据中台方法论采用实现企业数据的全局规划设计,通过前期的设计形成统一的数据标准、计算口径,统一保障数据质量,面向数据分析场景构建数据模型,让通用计算和数据能沉淀并能复用,提升计算效能;数据中台的建设实施必须有能与之配合的组织,不仅仅相应岗位的人员要配备齐全,而且组织架构建设也需要对应,有一个数据技术部门统筹企业的数字化转型,数据赋能业务中形成业务模式,在推进数字化转型中实现价值;数据中台由一系列的工具和产品组成,阿里云数据中台以智能数据构建与管理Dataphin产品、商业智能QuickBI工具和企业参谋产品为主体等一系列工具组成。

我裸辞去面试Python岗位了

坚强是说给别人听的谎言 提交于 2019-11-29 18:30:28
最近换工作了,坐标上海,裸辞,之前早有前辈们说过,"裸辞一时爽,一直裸辞一直爽",这话一点不假,裸辞你要面临没有收入来源,但是每天眼睁睁看着各种花销不断支出的煎熬,我主要是觉得一边在上家公司工作一边去下家面试可能要经常请假,不太方便(事实证明也确实是这样的,面试并不是每次面试都能通过,即使有些一面通过,但还会邀约二面),并且还有点自己的事情需要处理,所以才裸辞,我非常不建议在目前的大环境下裸辞,能好好待还是好好待着。 说一些面试的心得体会: 1、简历制作 我做了两份简历,用两个手机账号,两个简历名字,分别在各个招聘网站投了双份简历,一个是数据分析的简历、一个是web全栈开发的简历,我真正接触python快2年,不管是学习还是工作学到的东西,这两年大概掌握了(前端+django+爬虫+数据分析+机器学习+NLP+Linux)技术,技术水平自我评价一般,够日常一般使用,基于自己掌握的技术可以分成2方面,web和数据分析,所以为了尽快找到工作,就做了web全栈开发+数据分析(含爬虫)2份简历,同时投递 2、面试安排 疯狂投简历,2个账号多个平台同时投,每天接到2-4个面试邀约电话,每天安排2到3家面试,一般上午1家,下午的话一般我尽量安排离得近的公司面试,2点一家,4.30一家,基本时间上都还来得及,只不过这样确实比较赶 3、公司及面试情况 邀约面试的电话,从数量来看,涵盖web开发