机器学习

万物皆可 Serverless 之云函数 SCF+Kaggle 端到端验证码识别从训练到部署

眉间皱痕 提交于 2020-12-19 08:48:23
随着验证码技术的更新换代,传统的验证码识别算法已经越来越无用武之地了。近些年来人工智能迅速发展,尤其是在深度学习神经网络这一块生态尤为繁荣,各种算法和模型层出不穷。 本文来自 Serverless 社区用户「乂乂又又」供稿 今天本文就尝试带大家借助 Kaggle+SCF 快速训练部署一个端到端的通用验证码识别模型,真正的验证码识别从入门到应用的一条龙服务,哈哈哈~ 效果展示 操作步骤 第一步:了解 kaggle 没做过数据科学竞赛的同学,可能不太了解 kaggle 哈。 Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. 这是 kaggle 官网 )的自我介绍,简单来说 kaggle 是全球最大的数据科学交流社区,上面有许多关于数据科学的竞赛和数据集,并且提供了一些数据科学在线分析的环境和工具,一直以来吸引了全球大批数据科学爱好者,社区极其繁荣。 这里我们主要是用 kaggle 的 Notebooks 服务里的 kernel 环境来快速在云端训练自己的验证码识别模型。 你可能会问在本地训练不可以吗,为啥非得折腾着上云?哈哈,这还真不是折腾,普通人的电脑算力其实是有限的

六星教育创始人

时光总嘲笑我的痴心妄想 提交于 2020-12-19 07:42:06
六星教育创始人Pack老师 资深架构师、六星负责人 2008年,Pack老师成立杰越云信息企业,随后研发出内部独有的云平台系统,可承载千万级并发量,业内轰动一时,引起广泛关注。 2016年,Pack老师创办六星教育企业,专注培养高级精英IT技术人才。随着成立六星在线教育事业部,并设六星VIP教学中心,提供了更多“人人平等”的学习机会。 2017年,六星教育成为IT类目编程语言认证机构及年度最具影响力机构。 2018年,再次创办子公司——杰越云信息全资软件开发公司,为学员提供了大批实习实训机会,与六星教育、杰越学院形成教学管理、辅导服务、实训平台三法合一的企业成熟模式。 随着授课人数的增加,已累计为 30W+学员进行授课讲解,业内盛名远扬,权威性十足。 至今,Pack老师 作为教研技术团队负责人,始终坚守岗位一线。他曾任 IBM、拓维等上市企业架构师、开发主管等职, 有 12年大型项目研发经验。 熟练PHP、大数据web架构技能,精通开源框架运用和Linux参数配置及优化。具有大容量高并发电商应用架构设计、Hadoop大数据云平台等项目架构经验,并有多年企业专业培训经验。 课堂氛围轻松,注重寓教于乐,善于剖析原理,深入浅出,对技术有独特见解,深受学生好评。 为企业输送大量 IT技术精英人才,给互联网行业连番注入新鲜血液,推动了整个社会经济的发展。 人生格言: 身为世范,为人师表

技术领导者的知识储备

吃可爱长大的小学妹 提交于 2020-12-19 04:01:49
陆游有诗云:书到用时方恨少,事非经过不知难。我们常常在需要用到某些知识的时候,才发现自己没有储备,只好来一句“我读书少,您不要骗我”。做事也一样,虽然我们可以预估它的难度,但这种预估往往会偏离实际,甚至没有经历过的人,本来挺难的事情也会认为很简单,口头禅是“这事情也就毛毛雨啦”,可谓无知者无畏。 这两句诗反映的现象,在每个人的生活中都应该是一种常态,不得不佩服陆诗人善于观察善于提炼的能力。佩服完了,我们还是希望这种现象更少一些,简单来说,就是要多进行知识储备,多做事情来历练。 闲扯完毕,进入正题:作为一个技术领导者,如何做好你的知识储备呢?虽然我早前在拙作《漫谈中小企业研发技术栈》中有类似内容,但没过瘾,在这里还想再谈一谈。 在我看来,作为一个技术领导者,应该是个多面手,而且最好还要在某一方面相对精深。在自己不精深的领域,了解整个概貌也许就可以了,但在需要的时候,具有随时深入领域细节的能力。而这种随时深入细节的能力,是你之前就已经在某个领域精深过,通过举一反三,可以知道如何深入到另外的领域知识里面。从这个角度来看,要融会贯通,首先需要渊博,要可以随时深入某个陌生领域的细节,首先要具有曾经深入过其它一些领域细节的经历。 技术领导者因为精力分配的原因,往往不再是某方面的技术专家,但已有的经验可能让他具有更好的嗅觉,知道应该往哪个方向走,哪个方向坑少一些。这样的话

算法面经大乱斗Plus

為{幸葍}努か 提交于 2020-12-19 00:09:11
作者 | huasdahadi 整理 | NewBeeNLP 面试锦囊之 面经分享 系列,持续更新中 写在前面 现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。 先介绍一下我自己的情况,我本科211,硕士985,软件工程专业。我投的都是算法岗,最后有幸拿到了腾讯、百度、美团、网易游戏、华为公司的offer。19年秋招中算法岗竞争很大,不过20年情况貌似更惨了,大家加油。 面试建议 我对于秋招、春招的建议,其中最重要的一点就是一定要多投简历多面试、积极主动(对于很厉害的人,当我没说😑)。因为每个人的侧重点不同,把过多的时间放在看帖子、复习基础上,可能会导致走偏了还一直没有发现,面试可以看出来哪些东西是重要的,纠正方向。 多投简历多面试可以针对性的发现自己的问题,一定要记录面试内容,方便后续复习。 积极主动更加重要,有很多的情况是投完简历就石沉大海,能获得面试的机会寥寥无几。我的建议是尽量找内推,至少保证自己的简历被看到,一旦发起面试,要主动跟进面试流程。 可能大家都懂这些道理,但是据我观察到的,做到这样子的真的不多! 废话就说到这里,下面是一些实际操作!! 秋招面试一般有笔试+三次技术面+hr面。 笔试在线上做一些题目 一面问基础知识和做一些算法题目。 二面会问一些项目或者场景题,但是如果一面的算法题目做的不好,也会继续做做题目。

2020年5月程序员工资统计,平均14542元

风流意气都作罢 提交于 2020-12-19 00:04:25
平均工资 2020年5月全国招收程序员312761人。2020年5月全国程序员平均工资14542元,工资中位数12500 元,其中95%的人的工资介于5250元到35000元。 一线城市工资 主要城市工资 职能与工资 普通软件工程师这一年的工资增长了1000元,你的工资增加了么? 数据异常检查 首先我们会对数据异常进行检查,方法就是用各种指标监视数据异常。比如,我们会把工资变化大于1000的城市找出来。 如下图: 这里,我们发现济南有一家公司校招300人,而且重复发了5次。这样就严重的降低了济南的平均工资。 于是,我们增加了一条新的规则,所有的应届生都删除。这样可以保证数据的稳定。 编程语言比例 scala的工资是2万,我想,这应该是大数据程序员。python的工资是1万8,应该是机器学习工程师。 你拖后腿了吗? 来源:https://blog.csdn.net/juwikuang/article/details/105875849 作者:有数可据 本文分享自微信公众号 - 前端宇宙(gh_8184da923ced)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源: oschina 链接: https://my.oschina.net/u/4585038/blog/4394382

2020年5月程序员工资统计,平均14542元,我又拖后腿了!

最后都变了- 提交于 2020-12-18 21:42:22
作者:有数可据 来源:https://blog.csdn.net/juwikuang/article/details/105875849 今天,看到一篇关于程序员工资统计的文章,给大家分享一下,希望能给各位同学有所参考,毕竟数据来源于招聘网站,可能与实际情况有所偏差。总体来说,应该有不少同学被平均了,整体上来说,应该还是在正态分布的范围内。 # 平均工资 2020年5月全国招收程序员312761人。2020年5月全国程序员平均工资14542元,工资中位数12500 元,其中95%的人的工资介于5250元到35000元 # 一线城市工资 2020年5月 北京 招收软件工程师24478人。2019年5月北京软件工程师平均工资19273元,工资中位数17500元,其中95%的人的工资介于7000元到45000元。 2020年5月 上海 招收软件工程师51403人。2019年5月上海软件工程师平均工资17477元,工资中位数15500元,其中95%的人的工资介于7000元到40000元。 2020年5月 深圳 招收软件工程师44509人。2019年5月深圳软件工程师平均工资17052元,工资中位数15000元,其中95%的人的工资介于7000元到37500元。 2020年5月 杭州 招收软件工程师20042人。2019年5月杭州软件工程师平均工资15089元,工资中位数12500元

台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

五迷三道 提交于 2020-12-18 18:26:05
台湾大学林轩田机器学习基石课程学习笔记15 -- Validation 上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决。在之前的Ein上加上一个regularizer,生成Eaug,将其最小化,这样可以有效减少模型的复杂度,避免过拟合现象的发生。那么,机器学习领域还有许多选择,如何保证训练的模型具有良好的泛化能力?本节课将介绍一些概念和方法来解决这个选择性的问题。 1 Model Selection Problem 机器学习模型建立的过程中有许多选择,例如对于简单的二元分类问题,首先是算法A的选择,有PLA,pocket,linear regression,logistic regression等等;其次是迭代次数T的选择,有100,1000,10000等等;之后是学习速率η的选择,有1,0.01,0.0001等等;接着是模型特征转换Φ的选择,有linear,quadratic,poly-10,Legendre-poly-10等等;然后是正则化regularizer的选择,有L2,L1等等;最后是正则化系数λ的选择,有0,0.01,1等等。不同的选择搭配,有不同的机器学习效果。我们的目标就是找到最合适的选择搭配,得到一个好的矩g,构建最佳的机器学习模型。 假设有M个模型,对应有H1,H2,⋯,HM,即有M个hypothesis

为什么大家都在吹捧Python?

二次信任 提交于 2020-12-18 14:04:50
随着AI时代和大数据的到来,Python语言更是大放异彩,至今没有哪一种语言可以在 爬虫、数据分析、AI、web开发、运维、测试等众多领域 中应用,其也 逐渐成为一种小白接触编程世界的一条捷径 ,在PYPL编程语言排行榜中更是常占据着第一的位置。 虽然Python到了人尽皆知的火热程度,但据《互联网人才趋势白皮书》显示,即使有大批IT从业人员转型Python开发, 人工智能与大数据的高速发展之下仍有大基数人才缺口 ,谷歌、YouTube、Facebook、阿里、百度、字节跳动、新浪等名企大厂对Python技术栈开发工程师求贤若渴。 学习Python已然成为一种趋势,也是一种必然,但对于Python初学者来讲,经常在基础部分就放弃了,原因无非是:资料太多!看不完!应用方向太多!不知道该怎么选!基础薄弱!找不到精细讲解! 别急,我们为你准备的最全视频学习资料大礼包中的 系列一《数据分析与Python程序设计》 包括七大内容,助力学习入门到进阶: Python数据智能编程基础 Python格式化数据处理-Pands 数据可视化 网络信息分析 文本信息自动化处理 Python办公自动化 服务器、数据库与分布式系统 左右滑动查看 左右滑动查看 如果你想要入门并深入学习人工智能,掌握数据分析与Python程序设计,提高自己的能力,实现人生的进阶,那这份最强视频教学资料包是绝对不容错过,

[软工]第一次软工作业

一笑奈何 提交于 2020-12-18 13:23:58
031502548;我是<font color=green size=5>宋奕</font>;我的爱好是发呆;我最喜欢骨汤水饺(玫瑰一层);All time low;南柯一梦,心想事成。 回想一下你初入大学时对计算机专业的畅想 当初你是如何做出选择计算机专业的决定的 我选择计算机的原因是家学渊源,我的舅舅是个成功的程序员,他对于计算机的前景很看好,所以成功说服了我,让我报了计算机。 你认为过去两年中接触到的课程是否符合你对计算机专业的期待,为什么? 我认为不是很符合我对计算机的期待,因为在过去两年的课程中,我们涉及到的硬件知识偏多,而且现在的硬件更新换代很快,教授的课程并不能跟上时代,而且我们所学的语言,偏学术,并不能适用于以后在公司的使用,正如博客B的作者所言,“我们的授课老师,却只讲最简单的概念和不深的理论描述,给我的感觉就是,“数据结构”几乎是门和“离散数学”差不多的数学课——他用最肤浅的知识,“成功地”告诉了我们“数据结构”是门几乎不用动手写程序的课程,只用上课听听就好了。于是乎,一门需要动手实践、将会极大地提高我们编程素养和思维能力的课程,就被我们这样迷迷糊糊上完了。”,现在阶段我们的教学就是这样,理论有余,而实践不足。 你觉得计算机是你喜欢的领域吗,它是你擅长的领域吗? 我觉得我对计算机还是很热爱的,现在本科生谁敢在计算机说擅长呢?计算机因其特性,永远无法完全说擅长。

Kubernetes与OpenStack合体了,来自Mirantis

强颜欢笑 提交于 2020-12-18 13:09:33
上周,Mirantis推出了Mirantis OpenStack for Kubernetes。这是一个开源云管理框架的实例,其中所有组件都封装在容器中。 Mirantis的CTO Shaun O'Meara表示,这种方法使得用Kubernetes来编排这些容器成为可能。 Mirantis OpenStack for Kubernetes是Mirantis Cloud Native Platform一系列改进中的第一个——Mirantis Cloud Native Platform是基于Kubernetes的一系列产品,其中包括Mirantis Container Cloud(之前称为Docker Enterprise,由Mirantis在去年收购)。 O'Meara说,目标是使部署、管理和更新一个广泛使用的云管理框架更加容易,该框架在开放基础设施基金会(Open Infrastructure Foundation)的支持下继续得到改进。 O'Meara指出,这种方法还可以在虚拟机或裸金属服务器上部署OpenStack,甚至OpenStack最频繁部署的基于内核的虚拟机(KVM)也被封装在一个容器中。 O'Meara指出,Kubernetes的裸金属实例正在金融服务公司、基于机器学习算法构建人工智能(AI)应用程序的组织和电信运营商兴起—