机器学习

多模态机器学习,在线教育退课预测新进展!

别说谁变了你拦得住时间么 提交于 2020-12-06 03:09:05
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 在线教育场景下的学生退课行为预测,一直是机器学习(ML)与教育(EDU)交叉领域内较为火热的研究课题。 近年间,针对该方向的研究对象大多集中为大规模开放性在线课程(Massive Open Online Course, MOOC)的学生,通过收集 MOOC 平台上学生近期平台登录记录与相关网页埋点反馈数据,研究人员制作相关特征向量并结合机器学习模型算法,如Simple Logistic Regression、Gradient BoostingDecision Tree、Iterative Logistic Regression 等,对存在退课高风险的学生进行预测。 不同于针对MOOC平台学生的预测,当前研究领域对 K12 在线教育平台的学生退课预测还处于初期探索阶段。除此之外,在线 K12 教育平台的数据类型与 MOOC 平台数据相比存在更多模态,例如 K12 教育平台的学生在课前课后与平台顾问直接会产生沟通记录、课程进行过程中也会有相应的音视频记录等。因此,先前关于 MOOC平台的退课预测研究的方法与结论很难直接用于 K12 在线教育场景。 针对这些问题与特点,在2019年初,我们使用某K12在线教育1对1平台2018年秋冬季学期的学生历史行为数据

TensorFlow学习笔记4-线性代数基础

心已入冬 提交于 2020-12-06 03:05:00
TensorFlow学习笔记4-线性代数基础 本笔记内容为“AI深度学习”。内容主要参考《Deep Learning》中文版。 $X$表示训练集的设计矩阵,其大小为m行n列,m表示训练集的大小(size),n表示特征的个数; $W$表示权重矩阵,其大小是n行k列,n为输入特征的个数,k为输出(特征)的个数; $\boldsymbol{y}$表示训练集对应标签,其大小为m行,m表示训练集的大小(size); $\boldsymbol{y’}$表示将测试向量$x$输入后得到的测试结果; 几个概念 深度学习 如果想让计算机构建较简单的概念来学习复杂概念,我们可能需要一个深的(层次很多的)计算图,这种方法叫做 AI深度学习 。典型例子是 前馈神经网络 和 多层感知机(multilayer perceptron, MLP) 。 神经网络的 深度 的度量: 计算图的深度(计算层次) 概念图的深度(模型层次) 深度学习、机器学习与AI的关系如图: 表示学习 机器学习 需要特征集,但我们很难知道应提取什么特征。如:我们想识别出图片中是否有汽车,想到用车轮是否存在作为一个特征,但如何根据像素值去描述什么是车轮呢?这就需要 表示学习 。 表示学习 可帮助发现很好的特征集。 自编码器 表示学习 的典例是 自编码器 (autoencoder)。它希望: 输入数据$X$和输出数据$X’$尽可能保持一致;

波士顿房价预测

Deadly 提交于 2020-12-06 02:53:55
机器学习入门项目分享 - 波士顿房价预测 该分享源于Udacity机器学习进阶中的一个mini作业项目,用于入门非常合适,刨除了繁琐的部分,保留了最关键、基本的步骤,能够对机器学习基本流程有一个最清晰的认识; 项目描述 利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型,并对模型的性能和预测能力进行测试; 项目分析 数据集字段解释: RM : 住宅平均房间数量; LSTAT : 区域中被认为是低收入阶层的比率; PTRATIO : 镇上学生与教师数量比例; MEDV : 房屋的中值价格(目标特征,即我们要预测的值); 其实现在回过头来看,前三个特征应该都是挖掘后的组合特征,比如RM,通常在原始数据中会分为多个特征:一楼房间、二楼房间、厨房、卧室个数、地下室房间等等,这里应该是为了教学简单化了; MEDV为我们要预测的值,属于回归问题,另外数据集不大(不到500个数据点),小数据集上的回归问题,现在的我初步考虑会用SVM,稍后让我们看看当时的选择; Show Time Step 1 导入数据 注意点: 如果数据在多个csv中(比如很多销售项目中,销售数据和店铺数据是分开两个csv的,类似数据库的两张表),这里一般要连接起来; 训练数据和测试数据连接起来,这是为了后续的数据处理的一致,否则训练模型时会有问题(比如用训练数据训练的模型,预测测试数据时报错维度不一致); 观察下数据量

PDF下载,《100道Python面试题》

筅森魡賤 提交于 2020-12-05 21:27:54
这是行哥之前面试Python工作时候的复盘题目总结,从 Python基础知识、到正则表达式、网络基础、数据库、Linux进行归纳解答, 非常全面 , 同时制作成了32页pdf面试手册,截图如下 领取方式: 需要的话可以长按扫码关注行哥的公众号【一行数据】,发消息 [面试],即可领取 长按扫码, 发消息 [ 面试 ],即可领取 长按扫码关注 同时也分享下行哥之前学习 Python 时候的学习资料,从 Python 基础语法、到 web 开发、数据爬虫、数据分析、机器学习、深度学习、量化分析统统都有,该手册是 HTML 版本,左侧是目录,可以点击,右侧是对目录知识点的讲解,非常适合 python 学习者,对某些知识点不熟悉的话,将页面保存到浏览器书签,可以快速在没网的情况下查找知识点,总计有 200 多页! 长按扫码, 发消息 [ 面试手册 ],即可领取 长按扫码关注 Python 知识手册 Linux 知识手册 网络编程、正则、mysql 知识手册 爬虫查询手册 数据分析知识手册: 机器学习知识手册: 深度学习知识手册: 金融量化知识手册: 资料领取: 扫码后台回复: 学习手册 ,即可获取电子版 当然后台回复还有 “赚钱” , ”python“ 等学习大礼包等领取哦 长按扫码关注 本文分享自微信公众号 - 机器学习算法与Python实战(tjxj666)。 如有侵权,请联系

“达观杯”文本智能处理冠军分享:深度学习文本分类

£可爱£侵袭症+ 提交于 2020-12-05 20:53:24
向AI转型的程序员都关注了这个号 👇👇👇 机器学习AI算法工程 公众号: datayx PPT下载地址 关注微信公众号 datayx 然后回复 文本分类 即可获取。 AI项目体验地址 https://loveai.tech 阅读过本文的人还看了以下: 分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码 《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码 《深度学习之pytorch》pdf+附书源码 将机器学习模型部署为REST API FashionAI服装属性标签图像识别Top1-5方案分享 重要开源!CNN-RNN-CTC 实现手写汉字识别 yolo3 检测出图像中的不规则汉字 同样是机器学习算法工程师,你的面试为什么过不了? 前海征信大数据算法:风险概率预测 【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类 VGG16迁移学习,实现医学图像识别分类工程项目 特征工程(一) 特征工程(二) :文本数据的展开、过滤和分块 特征工程(三):特征缩放,从词袋到 TF-IDF 特征工程(四): 类别特征 特征工程(五): PCA 降维 特征工程(六): 非线性特征提取和模型堆叠 特征工程(七):图像特征提取和深度学习 如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

下载!《Python面试大全》PDF版

心不动则不痛 提交于 2020-12-05 20:41:39
往期下载 下载!5000 页 Java 技术栈 PDF 手册 下载!343页经典书籍《算法之道(第二版)》 下载!《手把手AI项目》手册 下载!国外优质书籍《数字图像处理》电子版 下载!《机器学习基础》第二版正式开放下载 下载!《TensorFlow 2.0 深度学习算法实战》中文版(附随书代码+pdf) 下载!微软出品的最新 Kubernetes 学习指南 3.0 中文开源!《Python数据科学》PDF下载 下载!闲鱼最新升级版 Flutter 技术电子书! 下载!Springer 面向公众开放数据挖掘、编程、机器学习、数学、深度学习、数据科学等 65本电子书籍 下载!Python 密码学入门书籍 下载!《Java 编程思想》中文版! 2020最新版《神经网络与深度学习》中文版 pdf 开放下载 下载!Python 初学者经典教材 PDF课件下载!《用Python玩转数据》 下载!81 页计算机视觉学习指南 经典!《MySQL性能调优手册》高清电子版,限时 3 天免费下载 PDF下载!《数据结构与算法Python版》 下载!《工业智能白皮书》 下载!PyTorch中文版官方教程 InfoQ电子书下载:《前端面试指南》 《统计机器学习与凸优化》教程 PPT 下载 泰山版!Java开发手册开放下载 Pandas官方文档中文版下载、图形深度学习 PPT 下载 200页

2020-12-03

▼魔方 西西 提交于 2020-12-05 17:58:39
推荐系统实战之 特征工程 前言 本次特征工程任务我主要从理论出发,加强对推荐系统的特征工程的了解。本文主要参考了王喆大佬的《深度学习推荐系统》,将从推荐系统的视角出发,结合本次 新闻推荐比赛 的实际案例,探讨推荐系统的特征工程。 数据决定了机器学习模型的上限,特征则是对数据的表达,特征工程就是利用工程化的方法寻找对数据更好的表达。在推荐系统中,数据分为用户信息、物品信息和场景信息。推荐系统的特征工程就是利用工程手段从“用户信息”“物品信息”“场景信息”中提取特征的过程。 构建推荐系统特征工程的原则 由于用户的行为数据是原始的,是具体的,要从中抽取出某种数学形式的特征,就涉及到信息的损失。另一方面,用户的行为数据中又有很多冗余的、无用的信息,这些信息都考虑进来会损害模型的泛化能力。因此,构建推荐系统特征工程的原则是: 尽可能地让特征工程抽取出的一组特征能够保留推荐环境及用户行为过程中的所有有用信息,尽量摒弃冗余信息 在本次新闻推荐场景中,从我的角度考虑对我重要的新闻有: 对新闻的类型偏好(如科技、旅游、非娱乐) 新闻的热门程度(如抗疫、时事) 新闻相关程度(如嫦娥5号系列报道) 新闻发出的时间(大多新闻都会在饭点看) 看是由哪个订阅号发的新闻(保证权威性及类型偏好) 看新闻时的状态(烦躁时会看些有趣的) 将这些要素转换成特征,基于本次新闻推荐多路召回后的数据,即(用户,新闻

Python核心资料:Django+Scrapy+Hadoop+数据挖掘+机器学习+精选视频(免费领)

给你一囗甜甜゛ 提交于 2020-12-05 16:53:40
现在转 Python 还来得及吗?来得及!目前企业招聘 Python 相关岗位的需求很大,现在上车虽然稍晚,但刚好也是 Python 的红利期。学会 Python 可以做测试开发、运维、Python Web 开发,还可以做爬虫、数据分析、数据挖掘、算法、人工智能等高薪岗位。 最近花了很长时间整理了很多 Python 基础+爬虫+数据挖掘+人工智能核心资料 ,有视频,也有学习文档,遇到问题直接打开文档学一学就好了!今天分享给你!也能给你节省很多时间,底部加好友领取福利吧! 一、Python 基础入门 Python 安装包 Python开发环境、函数应用、文件操作、面向对象、异常处理 二、Python 高级知识点讲解 网络编程、并发编程、数据库 Linux 系统应用 Python 语法进阶 HTML、CSS 三、Web开发精选好文+项目实战 Django 框架环境搭建及入门案例 ORM 原理及数据库配置 项目实战:CSDN 微课商城开发实战 四、Python 爬虫精选好文 网络爬虫基础知识大全 Hader 伪装与模拟登陆 如何使用Scrapy 框架、Middleware中间件 数据持久化储存开发方式 Redis 可视化工具的使用 项目实战:Python分布式爬虫+数据分析 项目实战:2020最新热点反爬机制与绕过 五、数据分析与数据挖掘工具+实战项目 数据分析好助手 Jupyter

信息安全四大顶会

蓝咒 提交于 2020-12-05 10:01:24
最近才了解到国际上安全领域的顶级会议【羞愧、自省....... 安全界有四大著名顶级会议,简称:S&P、CCS、Security、NDSS。 #一、USENIX Security 1、官网: https://www.usenix.org/conference/usenixsecurity14/technical-sessions 2、介绍: USENIX最开始其实是UNIX,但是由于商标问题后来改为USENIX,具体过程可以参见维基百科USENIX。USENIX 其实是一个计算机类会议的总称,详细会议列表可以看这里,而USENIX Security只是USENIX中的安全会议,并且USENIX Security会议涵盖的安全领域也非常多,包含:二进制安全、固件安全、取证分析、Web安全、隐私保护、恶意分析等。 3、论文下载: 会议的论文直接在官网提供下载,也有很多格式(PDF、EPUB、MOBI)。 #二、S&P:IEEE Symposium on Security and Privacy 1、官网: http://www.ieee-security.org/TC/SP-Index.html 2、介绍: S&P又分为两类:SP Conference Information、SP Workshops Information。 3、论文下载: 1

iPhone为盲人自动识别并标记按钮和UI功能

梦想的初衷 提交于 2020-12-05 09:57:25
苹果一直不遗余力地为残障用户构建功能,iOS上的VoiceOver对于视力障碍的人来说是无价的工具,假设界面的每个元素均已手动标记。但是该公司刚刚推出了一项全新功能,该功能使用机器学习来自动识别并标记每个按钮,滑块和标签。 屏幕识别(iOS 14中现已提供)是一种计算机视觉系统,已经对正在使用的应用程序的数千张图像进行了培训,可以学习按钮的外观,图标的含义等。 现在在任何应用程序中,用户都可以调用该功能,并且在不到一秒钟的时间内,屏幕上的每个项目都将被标记。 在iOS 13中,苹果自动为图标添加了标签,屏幕识别又向前迈出了一步。我们可以查看屏幕上的像素,并确定可以与之交互的对象的层次结构,所有这些操作都在设备上的十分之一秒之内发生。 佛山市东联科技有限公司表示:“这项新功能应有助于使数以百万计的应用程序更容易被视力障碍的用户完全可以访问。” 您可以通过以下方法打开它:“辅助功能”设置,然后依次选择“ VoiceOver”和“ VoiceOver识别”,在此处可以打开和关闭图像,屏幕和文本识别。(欢迎转载分享) 来源: oschina 链接: https://my.oschina.net/u/4283198/blog/4775765