知识图谱

人机智能既不是人类智能,也不是人工智能

依然范特西╮ 提交于 2020-05-04 14:08:53
来源:人机与认知实验室 从前,一个教授,去一个穷乡僻壤里头坐船过江,就问船上的船工:你学点数学没有?没有。你学点物理没有?没有。那懂不懂计算机啊?不懂。 教授感叹这三样都不会,你的人生已经失去了一半。隔了一会乌云密布,狂风四起,船工问:你会游泳吗?教授说不会。“那你可能要失去整个生命了!” 人机融合就是把教授和船工结合起来的智能 根据过去数据计算现在和未来是数学常用的手段,根据未来期望算计现在和过去才是人智的方法。 我们知道的远比我们说出来的要多得多,我们不知道的远比我们知道的要多得多,我们不知道我们不知道的远比我们不知道的要多得多…… 人类的感觉刺激、信息是动态分类,聚类,不是一次完成的,而是多次弥聚变化的(这种轮回机制目前尚未搞清楚)。 大道无形的道是碎片的、流性的……所以正是零碎的规则、概率、知识、数据、行为构成了人的智能,即在千奇百怪的日常异构活动情境中生成演化出来的。人智,从一开始就不是形式化、逻辑化的,而且人的逻辑是为非逻辑服务定制的,机器则相反,从一开始就是条理化了、程序化的,也是为人的非逻辑服务的。 本质上,数据的标记与信息的表征不同之处在于有无意义的出现,意义即是否理解了可能性。机涉及的表征体系虽然是人制定赋予的,但一诞生就已失去了本应的活性,即意向性参与下的各种属性、关系灵活连接和缝合,而人的诸多表征方式则常常让上帝都不知所措:一花一世界,一树一菩提

深度解析Graph Embedding

℡╲_俬逩灬. 提交于 2020-05-04 11:14:31
Graph Embedding是推荐系统、计算广告领域最近非常流行的做法,是从word2vec等一路发展而来的Embedding技术的最新延伸;并且已经有很多大厂将Graph Embedding应用于实践后取得了非常不错的线上效果。 word2vec和由其衍生出的item2vec是embedding技术的基础性方法,但二者都是建立在“序列”样本(比如句子、推荐列表)的基础上的。而在互联网场景下,数据对象之间更多呈现的是图结构。典型的场景是由用户行为数据生成的 物品全局关系图 ,以及加入更多属性的物品组成的 知识图谱 。 在面对图结构的时候,传统的序列embedding方法就显得力不从心了。在这样的背景下,对图结构中间的节点进行表达的graph embedding成为了新的研究方向,并逐渐在深度学习推荐系统领域流行起来。 DeepWalk 早期影响力较大的graph embedding方法是2014年提出的DeepWalk,它的主要思想是在由物品组成的图结构上进行随机游走,产生大量物品序列,然后将这些物品序列作为训练样本输入word2vec进行训练,最大化随机游走序列的似然概率,并使用最终随机梯度下降学习参数,得到物品的embedding。其目标函数为: $$ \zeta(s)=\frac{1}{|s|} \sum_{i=1}^{|s|} \sum_{i-t \leq j \leq

【二食堂】Alpha- 发布声明

假如想象 提交于 2020-05-02 07:44:10
MarkTexting Alpha版本发布声明 今日我们的 MarkTexting 正式上线了! 功能介绍 我们实现了一个简单的文本标注生成知识图谱的网站,在Alpha阶段,我们实现的功能有: 登陆注册 退出登录 添加/删除实体 添加实体之间的关系 知识图谱的渲染生成 其他功能 登陆注册 退出登录 实体的添加和删除 添加关系和知识图谱的生成 Alpha版本修复的缺陷 当前版本为团队初次开发,在开发过程中遇到的一些问题详细请参考 测试报告 。 对运行环境的要求 经测试,以下浏览器: Chrome Firefox Edge(新、旧版均可) 搜狗浏览器 猎豹安全浏览器 可以正常使用本网站的所有功能, 推荐使用 。 360安全浏览器 360极速浏览器 QQ浏览器 以上浏览器请在 极速内核 的模式下使用本网站。 不推荐 :IE浏览器、UC浏览器。 安装方法 请直接访问地址: http://114.115.250.237/user/index/ Alpha版本已知的问题和限制 问题 : IE浏览器以及使用IE内核模式的浏览器,在用户未登录情况下不能重定向到登录注册页面 点击添加后文本区域会清空,用户上传的文本没有被保存 个人中心页面的修改个人信息功能还未实现 限制 : 核心功能实现不完整,在文本区域页面的用户交互设计得不是很好。 目前实体之间只支持三种关系的添加,在Beta阶段会添加。

人工智能怎么教?清华张钹院士刚刚给我们讲了一堂课

人盡茶涼 提交于 2020-05-01 21:41:09
今天上午,张钹院士畅谈了清华是怎样办人工智能专业的。 机器之心报道,参与:泽南、蛋酱。 在上一个十年里,我们见证了人工智能的「复兴」,见证了人工智能技术对于众多行业的颠覆性变革,也感受到了人工智能对每个人生活的深刻影响。随之而来的,人工智能专业也成为了当前高校中最热门的专业之一。 2020 年 3 月,教育部公布的新增备案本科专业名单中,约 180 所高校通过了新增人工智能专业的审批,其中既包括理工类、综合类高校,也包括语言类、医药类等专业性较强的高校。 有人说,人工智能是当前最好的计算机专业。 但作为新兴专业,如何办好还需要教育者们的大量探索。 4 月 30 日,中国科学院院士、清华大学人工智能研究院院长张钹为分享了关于清华大学计算机系人工智能专业建设的经验与思考。 在著名计算机科学排名「CS Ranking」中,清华大学的人工智能学科在 2010 年至今排名仅次于 CMU,如果时间拉近到 2015 年至今范围内,清华则排名第一。 清华大学计算机系成立于 1958 年,是我国计算机学科领域教学水平最高、科研综合实力最强、影响力最广的计算机系之一。 2018 年 6 月 28 日,清华大学人工智能研究院正式成立。中国科学院院士、清华大学计算机系教授张钹出任首任院长,图灵奖获得者、清华大学交叉信息研究院院长姚期智担纲学术委员会主任。 一年后,清华大学宣布成立「人工智能学堂班」,也就是

言图科技:GPU服务器选型

微笑、不失礼 提交于 2020-05-01 07:46:11
公司简介 言图科技总部位于武汉光谷,致力于人工智能领域的自然语言处理、图像处理基础算法、软件、平台与设备研发。目前,公司拥有成熟的自然语言处理基础软件集、语义理解工具集、知识图谱工具集、智能陪练机器人、聊天机器人、情感与专注度分析工具、无人机大数据分析服务器系统等多种产品,并被多家金融集团、大型国企、科研机构与政府机关采用。公司在积极开拓市场的同时,投入大量资金进行基础研究。 公司与华中科技大学计算机学院共同组建“华中科技大学计算机学院人工智能实验室”。 而且,团队成员在自然语言处理、知识图谱、视频分析、图像处理等方面取得了较为丰富的理论成果和技术积累,已在国内外权威杂志及会议上发表论文一百多篇,比如AAAI、SIGKDD、RTSS、CIKM、IEEE TKDE、IEEE TSMC-B、IEEE TC、ACM TWEB等。 业务痛点 线下的GPU服务器,成本特别高,而且非常不灵活。 没有使用过云GPU服务器,对服务器选型比较困惑。 对GPU、Tesla P100与Tesla P4具体的参数性能与应用场景不是特别了解。 解决方案 图 1. GPU服务器选型 CPU除了负责浮点整形运算外,还有很多其他的指令集的负载,比如像多媒体解码,硬件解码等,因此CPU是多才多艺的。CPU注重的是单线程的性能,要保证指令流不中断,需要消耗更多的晶体管和能耗用在控制部分

知识图谱文献综述(第二章 知识表示学习)

こ雲淡風輕ζ 提交于 2020-04-27 20:15:23
第二章 知识表示学习 1. 任务定义、目标和研究意义   知识表示是知识获取与应用的基础,因此知识表示学习问题,是贯穿知识库 的构建与应用全过程的关键问题。人们通常以网络的形式组织知识库中的知识, 网络中每个节点代表实体(人名、地名、机构名、概念等),而每条连边则代表 实体间的关系。然而, 基于网络形式的知识表示面临诸多挑战性难题 ,主要包括 如下两个方面:   (1)计算效率问题。基于网络的知识表示形式中,每个实体均用不同的节 点表示。当利用知识库计算实体间的语义或推理关系时,往往需要人们设计专门 的图算法来实现,存在可移植性差的问题。更重要的,基于图的算法计算复杂度 高,可扩展性差,当知识库规模达到一定规模时,就很难较好地满足实时计算的 需求。   (2)数据稀疏问题。与其他类型的大规模数据类似,大规模知识库也遵守 长尾分布,在长尾部分的实体和关系上,面临严重的数据稀疏问题。例如,对于 长尾部分的罕见实体,由于只有极少的知识或路径涉及它们,对这些实体的语义 或推理关系的计算往往准确率极低。   近年来, 以深度学习[Bengio, et al., 2009]为代表的表示学习[ Bengio, et al., 2013]技术异军突起,在语音识别、图像分析和自然语言处理领域获得广泛关注。 表示学习旨在将研究对象的语义信息表示为稠密低维实值向量。在该低维向量空 间中,两个对象距离越近

20179214 2017-2018-2 《密码与安全新技术》第三次作业

大兔子大兔子 提交于 2020-04-27 18:55:06
20179214 2017-2018-2 《密码与安全新技术》第三次作业 课程:《密码与安全新技术》 班级: 201792 姓名: 刘胜楠 学号:20179214 上课教师:谢四江 上课日期:2018年3月29日 必修/选修: 选修 ##学习内容总结 网络空间安全前沿技术介绍----跨媒体安全 传统多媒体 多媒体的英文单词是Multimedia,它由media和multi两部分组成.一般理解为多种媒体的综合.媒体(Media)就是人与人之间实现信息交流的中介,简单地说,就是信息的载体,也称为媒介.多媒体就是多重媒体的意思,可以理解为直接作用于人感官的文字、图形图像、动画、声音和视频等各种媒体的统称,即多种信息载体的表现形式和传递方式.传统媒体就是报纸,杂志等等. 既表现为包括网络文本、图像、音频、视频等复杂媒体对象混合并存,又表现为各类媒体对象形成复杂的关联关系和组织结构,还表现在具有不同模态的媒体对象跨越媒介或平台高度交互融合。通过“跨媒体”能从各自的侧面表达相同的语义信息,能比单一的媒体对象及其特定的模态更加全面地反映特定的内容信息。相同的内容信息跨越各类媒体对象交叉传播与整合,只有对这些多模态媒体进行融合分析,才能尽可能全面、正确地理解这种跨媒体综合体所蕴涵的内容信息。 特点 获取容易,数据量大,关联度高 跨媒体大数据的应用 交通监控 楼宇监控 24小时监控视频云备份服务

TiDB 在金融场景里面那些不得不说的事

心不动则不痛 提交于 2020-04-21 20:20:46
今年春天突如其来的新冠病毒疫情,在一定程度上改变了人们的生活、工作习惯,给各行各业带来了巨大影响。银行也难逃“池鱼之殃”:传统商业银行的盈利能力、资产和信贷规模都受到了一定程度的影响。疫情期间,人们对线上银行服务的需求激增,原本深受诟病传统银行的技术架构,又一次被推上了风口浪尖。有”危“就有“机”,疫情期间,北银金科云计算应用部副总经理 & 金融业务及解决方案专家于振华老师做客 TiDB 直播间,分享了 TiDB 在金融场景的应用,以下为直播文字回顾。 本文以银行业数据库架构演进为契机,结合商业银行的核心业务,探讨未来商业银行的技术发展趋势和机遇。 第一部分:背景介绍 我发现随着时间的推进,金融科技工作者感觉越来越累,因为技术变化是一直存在的,金融科技发展有一个非常快的加速度,并且我觉得未来应该也会延续这种趋势。下面这张图,如果是你能够站上这条曲线,能够追上科技的发展,那就能够利用科技的力量来赋能业务,这就是为什么我们现在这么累,为什么大家感觉科技工作者的节奏越来越快的理解。 具体谈到在业务层面,第一是互联网的业务爆发增长,对系统提出了更高的要求,以往没有互联网的时候,业务可能是恒定的量,有了互联网,有了线上化的模式,需要系统架构有一定的可扩展能力。第二是我们现在做互联网金融产品,就是要快速上线,快速适应市场的行情,具备快速交付能力。第三就是要做到自主可控,做到金融安全可以把控