数据管理

谈谈数据治理

情到浓时终转凉″ 提交于 2019-12-27 22:30:48
随着越来越多的企业建立并广泛应用BI系统,数据治理的话题也在最近被越来越多地提及和讨论。有专家表示,只有建立了一定的数据治理体系,用户才会真正进入商业 智能 的时代。而数据治理能够在短期内成为业内的焦点话题,与企业对数据质量的理解和关注密切相关。 挑战:海量数据,标准不一 过去的十年是企业的IT系统经历了数据量高速膨胀的时期,这些海量的、分散在不同角落的数据导致了数据资源利用的复杂性和管理的高难度。同时,企业内部的业务区隔或行政分化也在不断地制造着企业数据交互的断层,而企业与外部业务交互所产生的“体外循环”数据与企业的核心数据体系并不能自然地融合。当这种数据的异构化所导致的应用冲突达到一定临界点时,数据治理便成为了规范企业数据的必要步骤。 概念:管理举措,持续改善 数据治理(Data Governance),是由企业高级管理层的数据治理委员会发起并推行的,是关于如何进行整个企业内部数据的商业应用和技术管理的一系列政策和程序。数据治理是一套持续改善管理机制,通常包括了组织 架构 、政策制度、技术工具、数据标准、作业流程、监督及考核等方方面面。 技术:主题众多,元数据管理先行 数据治理涉及的IT技术主题众多,包括元数据管理、主数据管理、数据质量、数据集成、监控与报告等。 根据权威数据管理研究机构TDWI对数百家国际企业的调研结果,元数据管理的重要性在全部技术主题中位列第一。

事件驱动的数据管理

邮差的信 提交于 2019-12-24 14:12:48
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 一、微服务以及分布式数据管理中存在的问题 单体应用通常使用单个关系型数据库,由此带来的好处在于应用能够使用 ACID 事务,后者提供了重要的操作特性: 原子化: 原子粒度的更改 一致性: 数据库的状态始终保持一致 隔离: 并发执行的事务显示为串行执行 持久: 事务一旦提交就不会被撤销 如此,应用能够简单地开始事务、更改(插入、更新和删除)多行、以及提交事务。 使用关系型数据库的另一大好处是它支持 SQL。SQL 是一门丰富、可声明的和标准化的查询预约。用户能够轻松通过查询将多个表中的数据组合起来,然后 RDBMS 查询调度器决定执行查询的最优方法。用户不必关心底层细节,比如如何访问数据库。此外,由于所有的应用数据在一个数据库中,很容易查询。 然而,微服务架构中的数据访问变得复杂许多。每个微服务拥有的数据专门用于该微服务,仅通过其 API 访问。这种数据封装保证了微服务松散耦合,并且可以独立更新。但如果多个服务访问相同数据,架构更新会耗费时间、也需要所有服务的协调更新。 更糟糕的是,不同的微服务通常使用不同类型的数据库。现代应用存储和处理各种类型的数据,而关系型数据库并非总是好选择。对于一些使用场景,特定的 NoSQL 数据库能提供更方便的数据模型、更好的性能和可扩展性。譬如,服务使用 Elasticsearch

2008服务器管理器认证Simpana 8

非 Y 不嫁゛ 提交于 2019-12-18 17:41:44
美国慷孚系统公司(CommVault)日前宣布,CommVault的一体化数据管理平台Simpana 8已顺利通过微软Windows Server 2008 R2认证,并全面支持Windows 7,确保了Simpana能与微软最新版本的服务器和台式机操作系统无缝地协同运行。CommVault承诺,将继续通过充分的自动化和最优化方式,帮助客户进一步降低数据管理成本,提升IT服务水准,并提高运营效率和个人生产力。这就需要我们在iis7远程桌面管理工具下完成,iis7远程桌面连接工具,又叫做iis7远程桌面管理软件,是一款绿色小巧,功能实用的远程桌面管理工具,其界面简洁,操作便捷,能够同时远程操作多台服务器,并且多台服务器间可以自由切换,适用于网站管理人员使用。 CommVault Simpana 8已针对Windows Server 2008 R2进行了优化,包括在虚拟化工具、互联网资源、管理方面的改进以及与Windows 7集成等方面。通过获得Windows Server 2008 R2认证,CommVault成功地把Simpana软件的优势扩展到微软最新的服务器操作系统版本上,易于现有客户升级;通过支持Windows 7,易于台式机升级,让客户能更方便地应用微软新的客户机操作系统的特性和改进功能。 CommVault Simpana 8是业界惟一真正一体化的、统一的数据管理平台

行业大秀:EasyEarth Show!

自作多情 提交于 2019-12-12 12:14:32
EasyEarth三维可视化地理信息云平台是由北京四维益友信息技术有限公司自主研发的新一代面向三维可视化应用领域的基础信息系统平台。 EasyEarth以数据管理为核心,围绕7大类基础数据,提供综合管理服务。平台充分融合互联网、物联网与移动端,让各种媒介与平台互联互通;数据管理涵盖本地化和共享数据,采用高性能数据库管理技术配合分发调度机制,实现数据高效化管理与分发应用,并为上层提供高效基础空间分析服务;强大的三维实时渲染引擎,便捷、高效的数据调度机制,为数据应用提供各种高级渲染。 用户可以轻松进行数据管理、场景浏览、查询定位、模型编辑、空间量测、场景标绘等操作,并实时查看网络数据、实体属性、空间特效,实现通视分析、地形剖面分析、水淹分析、缓冲区分析、搜索分析等各类功能。 EasyEarth有完善的产品架构。用户可将基础数据导入Builder,交互式创建、编辑和发布地理空间场景,通过Server将各类服务稳定、高效地分发给用户。 目标人群可使用EasyEarth Desktop、EasyEarth Explore、EasyEarth移动版等客户端,实现地理空间场景的三维浏览、查询、量算、分析等功能。另外,平台还具有完整灵活的SDK二次开发包,可根据用户需求量身打造专属应用系统,提供定制化解决方案。 EasyEarth秉承着成为空间地理信息技术集成专家的理念,专一、专注

DevOps元数据管理

北慕城南 提交于 2019-12-06 07:51:46
元数据是自动化运维的基础,对元数据的管理和查询贯穿整个运维的生命周期。我们从一个元数据的使用场景开始: 双十一抢购火热进行中,某电商后端实例的日志中出现了502错误码,运维平台监测到该异常并发送告警给相关运维。 在这个过程中,运维元数据发挥了什么作用?回答这个问题前,我们先回顾下元数据是什么。 一、元数据的管理 运维系统中的元数据包括服务、机器及其关联关系。服务元数据有服务名称、所属节点、运维人员以及域名等;机器元数据包含序列号、内存等资产信息,IP、机房等网络信息、自定义标签信息以及运行实例等部署信息。这些数据由资源管理模块维护。 资源管理模块对业务以树的形态划分层级,形成服务树,从上到下依次为产品线、系统和应用三类节点。 每个层级都可以关联机器,且上层节点包含下层节点的机器。 通过添加节点的运维及研发角色,可以实现对服务和机器的权限控制。 这种层级结构将服务与服务,服务与机器关联起来,可以直观的表达服务和机器的归属关系,便于实现权限和配置的继承。 二、元数据的应用场景 智能监控 回到上面的问题,报警流程中,服务所在机器的监控客户端查询自己所属的应用,然后从配置管理模块拉取相应监控配置,实现对日志的监控;监控业务端收到监控数据后,查找该机器对应的节点信息,将报警发送给节点的运维等人员。 此外,在DevOps落地实践中,还存在多种其他应用场景 拓扑视图

DevOps元数据管理

回眸只為那壹抹淺笑 提交于 2019-12-06 07:51:07
元数据是自动化运维的基础,对元数据的管理和查询贯穿整个运维的生命周期。我们从一个元数据的使用场景开始: 双十一抢购火热进行中,某电商后端实例的日志中出现了502错误码,运维平台监测到该异常并发送告警给相关运维。 在这个过程中,运维元数据发挥了什么作用?回答这个问题前,我们先回顾下元数据是什么。 一、元数据的管理 运维系统中的元数据包括服务、机器及其关联关系。服务元数据有服务名称、所属节点、运维人员以及域名等;机器元数据包含序列号、内存等资产信息,IP、机房等网络信息、自定义标签信息以及运行实例等部署信息。这些数据由资源管理模块维护。 资源管理模块对业务以树的形态划分层级,形成服务树,从上到下依次为产品线、系统和应用三类节点。 每个层级都可以关联机器,且上层节点包含下层节点的机器。 通过添加节点的运维及研发角色,可以实现对服务和机器的权限控制。 这种层级结构将服务与服务,服务与机器关联起来,可以直观的表达服务和机器的归属关系,便于实现权限和配置的继承。 二、元数据的应用场景 智能监控 回到上面的问题,报警流程中,服务所在机器的监控客户端查询自己所属的应用,然后从配置管理模块拉取相应监控配置,实现对日志的监控;监控业务端收到监控数据后,查找该机器对应的节点信息,将报警发送给节点的运维等人员。 此外,在DevOps落地实践中,还存在多种其他应用场景 拓扑视图

元数据管理的重要性 - xms

天涯浪子 提交于 2019-12-05 22:19:22
什么是元数据?引用百科的描述就是:元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息; 看起来有点抽象?那我们看下具体场景有哪些: 1、数据库中的sysobjects、syscolumns,就是存储了表、视图、列等结构信息,我们可以查询到这些对象的详细信息,比如某一列的名称、类型、长度、描述……,有做过自动生成代码的朋友比较清楚其中的作用。 2、具有高度可配置性的程序,比如自定义表单、列表等,存储的结构信息也叫元数据,根据结构信息动态解析生成表单展示,有做过所见即所得的朋友应该不陌生。 上面都是具有高度可扩展性的应用系统必然应用的一些思想,当然还有其他更多的场景…… 这篇文章主要是探讨一下元数据在应用系统中的重要性,在xms中如何结合上面的场景,实现灵活扩展与可维护性,同时解放了咱们码农的双手…… 一直以来,咱们码农界的项目交接文档中,至少需要提供数据库字典,要求高点的还要提供流程图以及说明、类和方法的描述等,一说到文档,估计大家心中一万个不情愿,这玩意写出来谁看啊,一个不愿意写,一个不愿意看,更别提这系统经过了几手,一个人都没全部搞清楚系统逻辑,怎么写这么一个大系统的说明文档,其实这些更多是公司的一种规范要求,据我了解有9成的人不写不看,要看宁愿直接看代码,那就要看写代码的人的素质了

云计算的基本原理是什么?核心技术有哪些?

牧云@^-^@ 提交于 2019-12-05 13:58:53
云计算已经成为了IT界的热门技术,甚至被视为将根本改变生活方式和商业模式的革命技术。借助云计算,网络服务提供者可以在瞬息之间,处理数以千万计甚至亿计的信息,实现和超级计算机同样的效能。云计算可以被视为网络计算和虚拟化的融合:即利用网格分布式计算处理能力,将IT资源构筑成一个资源池,再加上成熟的服务器虚拟化、存储虚拟化技术,是用户可以实时的监控和调配资源。那么云计算的基本原理是什么?核心技术有哪些? 一、云计算的概念 云计算的定义众多,目前广为认同的一点是,云计算是分布式处理、并行处理和网格计算的发展,或者说是这些计算机科学概念的商业实现。云计算是一种资源交付和使用模式,指通过网络获得应用所需的资源(硬件、软件、平台)。云计算将计算从客户终端集中到“云端”,作为应用通过互联网提供给用户,计算通过分布式计算等技术由多台计算机共同完成。用户只关心应用的功能,而不关心应用的实现方式,应用的实现和维护由其提供商完成,用户根据自己的需要选择相应的应用。云计算不是一个工具、平台或者架构,而是一种计算的方式。 二、云计算在国内外发展状况 尽管云计算的思想孕育很久,但是在国外(主要是美国)取得蓬勃发展也是最近十来年的事情。2003年,美国国家科学基金(NSF)投资830万美元支持由美国七所顶尖院校提出的“网络虚拟化和云计算VGrADS”项目,由此正式启动了云计算的研发工作。2009年4月

推荐一款配有强大数据管理和可视化ETL的BI工具

隐身守侯 提交于 2019-12-05 04:20:10
实际在企业的数据分析应用中,分析人员对于数据处理的需求灵活多变,并且经常需要对不同的业务数据进行关联性分析。 IT部门提供的基本数据处理和基本的关联关系并不能完全满足分析人员的需求。比如分析人员需要根据公司产品销售明细数据分析购买用户的特征,并调整相应的销售策略,这个时候分析人员需要基于销售清单数据,计算一些相应的分析指标,如每个用户的消费频次,单笔消费最大金额,最近一次消费时间间隔等。这就要用到自助数据集来解决问题。如果分析人员还需要获取一些行业竞争数据,这就要根据同类型的产品,做关联分析和横向对比分析。 这些任务对于接触实际业务较少的IT部门来说,是很难在基础的数据分析中挖掘出来的,再加上业务调整和分析角度的变化不能及时和IT部门同步。这些都是企业在推行数据化管理过程中碰到的亟待解决的问题。 FineBI重点打造的自助数据集,一个是又花了业务提需求,IT做分析的配合流程。改为在一个平台上,IT准备好数据,业务拿着数据自己去分析。 其次,对于拿到的数据,自助数据集环节能帮助分析人员简单较快的对数据进行过滤、增加字段,删减字段,字段计算等可视化清洗操作。 一、FineBI自助数据准备介绍 传统工具在分析数据的过程中,需要极大的程度依赖管理员。业务人员在管理员那里获取数据后还需返还管理员处进行数据处理,这无疑是在做费时费力的无用功,管理员也沦为取数机。FineBI

MATLAB/SIMULINK生成嵌入式代码的步骤

痞子三分冷 提交于 2019-12-04 19:49:49
昨天参加了Mathworks公司在东南大学举办的关于MATLAB的培训,内容是关于MATLAB/SIMULINK的嵌入式代码生成以及物理建模,在这里把代码生成的步骤及一些相关内容总结一下。 嵌入式代码生成 嵌入式代码生成主要利用的是MATLAB中自带的 MATLAB Coder 模块,MATLAB Coder可以从MATLABcode产生可读且可移植的C/C++程序,支持多数MATLAB语言和工具箱,可以将产生的程序作为源程序、静态库或动态库集成到项目中,可在MATLAB环境中使用产生的程序来加快MATLAB代码的执行速度。 接下来就以一个非常简单的例子来举例说明嵌入式代码生成的步骤。 1.创建模型 这个模型很简单,输出Out1等两个输入信号Input1和Input2之和再乘以增益k(这里先用2代替),即: 其中,x和y在其他模块中定义,z和k在本模块中定义(这个影响后面数据管理中各个参数的属性,后面再说,现在不管)。 2.更改设置 上文提到代码生成利用的是MATLAB自带的 MATLAB Coder 模块,打开SIMULINK中的Configuraton Parameters模块 或者Ctrl+E可行。打开之后, 第一步:更改求解器设置 因为我们生成的代码是需要下载到单片机中的,而单片机中的计时是按照它的频率严格进行的,因此求解器中的求解步长要与单片机的步长一致,否则就会出错