AWS 数据分析服务(十)
Amazon Kinesis 概念 处理AWS上大量流数据的数据平台 Kinesis Streams 用于搜集数据,Client Library 用于分析后的展示 构建用于处理或分析流数据的自定义应用程序 可以支持从数十万中来源捕获和存储TB级的数据,如网站点击流、财务交易、媒体馈送、IT日志等 使用IAM限制用户和角色对Kinesis的访问,使用角色的临时安全凭证可以提高安全性 Kiesis只能使用SSL加密进行访问 Kinesis组件 Kinesis Data Firehose 加载大量流数据到AWS服务中 数据默认被存储在S3中,从S3还可以再被进一步转存到Redshift 数据也可以被写入到ElaticSearch中,并且同时备份到S3 Kinesis Data Streams: 自定义构建应用程序,实时分析流数据 利用AWS开发工具包,可以实现数据在流中移动时仍然能被处理,从而接近实时 为了接近实时,处理的复杂度通常较轻 创建者 Producer 持续将数据推送进Data Streams 数据在DataStream 由一组组分片(Shards)组成,每个分片就是一条记录,通过不断分片实现几乎无限的扩展能力 使用者 Comsumer 会实时对Data Steams的内容进行处理,并且将结果推送到不同的AWS服务 数据在Stream中是临时的,默认存储24小时