Supervisor

探寻流式计算

天涯浪子 提交于 2019-11-30 03:56:47
一、静态数据和流数据 静态数据:为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是静态数据。 流数据:以大量、快速、时变的流形式持续到达的数据。(例如:实时产生的日志、用户实时交易信息) 流数据具有以下特点: (1)、数据快速持续到达,潜在大小也许是无穷无尽的。 (2)、数据来源众多,格式复杂。 (3)、数据量大,但是不十分关注存储,一旦经过处理,要么被丢弃,要么被归档存储(存储于数据仓库)。 (4)、注重数据的整体价值,不过分关注个别数据。 (5)、数据顺序颠倒,或者不完整,系统无法控制将要处理的新到达的数据元素的顺序。 在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。然后对DB中的数据进行处理。 流计算:为了实现数据的时效性,实时消费获取的数据。 二、批量计算和流计算 批量计算:充裕时间处理静态数据,如Hadoop。实时性要求不高。 流计算:实时获取来自不同数据源的海量数据,经过实时分析处理,获得有价值的信息(实时、多数据结构、海量)。 流计算秉承一个基本理念,即数据的价值随着时间的流逝而降低,如用户点击流。因此,当事件出现时就应该立即进行处理,而不是缓存起来进行批量处理。流数据数据格式复杂、来源众多、数据量巨大,不适合采用批量计算,必须采用实时计算,响应时间为秒级,实时性要求高。批量计算关注吞吐量,流计算关注实时性。 流计算的特点: 1、实时

Supervisor管理springboot应用

允我心安 提交于 2019-11-30 02:53:06
目录 概述 环境准备 spring boot应用 supervisor配置 启动应用 概述 前面博文介绍了Supervisor进程管理,实际应用可以对springboot应用进行管理,如果springboot应用挂掉,Supervisor还可以对它进行自动重启. 点击查看 进程管理利器Supervisor--入门简介 点击查看 进程管理利器Supervisor--centos7下安装与卸载 转帖请注明原贴地址:https://my.oschina.net/u/2342969/blog/2986183 环境准备 Supervisor3.3.4 可运行的springboot应用 spring boot 应用 这里就不赘述了,自行百度创建一个,本文应用名叫做: springboot-test.jar,放置目录在:/opt/apps supervisor配置 需要结合博文 进程管理利器Supervisor--centos7下安装与卸载 #vim /etc/supervisor/conf.d/springboot-test.conf 配置内容如下: [program:mohurd-search] environment=JAVA_HOME=/opt/jdk1.8.0/bin ; 这里可以创建环境变量 directory = /opt/apps ; 程序的启动目录 command = /opt

apache druid 实时加载kafka 中的数据(一)

醉酒当歌 提交于 2019-11-29 19:27:22
简介 apache druid 是分布式列存储的 OLAP 框架。还是一个时间序列数据库。本篇文章主要是druid 在kafka 加载数据的配置。由于druid 升级情况太快,本人的环境还是在0.13,主要改动方面还是UI,新的版本在UI方面更适合新手入门。 文章如有帮助,请关注微信公共号。 最终使用druid时,是0.9版本,当时在kafka加载数据推荐的方式是两种 Tranquility kafka index service Tranquility 是用于将流实时推送到Druid的工具包。是一个独立,需要单独下载。 ** 其特点** 无缝地处理分区,复制,服务发现和架构过渡,而无需停机。集成了http server,Samza,Spark ,Storm,Flink 等工具。 可以自由的控制向druid,主动发送数据。 ** 劣势** 本身具有时间窗,超过时间窗的数据直接丢弃。 版本落后,由于没有官方组织维护,目前版本只是兼容值0.9.2,后面druid升级后,Tranquility未及时升级,有些新的api 无法适配。 kafka index service 这是druid 自身携带的扩展插件,使用时,需要在common.runtime.properties 文件中的属性 druid.extensions.loadList 添加druid-kafka-indexing

PMM出问题排查

孤街醉人 提交于 2019-11-29 00:22:09
PMM出问题排查 2017-09-29 阅读量259 看各种日志 monitoring service 1 2 3 4 [root@node4 ~]# ll /var/log/pmm-* -rw-r--r--. 1 root root 1880 Sep 27 18:02 /var/log/pmm-linux-metrics-42000.log -rw-r--r--. 1 root root 783 Sep 27 18:02 /var/log/pmm-mysql-metrics-42002.log -rw-r--r--. 1 root root 7143 Sep 27 18:08 /var/log/pmm-mysql-queries-0.log docker里的日志 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 [root@node4 log]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES e4916410b314 percona/pmm-server:latest "/opt/entrypoint.sh" 2 hours ago Up 31 minutes 0.0.0.0:80->80/tcp, 443/tcp pmm-server 948a9aeb047e

[喵咪BELK实战(3)] logstash+filebeat搭建

我只是一个虾纸丫 提交于 2019-11-27 15:02:11
[喵咪BELK实战(3)] logstash+filebeat搭建 前言 在上节我们已经把elasticsearch+kibana已经搭建起来了,可以正常的进行数据的索引查询了,但是直接对elasticsearch进行操作也非常不方便, elasticsearch很难对接其他的数据源,这是使用就需要logstash和filebeat出场了... 附上: 喵了个咪的博客: w-blog.cn 官网地址: https://www.elastic.co/cn/ 1. logstash logstash主要的作用就是输入输出进行数据的处理,官方声称支持十几种数据输入源和输出源,并且可以多点分发是一个很强大的工具,我们主要使用的是它的数据处理功能(比如解析日志提取关键字索引,数据过滤等) 1.1 安装 wget https://artifacts.elastic.co/downloads/logstash/logstash-5.3.0.tar.gz tar -zxvf logstash-5.3.0.tar.gz mv logstash-5.3.0 /usr/local/ 1.2 第一条管道 从之前的介绍有了解到logstash它的主要功能是处理数据进行输入输出,所以我们就要搭建一条输入输出的数据通道来进行数据传输,创建这条管道的配置文件: vim /usr/local/logstash-5

django+nginx+supervisor+gunicorn+gevent 网站部署

大城市里の小女人 提交于 2019-11-27 13:50:17
django+nginx+supervisor+gunicorn+gevent 网站部署 标签(空格分隔): 未分类 django gunicorn supervisor gevent django,nginx,supervisor,gunicorn,gevent这几个都是在本领域大名鼎鼎的软件,下面的部署都是在ubuntu12.04里面验证成功的! 首先是安装这些软件在ubuntu下面都比较简单,nginx和supservisor的安装如下 apt-get install nginx,supervisor 在ubuntu下使用python,强烈建议安装python-dev apt-get install python-dev 安装django,gunicorn,gevent,使用虚拟环境安装,不要污染了系统库 配置gunicorn gunicorn app.wsgi:application -w 4 -b :%(proxy_port)s -k gevent --max-requests 500 --access-logfile=%(access_log)s --error-logfile=%(error_log)s 这个是一个基本的运行配置,不过对于大多数网站来说已经够用了 supervisor配置 [program:dyzww] autorestart=true command

[喵咪Liunx(1)]计划任务队列脚本后台进程Supervisor帮你搞定

这一生的挚爱 提交于 2019-11-27 01:43:54
#[喵咪Liunx(1)]计划任务队列脚本后台进程Supervisor帮你搞定# ##前言## 哈喽大家好啊,好久不见啊(都快一个月了),要问为什么没有更新博客呢只应为最近在录制PhalApi的视频教程时间比较少,作为弥补那么为大家带来一点干货 Supervisor ,话不多说那么就开始今天的分享把 附上: 喵了个咪的博客: w-blog.cn Supervisor官网地址: https://pypi.python.org/pypi/supervisor PhalApi官网地址: http://www.phalapi.net/ 开源中国Git地址: http://git.oschina.net/dogstar/PhalApi/tree/release ##1. 我们遇到了什么问题## 了解python的童鞋应该听说过Supervisor,Supervisor是通过python实现的一个进程管理工具, ###1.1需要一直运行到后台的可执行文件启动的服务### Supervisor是笔者在玩golang的时候了解到的,goalng的web应用API需要运行编译好的可执行文件才能把golang的内建web服务跑起来,和php不同的就是php-fpm会帮你解决这个问题,那么遇到这个问题后我找了很多资料在想我怎么可以让我的进程一直在后台启动并且如果有了问题自己死掉了自动重启呢.