jobs

【k8s】etcd集群took too long to execute慢日志告警问题分析

做~自己de王妃 提交于 2020-08-17 09:52:37
背景 目前 机器学习平台 后端采用k8s架构进行GPU和CPU资源的调度和容器编排。总所周知,k8s的后端核心存储使用etcd进行metadata持久化存储。机器学习平台采取[External etcd topology]( http://way.xiaojukeji.com/article/External etcd topology)结构进行etcd的HA部署。 etcd集群的稳定性直接关系到k8s集群和 机器学习平台 的稳定性。odin平台直接接入etcd集群的慢日志(etcd请求操作>100ms)告警,实时监控etcd的稳定性。 问题记录 2020-01-06 运维同学反馈2019年12月中旬etcd慢日志监控出现大量的告警记录,而且告警呈上升趋势。 2020-01-20 运维同学继续反馈etcd慢日志告警数量继续上涨,未呈现稳态趋势。 问题分析 2020-01-06 运维同学反馈告警问题时,当时怀疑etcd 集群磁盘latency性能问题,通过etcd metrics接口dump backend_commit_duration_seconds 和 wal_fsync_duration_seconds,latency区间在128ms。etcd官方文档 what-does-the-etcd-warning-apply-entries-took-too-long-mean

我想和大家说说心里话

时光怂恿深爱的人放手 提交于 2020-08-16 12:29:34
  对于一个接近一年都没有更新博客的人来说,突然跳出来不知道会不会吓到大家?所以我决定用一个真(zhuang)诚(bi)的标题,希望能给大伙压压惊。顺便怒吼一声,我胡汉三又回来了!!!假装自己人气依在,此番回来一定要干出一番事业啊!!   写这篇博客主要是想和大家聊一聊我过去一年做过的事情和一些感受,我相信可能会有人处于和我一样的情况,也许我的经验能够帮你理清一些思路。其次我觉得我可能欠一些人一个解释,因为的确有人问为怎么好长时间没写博客了。我记得有人曾经问过常年盘踞在博客园推荐博客第一的Artech,问他写博客有什么计划吗?因为大神每天都能出一篇,长年累月,坚持不懈,但却是没有任何计划,就是想写就写,肚子里有货的人从来不需要担心有一天你可能没有东西写了。我虽然不能像Artech一样随便写写就能写本书出来,但是不想写就不写这个技能我也算是学会了。        其实就是懒了,没有定力了。 最后一篇博客是2014年11月14日发布的,在这个日期前面的2年多的时间里面,我从来没有怀疑过自己坚持的能力,可谓是到了fei ji wang da,废寝忘食的地步。毕竟我坚持自学了一年的英语,从听说读写都不行的菜鸟到能够主持与国外同事的会议,又花了一年的时间坚持尽量每周一篇博客,终于可以在推荐榜上那么近距离的仰视各位前辈。      接下来,就是接二连三 技术上 的失败,

Linux常用命令总结

吃可爱长大的小学妹 提交于 2020-08-15 16:46:19
Hello,Everyone ! ( 今天小鸟我看了不少的Linux命令;随便查了查,分享给大家150常用命令做个留念吧!呵呵!) 以下命令读者可以用man [命令]查看详细使用情况 一. 启动,关机,登入,登出相关命令 <login> 登录 <logout> 登出 <exit> 登出 <shutdown> 停止系统 <halt> 停止系统 <reboot> 重启动 <poweroff> 切断电源 <sync> 把内存里的内容写入磁盘 <lilo> 安装lilo启动管理程序 <grub> 安装lilo启动管理程序 二. Shell相关命令 <chsh> 切换Shell <history> 显示命令履历 <alias> 设置命令别名 <unalias> 取消命令别名 <which> 显示命令所在位置 <type> 查询命令种类 <echo> 显示字符串或者变量内容 <set> 设置/显示Shell变量 <printenv> 显示环境变量 <export> 设置环境变量 <env> 设置临时环境变量 <unset> 释放环境变量 <setenv> 设置环境变量 <unsetenv> 释放环境变量 <source> 执行文件当中的命令 <man> 查询命令手册 <info> 查询超文本命令手册 <whatis> 显示命令简介 <apropos> 通过关键字查询手册 三. 用户管理相关命令

向经济衰退宣战[转载]

夙愿已清 提交于 2020-08-15 14:35:08
导读 1 听力|精读|翻译|词组 Bartleby 来自一天一篇经济学人 00:00 05:27 Waging war on recessions 向经济衰退宣战 英文部分选自经济学人20200620 期Business版块 Waging war on recessions 向经济衰退宣战 An early analysis of Denmark’s furlough scheme 丹麦带薪休假计划的早期分析 Since the emergence of the welfare state, adults who want to work have generally found themselves in one of two positions: earning a wage from their job or receiving unemployment benefits. The pandemic has led many people to find themselves in a halfway stage— furlough . This often involves the state paying a large slice of employees’ wages so that firms can keep them on the payroll during

Linux在后台运行python程序、脚本程序、可执行程序等,关闭终端仍可保持程序运行

扶醉桌前 提交于 2020-08-14 15:30:43
欢迎大家关注笔者,你的关注是我持续更博的最大动力 原创文章,转载告知,盗版必究 Linux在后台运行python程序、脚本程序、可执行程序等,关闭终端仍可保持程序运行 文章目录: 1 为什么需要后台运行程序,场景分析 2 前台运行命令 / 程序 2.1 `运行前台命令 / 程序` 2.2 `终止前台命令 / 程序` 2.2.1 `按 Ctrl+C 终止前台命令` 2.2.2 查看`前台运行命令的PID`,然后用`kill直接杀死进程` 3 后台运行命令 / 程序 3.1 nohup和&结合,在后台运行命令 3.2 使用jobs命令查看后台运行的命令 / 程序 3.3 终止后台运行的命令 / 程序 4 前台与后台命令的切与控制 4.1 fg命令:后台命令调至前台继续运行 4.2 Ctrl + z 命令:将一个正在前台执行的命令放到后台,并且处于暂停状态 4.3 bg命令:将一个在后台暂停的命令,变成在后台继续执行 1 为什么需要后台运行程序,场景分析 你是否遇到:在 用ssh或其他远程连接工具连接服务器 , 在终端中运行一些程序 ,然后程序执行期间连接断开。执行时间短的还好,如果时间比较长就比较惨了,还要从头再来! 如下,是我执行的训练,训练了十几个小时,训练一般终端连接断开: 在讲后台运行命令,我们先来说一下前台运行的命令! 2 前台运行命令 / 程序 前台运行命令:

Hacker News 简讯 2020-07-24

三世轮回 提交于 2020-08-14 13:37:32
最后更新时间: 2020-07-24 22:01 Editorial board of Index and more than 70 staff members resign - (index.hu) 《索引》编辑部和70多名员工辞职 得分:196 | 评论:52 The Four Quadrants of Conformism - (paulgraham.com) 墨守成规的四个象限 得分:193 | 评论:218 FAA issues emergency directive on 2,000 Boeing 737 NG Classic planes - (reuters.com) 美国联邦航空局对2000架波音737 NG经典飞机发布紧急指令 得分:37 | 评论:16 Show HN: How I made simple Geolocation service which handles 6m+ req/mo for $5 - (maxkostinevich.com) 演示HN:我是如何制作简单的地理定位服务的,它能以5美元的价格处理6个月以上的申请/月 得分:248 | 评论:108 Cold Showers: For when people get too hyped up about things - (github.com) 冷水澡:当人们对事情过于兴奋时 得分

mybatis之foreach用法

╄→尐↘猪︶ㄣ 提交于 2020-08-14 08:48:41
在做mybatis的mapper.xml文件的时候,我们时常用到这样的情况:动态生成sql语句的查询条件,这个时候我们就可以用mybatis的foreach了 foreach元素的属性主要有item,index,collection,open,separator,close。 item: 集合中元素迭代时的别名,该参数为必选。 index :在list和数组中,index是元素的序号,在map中,index是元素的key,该参数可选 open :foreach代码的开始符号,一般是(和close=")"合用。常用在in(),values()时。该参数可选 separator :元素之间的分隔符,例如在in()的时候,separator=","会自动在元素中间用“,“隔开,避免手动输入逗号导致sql错误,如in(1,2,)这样。该参数可选。 close: foreach代码的关闭符号,一般是)和open="("合用。常用在in(),values()时。该参数可选。 collection: 要做foreach的对象,作为入参时,List对象默认用"list"代替作为键,数组对象有"array"代替作为键,Map对象没有默认的键。当然在作为入参时可以使用@Param("keyName")来设置键,设置keyName后,list,array将会失效。 除了入参这种情况外

阿里巴巴为什么要禁止使用存储过程?

[亡魂溺海] 提交于 2020-08-14 07:30:01
作者:杨洋的围脖啊 segmentfault.com/a/1190000011138993 之所以有这个题目,我既不是故意吸引眼球,也不想在本文对存储过程进行教科书般论述。《 阿里巴巴Java开发手册 》是这样规定的: 再结合我最近项目中遇到的存储过程问题,所以今天我打算来聊一聊这个问题。需要这份最新完整手册的去关注微信公众号Java技术栈在后台回复手册获取。 这事儿要从去年在武汉出差时一位同事的发问说起,问题是这样的: 我觉得存储过程挺好用的,你为什么不建议用呢? 当时我好似胸有万言,但终究没用一个实在的例子回答同事,只是从结论上大侃一通,代码相对于SQL,复用、扩展、通用性都要更强。想必同事并不信服。 现在想来,我最近正碰到的问题,算是一个可以回答同事的例子吧。 最近项目中有个新需求,需要校验一个用户是否有Job,Certification,Disclosure这三个业务数据。 翻看了代码发现,系统的用户个人页面的C#代码调用了三个存储过程,去抓取用户的Job,Certification,Disclosure数据。 我的新需求,自然需要复用这三个存储过程,否则: 若每一处都写一次抓取数据的业务逻辑代码,若业务逻辑发生变化,难以追查和维护所有读取Job,Certification,Disclosure的SQL。 如果我在C#代码中调用这已有的三个存储过程,事情本该非常快就能结束

dotnet 配置 github 自动打包上传 nuget 文件

不羁的心 提交于 2020-08-14 06:27:07
在上一篇博客告诉小伙伴如何使用 github 做持续集成,本文告诉大家如何配置 github 让在 master 每次合并都会自动创建一个 nuget 文件,自动上传 在 github 的 action 功能可以很方便创建打包任务,但是没有很方便进行 nuget 上传,需要额外写一点代码 全部的源代码请看 github 如果发现有坑请邮件告诉我 创建配置文件 在 上一篇 博客告诉小伙伴在 .github/workflows 文件夹创建 *.yml 文件就可以作为 action 配置文件 创建一个随意命名的 yml 文件在 .github/workflows 文件夹,完成创建配置文件 标识 每个 workflow 都可以使用单独的命名,这个命名不是从文件名读取,而是通过 name: 属性读取。在读本文之前,我认为小伙伴都是了解 YAML 格式的,也就不对大家说明 YAML 的语法 name: publish nuget 上面的代码就会添加命名是 publish nuget 的 workflow 在 action 页面可以通过对应的命名找到不同的 workflow 如 触发条件 因为我不需要在任何的分支都触发打包,只需要触发在 master 合并,可以使用下面代码 on: push: branches: - master 这里 on 属性就是表示触发条件,触发条件是 push

MySql的回顾四:多表查询上(等值连接/非等值连接/自连接)-1992语法

拜拜、爱过 提交于 2020-08-13 17:32:56
时光在不经意间,总是过得出奇的快。小暑已过,进入中暑,太阳更加热烈的绽放着ta的光芒,...在外面被太阳照顾的人们啊,你们都是勤劳与可爱的人啊。在房子里已各种姿势看我这篇这章的你,既然点了进来,那就由我继续带你回顾MySql的知识吧! 回顾练习资料girls库以及两张表的脚本: https://pan.baidu.com/s/1NAvIOIrIPB8ZVfRblU2ppg 提取码: rrwa 引题:笛卡尔现象,先来观看一下两张表。 SELECT * FROM boys; SELECT * FROM beauty; SELECT NAME,boyname FROM boys,beauty; 最终结果:12*4=48行 #进阶6:连接查询 含义:又称多表查询,当查询的字段来自于多个表时,就会用到连接查询 笛卡儿积现象: 表1 有m行,表2有n行,结果 = m* n行 产生原因 :没有有效的连接条件 解决方法 :添加有效的连接条件 连接分类: 按年代分类: SQL1992标准(192标准):仅支持内连接 SQL1999标准(199标准) [推荐]:支持内连接 + 外联结(左外与右外) + 交叉连接 按功能分类: 内连接: 等值连接 非等值连接 自联结 外连接: 左外连接 右外连接 全外连接 交叉连接: 左外连接 右外连接 全外连接 交叉连接: SELECT NAME,boyname