- 复盘不为追责,只为总结经验、持续改进。
- 让失败是“安全”的,我们坚信每个人在当时限定环境下已根据他的所知、所具备的技能和可用的资源尽了最大努力。
- 复盘过程基于事实和数据,敢说真话、不惧冲突、对事不对人。
- 运用系统性思维分析根因,简单的问题现象下隐藏着复杂、多维的改进机会。
事件复盘原则
致敬这个时代——揸紧中指
专辑:LMF 2009-2019 EP
作词:L.M.F 作曲:L.M.F
戚起耳朵聽真
清晰既聲音向你腦袋進軍
一直都知自由係 要去捍衛
不惜一切就算我地依然處於弱勢
奸商加狗官最叻係玩鉗制
事實擺在眼前就咪撚玩抺黑蒙蔽
強勢未倒下 頭顱未被斬下
有法治一日 我哋依然不怕
迫不得已大懶堂要出黎申張正義
但係呢首歌既內容並無牽涉到政治
我話你知 個世界越係動蕩
我地既思維就更加要懂得開放come on
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想咁易
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想像中咁易
我並唔認同你講既一切一切
但我會捍衛 即使死不眼閉
並唔認為你所謂既需要克制
會帶黎公平 穩定壓倒一切
唔屈服於錢幣唔怕照肺
見權貴一樣照吠 正義係不顧一切
唔怕揭穿虛偽 住濁世繼續警世
唔會感到孤獨 為自由不枉一世
我知道世事冇絕對既對與錯
但係我屌你 亦無需要對號入座
我憤怒你無需要大驚小怪
亂鳩咁報導唔可以當做表態
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想咁易
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想像中咁易
你不要放棄 堅持到尾
自由要接捧 我地要靠哂你
(One 平等 一個Freedom)
不管犧牲幾多 揸緊中指我道理
不自由 毋寧死
妥協最後 失敗者只會係你
(不能容忍 世界變成咁)
犧牲幾多 揸緊中指我道理
One 平等 一個Freedom
不能容忍個世界點解變成咁
鬥爭不斷發生 太多狡猾聲音
為左自由兩個字 太多人無辜犧牲
One 平等 一個Freedom
為自由追尋 同權力繼續繼續抗衡
不聽天由人 自由不分富貧
平等自由應該屬於 每一個人
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想咁易
一 二 兩隻手指
意 義 就只有自由兩個字
一 無 所有既鬥士
揸緊中指 唔係你想像中咁易
一一二二 兩隻手指
Liberty 自由兩個字
一無所有所有既鬥士
揸緊中指
书籍推荐《梁启超——亡命》
一直期待的《梁启超》第二部,终于在上月出版了。为什么期待且很想做推荐?
我好像一时也说不出个子丑寅卯,毕竟第一部《青年变革者》的内容我都已全忘了。真要说,应该就是“变革”二字。现今与那时的时代背景,看似绝然不同,但细想又好似有些许相同。那个时代的变革可能是大破大立,现今或是隐忍待发,但有些人或事终将会在历史上留下深刻的印记。绝大部分人应该不会是变革者、亲历者,甚至旁观者都不会是,但这并不能也不应该阻碍你对未来时代的美好期盼以及其演进历程的猜想。
而知史以明鉴,或许这能帮助拨开现今又是内卷又是乌卡时代下的迷雾,减少充斥四周的迷茫、虚无和浮躁。
当然,最后还有一个原因——他也姓梁!


让人生越活越轻松的一些准则
随着移动通讯网络、IT、手机终端和交通等技术的快速发展,当今社会接收各类信息的速度和数量均是指数级增长。而信息有各路各样,有负面的、消极的、暴力的、正能量的、感人的,也有官方统一的。这也会让人陷进了“信息茧房”再叠加“信息爆炸”,若处理不当,只会增加心智负担。
已人到中年,身上背负责任已经足够多,无须多增负担。因此,以下这些准则能帮助消除这些负担,让人生越活越轻松。如下:
- 这是屁事…
- 关你屁事?
- 关我屁事!
- 屁大点事。
如何管控和解决分歧
1、坦然面对、承认和接受我们的分歧,并且描述清楚分歧到底是什么?
2、别着急于当场、马上解决分歧,但必须要做的是:确定什么时间以什么方式,需要哪些人参与来解决什么的分歧?
3、在沟通、辩论过程中,时刻注意别让负面情绪占据了你的大脑
做为产品与开发激烈摩擦一早上后的小结。
仰望星空
多年来,脑海里一直有着一幅画面:儿时,在村里的“地堂”(晒谷场)坐在地上,仰望星空。银河,看着黑洞洞但让人感觉深邃,两侧挂满了满天繁星,感觉伸手就能碰到。
《夜观星空》一书买了有2、3年,断断续续看了几章。这段时间,想亲眼再看看银河星空的念头越来越强。没法外出,那就买个天文望远镜来观星吧。
除近距离观察月亮外,还看到了木星和它的四个卫星。他们排成一直线,在天文望远镜中目视木星,他就是一小圆球,木卫就是几个亮点。DX 80 加上10mm目镜能隐约看到木星纹,这已让我大受振憾。可惜,成像太小,手机无法拍摄。但在窄窄的、小小圆型视野中,我亲眼看到了浩瀚无穷的宇宙世界。
仰望星空,才能感受到人类的渺小!!!



变更管理原则
1.所有的变更都应被记录,以便于跟踪和回溯。
2.我们知道自己不知道,因此会主动协调相关干系人全面评估变更影响和变更实施风险。
3.变更影响将在实施前且尽早地通知受影响用户。
4.对“生产保持敬畏心”和完整清晰的变更执行清单,是最有效的风险管控措施。
5.我们追求技术上的精进,致力于把所有的变更实现自动化、智能化。
6.变更实施完成后的技术验证和业务验证,是变更过程中不可省略的环节。
7.事前对变更技术方案进行测试验证,是变更成功实施的最有力保证。
思虑过多,实践太少,容易得病!
这段时间想做的事情太多,列出来梳理一下:
- 想学python,用于目前工作和量化投资
- 想学投资理论,建立起自己的投资决策框架
- 想学观星,已经买了天文望远镜,看亲眼看到漂亮的行星和拍下美照
- 想做一个巴西风格的水草缸,种一片漂亮的、绿油油的草坪,养几条漂亮的小鱼
- 想学会钓鱼,已买了鱼竿装备,还想去海钓
- 想去西藏、新疆,亲眼看看祖国不同的地理风貌,看看雪山、高山湖、草原,在高山下观望星空
- 对很多知识充满了好奇,历史、经济、心理、哲学、物理、政治、儒道释等等,想知道为什么?
- 想重拾游戏乐趣,再次感受儿时专注于游戏时的快乐
- 想基于这些年的工作实践经验,创立属于自己的“运维方法论”,分别从流程、技术、文化上论述,再加以工具平台的支持
最近自我感觉也很差,总迷茫于当前的工作、事情、人生有何意义?这种状态,应该就是属于网络上所说的精神内耗。需要内省一下,要不然,健康要出问题了。
什么是精神内耗?人类控制应对自己的心理或情绪、进行决策、创作、进行各类思考等等,都需消耗能量。而这种能量在消耗后,也是需要时间来恢复,重新积存的。而精神内耗,就是自己主观原因令这种能量不停被消耗,从而令人感觉焦虑、疲倦,再严重者就是焦虑症、抑郁症。
那应该怎么破?
别想太多,只管去做!!!
思虑过多,做爱太少,也易得病!
Logstash报maximum shards open无法写入ES处理
一早回来查看kibana,发现今天的index没有创建。开始排查:
- 查看ES集群状态:正常
- 查看Logstash状态:运行状态正常。再查看日志发现有报错 this action would add [6] total shards, but this cluster currently has [3000]/[3000] maximum shards open
原因:
ES版本为7.10,集群默认配置的每节点分片数为1000,而集群为3节点,所以总分片数限制在了3000
处理:
调整集群配置
#Dev Tools
PUT /_cluster/settings
{
"persistent": { #永久配置
"cluster": {
"max_shards_per_node":10000
}
}
}
#shell 命令
curl -XPUT "http://localhost:9200/_cluster/settings" -H 'Content-Type: application/json' -d'{ "persistent": { "cluster": { "max_shards_per_node":10000 } }}'
Crontab定时执行Curator失败原因分析
早上回来,一看日志中心的ES集群又挂了,有2台节点离线,集群状态为red。
1、处置过程
进入各节点,查看elasticsearch进程状态,发现有两台节点的进程已挂掉。
重启es进程
[ ~]$ cd /espath
[ ~]$ ./elasticsearch -d
使用curl命令,访问可用的es节点,查看集群状态。
可以看到集群节点数已恢复,未分配的分片也在慢慢重分配中,这个时候只能等了
[ ~]$ curl -XGET "http://10.86.18.xxx:9200/_cluster/health?pretty"
{
"cluster_name" : "elk6.4",
"status" : "red",
"timed_out" : false,
"number_of_nodes" : 5,
"number_of_data_nodes" : 5,
"active_primary_shards" : 21928,
"active_shards" : 21967,
"relocating_shards" : 0,
"initializing_shards" : 8,
"unassigned_shards" : 10362,
"delayed_unassigned_shards" : 0,
"number_of_pending_tasks" : 96,
"number_of_in_flight_fetch" : 0,
"task_max_waiting_in_queue_millis" : 1986814,
"active_shards_percent_as_number" : 67.93147168877755
}
2、原因分析
curl查看各节点存储空间状态,发现各节点磁盘空间是足够的,但各节点分片数已飚到6500,大大超出了可负载能力,进而导致在集群自动定时批量创建index时进程OOM了
[ ~]$ curl -XGET "http://10.86.18.xxx:9200/_cat/allocation?v"
shards disk.indices disk.used disk.avail disk.total disk.percent host ip node
6489 1.1tb 1.2tb 13.3tb 14.6tb 8 10.86.x 10.86.x 10.86.x
6489 1.2tb 1.6tb 5.7tb 7.3tb 21 10.86.x 10.86.x 10.86.x
1573 268.9gb 1.3tb 6tb 7.3tb 17 10.86.x 10.86.x 110.86.x
6490 1.2tb 1.4tb 5.8tb 7.3tb 20 10.86.x 10.86.x 110.86.x
1491 272.3gb 1.5tb 5.7tb 7.3tb 21 10.86.x 10.86.x 110.86.x
9805 UNASSIGNED
集群的index是通过crontab定时执行curator来删除的,查看curator日志发现在9月1日后就没再成功执行过
进一步查看crontab日志,发现根因是执行curator的appxxx用户密码过期导致
Sep 2 22:00:01 appgsvr03 crond[166761]: (appxxx) PAM ERROR (Authentication token is no longer valid; new one required)
Sep 2 22:00:01 appgsvr03 crond[166761]: (appxxx) FAILED to authorize user with PAM (Authentication token is no longer valid; new one required)
3、解决方案
因之前没注意,是在appxxx用户下直接使用crontab -e配置的。现将crontab改回使用root用户执行
sudo vi /etc/crontab
# For details see man 4 crontabs
# Example of job definition:
# .---------------- minute (0 - 59)
# | .------------- hour (0 - 23)
# | | .---------- day of month (1 - 31)
# | | | .------- month (1 - 12) OR jan,feb,mar,apr ...
# | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * user-name command to be executed
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
00 22 * * * root curator --config /curator/curator.yml /curator/action.yml