有段时间没有写博客了,因为我在思考如何去写好一篇技术性文章,而不是随性所欲、天马星空似的。以前写的很多博客真的是太潦草,这就和 CSDN 那样一篇文章复制来复制去的不管什么页面样式乱了之类的,总之就是自己技术不到家,分析的深度也不过。看了会有很多感慨。只要死不了就不能停止学习新知识。

工作上逐步进入正轨,但健康方面需要提升,脾胃虚,这算是一个老毛病了,还得靠养。

之前老大分享的一个技术问题,感觉很有意思,假如有十万条数据需要更新到库中,但是需要先根据条件过滤一遍(很多表聚合在一起然后插到一张新表里,此处过滤是为了生成对应的格式),现在有两个方案:

  • 过滤完数据后先 insert 进新表,紧接着进行 update ,然后循环操作十万次
  • 将过滤后的数据 insert 到一张临时表里,等数据全部插入后再一起更新

后者效率是前者的 60 倍左右,这里涉及到的问题是底层持久化需要做的 IO 消耗性能。

上周去参加了 Flink China 北京的 Meetup,有 360 、京东风控 、 GrowingIO 和 阿里巴巴的讲师,讲的都很出色,而且我还在现场面基了左耳听风的群友。