在日常工作,查看服务器的负载、CPU 及内存使用情况,尤其查看进程使用内存、CPU 的占比,定位哪个进程占用了最多的内存及 CPU 周期,这个时候,就可以使用 Top 命令了。

阅读全文 »

Elasticsearch 提供了行存及列存的能力,行存用于搜索功能,列存用于聚合和计算。这两种存储模型在文件系统中是如何实现的?它们之间有什么差异?这篇文章对其做一个简单的分析。

阅读全文 »

如何衡量一个系统的好坏,如何提升它,如何管理它? 管理学大师彼得·德鲁克曾说 “你如果无法度量它,就无法管理它 (If you can’t measure it, you can’t manage it)”。从这里可以看出,如果想全面管理提升一个系统,就需要先对它的各项性能指标有一个衡量,知道它的薄弱点在哪里,找到病症所在才能对症下药。

阅读全文 »

影响网络通信质量的两大因素:延迟和带宽。延迟主要指分组从信息源发送到目的地所需的时间,而带宽主要是指逻辑或物理通信路径最大的吞吐量。这篇文章主要讲述网络延迟的组成部分及如何评估传输速率及理论上的最大传输速率。

阅读全文 »

这个系列主要记录常用的量化指标,如网络传输、性能、监控指标及关于量化的方法论。这些指标给出了能力的边界,可以有助于我们在做系统设计时限定系统性能的边界,为设计决策提供数据的支撑,最终优化系统的设计。

阅读全文 »
0%