用命令行工具往往比用Hadoop快几百倍

2016/09/12 · 第697期 · 刷出好文章
原链:aadrake.com · 9分钟读完

几个GB的数据不叫大数据,不用什么大数据集群处理、也不用装什么特殊工具,笔记本电脑,简单命令行,一行流,就能快速处理了。

面试程序员的时候,一定要考察 Back-of-the-envelope calculation 的能力,给一个具体问题,能快速估算内存使用量、一台机器够不够用、大概的计算时间、能选择适当的工具等;熟记一些常用的数字,要用的时候,就像在脑中使用常量一样。推荐看看 Jeff Dean 的这个幻灯片

浏览量:2345
Tags: engineering · experience
猜你喜欢:

我读过的好书、 用过的好工具推荐: