1.1 本书内容

描述的是将非结构化或者同时又很凌乱的数据整理成结构化、清晰形式的整个过程。时下,这个词在很多数据骇客中流传。在英文中,“Munge”(处理)和“grunge”(垃圾)谐音。

伪代码

用一种类似代码的形式描述算法或者过程,而事实上又不是实际有效的源代码。

语法糖

并不增加新特性,但便利于代码编写的编程语法。