上QQ阅读APP看书，第一时间看更新

第6章内存管理

在现阶段，大部分开源的大数据计算引擎都是用Java或者是基于JVM的编程语言实现的，如Apache Hadoop、Apache Spark、Apache Drill、Apache Flink等。Java语言的好处是不用考虑底层，降低了程序员的门槛，JVM可以对代码进行深度优化，对内存资源进行管理，自动回收内存。但是自动内存管理的问题在于不可控，基于JVM的大数据引擎常常会面临一个问题，即在处理海量数据的时候，如何在内存中存储大量的数据（包括缓存和高效处理）。

第6章 内存管理

第6章内存管理