而这三篇论文也就是我们熟知的大数据三驾马车,分别是分布式文件系统 GFS、大数据分布式计算框架 MapReduce 和 NoSQL 数据库 BigTable,这三篇论文影响了当今大数据生态,可以称得上大数据的基石,Doug cutting 大佬在... Pig 有个问题虽然比直接编写 MR 成需要容器但是仍然需要去学习新的脚本语法,于是 Facebook 又发明了 HIve 支持使用 SQL 语言进行大数据计算,然后转化成 MR 计算程序运行,极大的简化了 MapReduce 分布式程序的门槛,...