📜  HCatalog教程

📅  最后修改于: 2020-11-30 04:21:55             🧑  作者: Mango

HCatalog教程

HCatalog是用于Hadoop的表存储管理工具,可将Hive元存储的表格数据公开给其他Hadoop应用程序。它使使用不同数据处理工具(Pig,MapReduce)的用户可以轻松地将数据写入网格。 HCatalog确保用户不必担心数据存储在何处或以何种格式存储。这是一个小教程,仅解释HCatalog的基础知识和使用方法。

本教程适用于希望使用Hadoop框架从事大数据分析职业的专业人员。一般而言,从事分析的ETL开发人员和专业人员也可以使用本教程取得良好效果。

先决条件

在继续本教程之前,您需要具有Java的基本知识,SQL的数据库概念,Hadoop文件系统以及任何Linux操作系统版本。