📝 Hive教程

20篇技术文档
  Hive教程

📅  最后修改于: 2020-11-30 04:49:01        🧑  作者: Mango

Hive是一个数据仓库基础架构工具,用于处理Hadoop中的结构化数据。它驻留在Hadoop之上以汇总大数据,并使查询和分析变得容易。这是一个简短的教程,提供有关如何将Apache Hive HiveQL与Hadoop分布式文件系统一起使用的介绍。本教程可以成为您成为Hive成功的Hadoop开发人员的第一步。本教程是为渴望使用Hadoop框架从事大数据分析的专业人士准备的。一般而言,从事分析的E...

  Hive-简介

📅  最后修改于: 2020-11-30 04:49:29        🧑  作者: Mango

术语“大数据”用于大型数据集的集合,这些数据集包括庞大的数据量,高速度以及各种数据,这些数据每天都在增加。使用传统的数据管理系统,很难处理大数据。因此,Apache Software Foundation引入了一个名为Hadoop的框架来解决大数据管理和处理难题。Hadoop的Hadoop是一个开放源代码框架,用于在分布式环境中存储和处理大数据。它包含两个模块,一个是MapReduce,另一个是H...

  Hive-安装

📅  最后修改于: 2020-11-30 04:50:46        🧑  作者: Mango

Hive,Pig和HBase等所有Hadoop子项目都支持Linux操作系统。因此,您需要安装任何Linux风格的OS。对于Hive安装,执行以下简单步骤:步骤1:验证JAVA安装在安装Hive之前,必须在系统上安装Java。让我们使用以下命令验证Java安装:如果您的系统上已经安装了Java,则会看到以下响应:如果您的系统中未安装Java,请按照以下步骤安装Java。安装Java步骤一:通过访问...

  Hive-数据类型

📅  最后修改于: 2020-11-30 04:51:08        🧑  作者: Mango

本章将带您了解Hive中创建表所涉及的不同数据类型。 Hive中的所有数据类型分为以下四种类型:列类型字面量空值复杂类型列类型列类型用作Hive的列数据类型。它们如下:整体类型可以使用整数数据类型INT指定整数类型数据。当数据范围超出INT的范围时,您需要使用BIGINT;如果数据范围小于INT,则使用SMALLINT。 TINYINT小于SMALLINT。下表描述了各种INT数据类型:TypeP...

  Hive-创建数据库

📅  最后修改于: 2020-11-30 04:51:26        🧑  作者: Mango

Hive是一种数据库技术,可以定义数据库和表来分析结构化数据。结构化数据分析的主题是以表格形式存储数据,并传递查询以对其进行分析。本章介绍如何创建Hive数据库。 Hive包含一个名为default的默认数据库。创建数据库语句创建数据库是用于在Hive中创建数据库的语句。 Hive中的数据库是名称空间或表的集合。该语句的语法如下:此处,IF NOT EXISTS是可选子句,它通知用户已经存在具有相...

  Hive-放置数据库

📅  最后修改于: 2020-11-30 04:51:43        🧑  作者: Mango

本章介绍如何在Hive中删除数据库。 SCHEMA和DATABASE的用法相同。删除数据库语句删除数据库是删除所有表并删除数据库的语句。其语法如下:以下查询用于删除数据库。让我们假设数据库名称为userdb。以下查询使用CASCADE删除数据库。这意味着在删除数据库之前先删除相应的表。以下查询使用SCHEMA删除数据库。此子句是在Hive 0.6中添加的。JDBC程序下面给出了删除数据库的JDBC...

  Hive-创建表

📅  最后修改于: 2020-11-30 04:52:12        🧑  作者: Mango

本章介绍如何创建表以及如何在表中插入数据。在HIVE中创建表的约定与使用SQL创建表非常相似。创建表语句创建表是用于在Hive中创建表的语句。语法和示例如下:句法例让我们假设您需要使用CREATE TABLE语句创建一个名为employee的表。下表列出了employee表中的字段及其数据类型:Sr.NoField NameData Type1Eidint2NameString3SalaryFlo...

  Hive-修改表

📅  最后修改于: 2020-11-30 04:52:42        🧑  作者: Mango

本章说明如何更改表的属性,例如更改表名称,更改列名称,添加列以及删除或替换列。修改表语句它用于更改Hive中的表。句法该语句根据我们希望在表中修改哪些属性而采用以下任何语法。重命名为…声明以下查询将表从employee重命名为emp。JDBC程序重命名表的JDBC程序如下。将程序保存在名为HiveAlterRenameTo.java的文件中。使用以下命令来编译和执行该程序。输出:变更声明下表包含e...

  Hive-放置表

📅  最后修改于: 2020-11-30 04:52:59        🧑  作者: Mango

本章介绍如何在Hive中删除表。当您从Hive Metastore中删除表时,它会删除表/列数据及其元数据。它可以是普通表(存储在Metastore中)或外部表(存储在本地文件系统中);无论它们的类型如何,Hive都以相同的方式对待它们。删除表声明语法如下:以下查询删除一个名为employee的表:成功执行查询后,您将看到以下响应:JDBC程序以下JDBC程序删除了employee表。将程序保存在...

  配置单元-分区

📅  最后修改于: 2020-11-30 04:53:18        🧑  作者: Mango

Hive将表组织到分区中。这是一种基于分区列的值(例如日期,城市和部门)将表划分为相关部分的方法。使用分区,很容易查询一部分数据。表或分区被细分为存储桶,以提供可用于更有效查询的数据额外结构。存储桶基于表某列的哈希函数的值进行函数。例如,名为Tab1的表包含员工数据,例如id,姓名,部门和年龄(即加入的年份)。假设您需要检索所有2012年加入的员工的详细信息。查询将在整个表中搜索所需的信息。但是,...

  Hive-内置操作员

📅  最后修改于: 2020-11-30 04:53:49        🧑  作者: Mango

本章介绍了Hive的内置运算符。 Hive中有四种类型的运算符:关系运算符算术运算符逻辑运算符复杂运算符关系运算符这些运算符用于比较两个操作数。下表描述了Hive中可用的关系运算符:OperatorOperandDescriptionA = Ball primitive typesTRUE if expression A is equivalent to expression B otherwis...

  Hive-内置功能

📅  最后修改于: 2020-11-30 04:54:13        🧑  作者: Mango

本章介绍了Hive中可用的内置功能。这些函数除了用途外,看上去与SQL函数非常相似。内建功能Hive支持以下内置功能:Return TypeSignatureDescriptionBIGINTround(double a)It returns the rounded BIGINT value of the double.BIGINTfloor(double a)It returns the max...

  Hive-视图和索引

📅  最后修改于: 2020-11-30 04:54:34        🧑  作者: Mango

本章介绍如何创建和管理视图。视图是根据用户要求生成的。您可以将任何结果集数据保存为视图。 Hive中视图的用法与SQL中视图的用法相同。这是标准的RDBMS概念。我们可以在视图上执行所有DML操作。创建一个视图您可以在执行SELECT语句时创建视图。语法如下:例让我们以一个例子为例。假设如下所示的雇员表,其中包含ID,姓名,薪水,指定和部门。生成查询以检索薪水超过30000卢比的雇员详细信息。我们...

  HiveQL-选择位置

📅  最后修改于: 2020-11-30 04:54:56        🧑  作者: Mango

Hive查询语言(HiveQL)是Hive处理和分析Metastore中结构化数据的查询语言。本章说明如何将SELECT语句与WHERE子句一起使用。SELECT语句用于从表中检索数据。 WHERE子句的工作原理类似于条件。它使用条件过滤数据,并为您提供有限的结果。内置的运算符和函数生成一个满足条件的表达式。句法以下是SELECT查询的语法:例让我们以SELECT … WHERE子句为例。假设我们...

  HiveQL-选择订单依据

📅  最后修改于: 2020-11-30 04:55:16        🧑  作者: Mango

本章说明如何在SELECT语句中使用ORDER BY子句。 ORDER BY子句用于根据一列检索详细信息,并按升序或降序对结果集进行排序。句法下面给出的是ORDER BY子句的语法:例让我们以SELECT … ORDER BY子句为例。假定员工表如下所示,其字段名为Id,Name,Salary,Designation和Dept。使用Department name生成查询以按顺序检索员工详细信息。以...