Hive在主节点上有一个关系数据库,它用于跟踪状态。
例如,当你创建表CREATE TABLE FOO(foo string) LOCATION 'hdfs://tmp/';,
,此表结构存储在数据库中。
如果你是分区表,则分区存储在数据库中(这允许Hive要使用分区列表而不进入文件系统并找到它们)。 这些存储的信息就是’metadata’。
删除内部表时,它会丢弃数据,并丢弃元数据。
丢弃外部表时,它只丢弃元数据。
引用
https://stackoverflow.com/questions/17038414/difference-between-hive-internal-tables-and-external-tables