小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Hive學(xué)習(xí)之路 (三)Hive元數(shù)據(jù)信息對應(yīng)MySQL數(shù)據(jù)庫表

 HK123COM 2019-02-14

目錄

 

正文

概述

Hive 的元數(shù)據(jù)信息通常存儲在關(guān)系型數(shù)據(jù)庫中,常用MySQL數(shù)據(jù)庫作為元數(shù)據(jù)庫管理。上一篇hive的安裝也是將元數(shù)據(jù)信息存放在MySQL數(shù)據(jù)庫中。

Hive的元數(shù)據(jù)信息在MySQL數(shù)據(jù)中有57張表

一、存儲Hive版本的元數(shù)據(jù)表(VERSION)

 VERSION   -- 查詢版本信息

該表比較簡單,但很重要。

VER_ID SCHEMA_VERSION VERSION_COMMENT
ID主鍵 Hive版本 版本說明
1 0.13.0 Set by MetaStore

如果該表出現(xiàn)問題,根本進(jìn)入不了Hive-Cli。

比如該表不存在,當(dāng)啟動Hive-Cli時候,就會報(bào)錯”Table ‘hive.version’ doesn’t exist”。

二、Hive數(shù)據(jù)庫相關(guān)的元數(shù)據(jù)表(DBS、DATABASE_PARAMS)

1、DBS

DBS     -- 存儲Hive中所有數(shù)據(jù)庫的基本信息

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
DB_ID 數(shù)據(jù)庫ID 2
DESC 數(shù)據(jù)庫描述 測試庫
DB_LOCATION_URI 數(shù)據(jù)庫HDFS路徑 hdfs://namenode/user/hive/warehouse/lxw1234.db
NAME 數(shù)據(jù)庫名 lxw1234
OWNER_NAME 數(shù)據(jù)庫所有者用戶名 lxw1234
OWNER_TYPE 所有者角色 USER

2、DATABASE_PARAMS

DATABASE_PARAMS  --該表存儲數(shù)據(jù)庫的相關(guān)參數(shù),在CREATE DATABASE時候用

WITH DBPROPERTIES (property_name=property_value, …)指定的參數(shù)。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
DB_ID 數(shù)據(jù)庫ID 2
PARAM_KEY 參數(shù)名 createdby
PARAM_VALUE 參數(shù)值 lxw1234

注意:

DBS和DATABASE_PARAMS這兩張表通過DB_ID字段關(guān)聯(lián)。

三、Hive表和視圖相關(guān)的元數(shù)據(jù)表

主要有TBLS、TABLE_PARAMS、TBL_PRIVS,這三張表通過TBL_ID關(guān)聯(lián)。

1、TBLS

 該表中存儲Hive表、視圖、索引表的基本信息。

 

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
TBL_ID 表ID 1
CREATE_TIME 創(chuàng)建時間 1436317071
DB_ID 數(shù)據(jù)庫ID 2,對應(yīng)DBS中的DB_ID
LAST_ACCESS_TIME 上次訪問時間 1436317071
OWNER 所有者 liuxiaowen
RETENTION 保留字段 0
SD_ID 序列化配置信息 86,對應(yīng)SDS表中的SD_ID
TBL_NAME 表名 lxw1234
TBL_TYPE 表類型 MANAGED_TABLE、EXTERNAL_TABLE、INDEX_TABLE、VIRTUAL_VIEW
VIEW_EXPANDED_TEXT 視圖的詳細(xì)HQL語句 select `lxw1234`.`pt`, `lxw1234`.`pcid` from `liuxiaowen`.`lxw1234`
VIEW_ORIGINAL_TEXT 視圖的原始HQL語句 select * from lxw1234

2、TABLE_PARAMS

該表存儲表/視圖的屬性信息。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
TBL_ID 表ID 1
PARAM_KEY 屬性名 totalSize、numRows、EXTERNAL
PARAM_VALUE 屬性值 970107336、21231028、TRUE

 3、TBL_PRIVS

 該表存儲表/視圖的授權(quán)信息

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
TBL_GRANT_ID 授權(quán)ID 1
CREATE_TIME 授權(quán)時間 1436320455
GRANT_OPTION   0
GRANTOR 授權(quán)執(zhí)行用戶 liuxiaowen
GRANTOR_TYPE 授權(quán)者類型 USER
PRINCIPAL_NAME 被授權(quán)用戶 username
PRINCIPAL_TYPE 被授權(quán)用戶類型 USER
TBL_PRIV 權(quán)限 Select、Alter
TBL_ID 表ID 22,對應(yīng)TBLS表中的TBL_ID

四、Hive文件存儲信息相關(guān)的元數(shù)據(jù)表

  主要涉及SDS、SD_PARAMS、SERDES、SERDE_PARAMS

  由于HDFS支持的文件格式很多,而建Hive表時候也可以指定各種文件格式,Hive在將HQL解析成MapReduce時候,需要知道去哪里,使用哪種格式去讀寫HDFS文件,而這些信息就保存在這幾張表中。

1、SDS

  該表保存文件存儲的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否壓縮等。

  TBLS表中的SD_ID與該表關(guān)聯(lián),可以獲取Hive表的存儲信息。

 

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
SD_ID 存儲信息ID 1
CD_ID 字段信息ID 21,對應(yīng)CDS表
INPUT_FORMAT 文件輸入格式 org.apache.hadoop.mapred.TextInputFormat
IS_COMPRESSED 是否壓縮 0
IS_STOREDASSUBDIRECTORIES 是否以子目錄存儲 0
LOCATION HDFS路徑 hdfs://namenode/hivedata/warehouse/ut.db/t_lxw
NUM_BUCKETS 分桶數(shù)量 5
OUTPUT_FORMAT 文件輸出格式 org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
SERDE_ID 序列化類ID 3,對應(yīng)SERDES表

 2、SD_PARAMS

  該表存儲Hive存儲的屬性信息,在創(chuàng)建表時候使用

  STORED BY ‘storage.handler.class.name’ [WITH SERDEPROPERTIES (…)指定。

元數(shù)據(jù)表字段

說明   示例數(shù)據(jù)
 SD_ID 存儲配置ID 
 PARAM_KEY 存儲屬性名  
 PARAM_VALUE 存儲屬性值   

 3、SERDES

 該表存儲序列化使用的類信息

 

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
SERDE_ID 序列化類配置ID 1
NAME 序列化類別名  
SLIB 序列化類 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

 4、SERDE_PARAMS

 該表存儲序列化的一些屬性、格式信息,比如:行、列分隔符

 

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
SERDE_ID 序列化類配置ID 1
PARAM_KEY 屬性名 field.delim
PARAM_VALUE 屬性值 ,

五、Hive表字段相關(guān)的元數(shù)據(jù)表

主要涉及COLUMNS_V2

1、COLUMNS_V2

該表存儲表對應(yīng)的字段信息。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
CD_ID 字段信息ID 1
COMMENT 字段注釋  
COLUMN_NAME 字段名 pt
TYPE_NAME 字段類型 string
INTEGER_IDX 字段順序 2

 六、Hive表分區(qū)相關(guān)的元數(shù)據(jù)表

主要涉及PARTITIONS、PARTITION_KEYS、PARTITION_KEY_VALS、PARTITION_PARAMS

1、PARTITIONS

 該表存儲表分區(qū)的基本信息。

 

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
PART_ID 分區(qū)ID 1
CREATE_TIME 分區(qū)創(chuàng)建時間  
LAST_ACCESS_TIME 最后一次訪問時間  
PART_NAME 分區(qū)名 pt=2015-06-12
SD_ID 分區(qū)存儲ID 21
TBL_ID 表ID 2

2、PARTITION_KEYS

該表存儲分區(qū)的字段信息。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
TBL_ID 表ID 2
PKEY_COMMENT 分區(qū)字段說明  
PKEY_NAME 分區(qū)字段名 pt
PKEY_TYPE 分區(qū)字段類型 string
INTEGER_IDX 分區(qū)字段順序 1

3、PARTITION_KEY_VALS

該表存儲分區(qū)字段值。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
PART_ID 分區(qū)ID 2
PART_KEY_VAL 分區(qū)字段值 2015-06-12
INTEGER_IDX 分區(qū)字段值順序 0

4、PARTITION_PARAMS

該表存儲分區(qū)的屬性信息。

元數(shù)據(jù)表字段 說明 示例數(shù)據(jù)
PART_ID 分區(qū)ID 2
PARAM_KEY 分區(qū)屬性名 numFiles、numRows
PARAM_VALUE 分區(qū)屬性值 15、502195

七、其他不常用的元數(shù)據(jù)表

  • DB_PRIVS

數(shù)據(jù)庫權(quán)限信息表。通過GRANT語句對數(shù)據(jù)庫授權(quán)后,將會在這里存儲。

  • IDXS

索引表,存儲Hive索引相關(guān)的元數(shù)據(jù)

  • INDEX_PARAMS

索引相關(guān)的屬性信息。

  • TAB_COL_STATS

表字段的統(tǒng)計(jì)信息。使用ANALYZE語句對表字段分析后記錄在這里。

  • TBL_COL_PRIVS

表字段的授權(quán)信息

  • PART_PRIVS

分區(qū)的授權(quán)信息

  • PART_COL_STATS

分區(qū)字段的統(tǒng)計(jì)信息。

  • PART_COL_PRIVS

分區(qū)字段的權(quán)限信息。

  • FUNCS

用戶注冊的函數(shù)信息

  • FUNC_RU

用戶注冊函數(shù)的資源信息

 

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多