Apache Hive数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和JDBC驱动程序以将用户连接到Hive。

Hive是基于Hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。
Hive特性:
灵活方便的ETL (extract/transform/load)。
支持Tez,Spark等多种计算引擎。
可直接访问HDFS文件以及HBase。
易用易编程。

2025-03-11T08:04:28.png

2025-03-11T08:04:54.png

2025-03-11T08:04:43.png

2025-03-11T08:05:08.png

第03章 Hive分布式数据仓库.pptx

链接: https://pan.baidu.com/s/1O1MOIUQktA1yhCo1pZR8jQ 提取码: q52y

添加新评论