Hive类型API说明
更新时间: 2024-12-04 15:43:56
对于API调用者,不需要关心底层技术细节,只需要在API集市获取API,申请绑定应用即可,参照章节1的调用方式进行API调用即可。
对于API开发者,在创建Hive类型的API时,需要注意以下几点:
Hive API底层查询基于impala(依赖平台自助分析impala集群),所以查询比较耗时,不建议使用Hive API查询大量数据,不建议用在线上场景。
Hive数据源只支持有数大数据平台自带的Hive,不支持外部Hive,自带的Hive数据源已经预置,不需要额外登记。
需保证Hive数据表元信息同步到Impala,建议创建Hive表时开启Impala同步或执行"INVALIDATE METADATA table_name;" 语句同步元数据。
说明: Hive API的数据查询基于Impala(和自助分析使用相同Impala集群),从保障查询响应时间和Impala集群稳定性角度考虑,仅建议将Hive API开放给BI场景或QPS不高的数据产品场景,并且建议配置流量控制,防止下游调用方并发过高对Impala集群稳定性造成影响。ToB或者ToC等高QPS的场景,建议可以先将Hive数据导入到支持在线查询场景的数据源中,比如MySQL、Oracle等,再进行数据API的开发。 |