Impala 表使用 RCFile 文件格式(翻译)
Impala 表使用 RCFile 文件格式 Cloudera Impala 支持使用 RCFile 数据文件。 查询一下章节了解 Impala 表使用 RCFile 数据文件的详情: 创建RCFile 表并加载数据 RCFile 表启用压缩 创建 RCFile 表并加载数据 假如你没有使用现有的数据文件,先创建一个合适格式的文件。 创建 RCFile 表: 在 impala-shell 中,执行类似下面的命令: create table rcfile_table (column_specs) stored as rcfile; 因为 Impala 可以查询一些目前它无法写入数据的表,当创建特定格式的表之后,你可能需要在 Hive shell 中加载数据。参见 Impala 如何使用 Hadoop 文件格式 了解详细信息。当通过 Hive 或其他 Impala 之外的机制加载数据之后,在你下次连接到 Impala 节点时,在执行关于这个表的查询之前,执行 REFRESH table_name 语句,以确保 Impala 识别到新添加的数据。 例如,下面是你如何在 Impala 中创建 RCFile 表(通过显式设置列,或者克隆其他表的结构),通过 Hive 加载数据,并通过 Impala 查询: $ impala-shell -i localhost [localhost