File Connector介绍

GeaFlow 支持从文件中读取数据,也支持向文件写入数据。

语法

CREATE TABLE file_table (
  id BIGINT,
  name VARCHAR,
  age INT
) WITH (
    type='file',
    geaflow.dsl.file.path = '/path/to/file'
)

参数

参数名 是否必须 描述
geaflow.file.persistent.config.json JSON格式的DFS配置,会覆盖系统环境配置。
geaflow.dsl.file.path 读取或写入的文件或文件夹的路径
geaflow.dsl.column.separator 用于将文本分割为列的列分隔符。默认值为英文逗号','。
geaflow.dsl.line.separator 用于将文本分割为列的行分隔符。默认值为换行符'\n'。
geaflow.dsl.file.name.regex 读取文件名称正则过滤规则,默认为空。
geaflow.dsl.file.format 读写文件格式,支持parquet、txt,默认为txt。

示例

CREATE TABLE file_source (
  id BIGINT,
  name VARCHAR,
  age INT
) WITH (
    type='file',
    geaflow.dsl.file.path = '/path/to/file'
);

CREATE TABLE file_sink (
  id BIGINT,
  name VARCHAR,
  age INT
) WITH (
    type='file',
    geaflow.dsl.file.path = '/path/to/file'
);

INSERT INTO file_sink
SELECT * FROM file_source;