Singer 修改tap-s3-csv 支持minio 连接
singer 团队官方处了一个tap-s3-csv 的tap,对于没有使用aws 的人来说并不是很方便了,所以简单修改了 下源码,可以支持通用的s3 csv 文件的处理,同时发布到了官方pip 仓库中,方便大家使用。 以下是简单代码修改部分的说明,以及如何发布pip包 修改说明 主要是关于连接s3 的部分,因为tap-s3-csv 使用的是boto3 我们需要修改的就是关于boto3 连接s3 的部署 添加上 aws_access_key_id , aws_secret_access_key , endpoint_url 关于s3 自定义连接的说明,格式如下: s3_client = boto3.session.Session().client( service_name='s3', aws_access_key_id=aws_access_key_id, aws_secret_access_key=aws_secret_access_key, endpoint_url=endpoint_url, ) 几个需要修改的部分 s3.py get_input_files_for_table 部分,主要是传递参数的 修改如下: def get_input_files_for_table(config, table_spec, modified_since=None): bucket =