woodwork.table_accessor.WoodworkTableAccessor.to_disk#

WoodworkTableAccessor.to_disk(path, format='csv', filename=None, data_subdirectory='data', typing_info_filename='woodwork_typing_info.json', compression=None, profile_name=None, **kwargs)[source]#

将 Woodwork 表写入磁盘，格式由 format 指定，位置由 path 指定。path 可以是本地路径或 S3 路径。如果写入 S3，将写入一个文件 tar 归档。

注意

序列化为 parquet 时，Woodwork 类型信息将存储在 parquet 文件元数据中，而不是单独的类型信息 JSON 文件中。为 typing_info_filename 提供的任何值都将被忽略。

参数:

path (str) – 要写入的磁盘位置（如果不存在，将作为目录创建）
format (str, 可选) – 用于写入 Woodwork 数据的格式。默认为 csv。可能的值包括: {‘csv’, ‘pickle’, ‘parquet’}。
filename (str, 可选) – 用于保存数据文件的名称。如果未指定，将默认为数据框的名称或“data”。
data_subdirectory (str, 可选) – 可选的子目录，将追加到 path 后。如果未指定，将默认为“data”。
typing_info_filename (str, 可选) – 用于存储 Woodwork 类型信息 JSON 数据的可选文件名。如果未指定，将默认为“woodwork_typing_info.json”。序列化为 parquet 时将被忽略。
compression (str, 可选) – 要使用的压缩名称。可能的值包括: {‘gzip’, ‘bz2’, ‘zip’, ‘xz’, None}。默认为 None。
profile_name (str, 可选) – 要使用的 AWS 配置文件名称，如果为 False 则使用匿名配置文件，如果为 None 则不指定。默认为 None。
kwargs (关键词, 可选) – 要作为关键词参数传递给底层序列化方法或用于指定 AWS 配置文件的其他关键词参数。