woodwork.table_accessor.WoodworkTableAccessor.to_disk#

WoodworkTableAccessor.to_disk(path, format='csv', filename=None, data_subdirectory='data', typing_info_filename='woodwork_typing_info.json', compression=None, profile_name=None, **kwargs)[source]#

将 Woodwork 表写入磁盘,格式由 format 指定,位置由 path 指定。path 可以是本地路径或 S3 路径。如果写入 S3,将写入一个文件 tar 归档。

注意

序列化为 parquet 时,Woodwork 类型信息将存储在 parquet 文件元数据中,而不是单独的类型信息 JSON 文件中。为 typing_info_filename 提供的任何值都将被忽略。

参数:
  • path (str) – 要写入的磁盘位置(如果不存在,将作为目录创建)

  • format (str, 可选) – 用于写入 Woodwork 数据的格式。默认为 csv。可能的值包括: {‘csv’, ‘pickle’, ‘parquet’}。

  • filename (str, 可选) – 用于保存数据文件的名称。如果未指定,将默认为数据框的名称或“data”。

  • data_subdirectory (str, 可选) – 可选的子目录,将追加到 path 后。如果未指定,将默认为“data”。

  • typing_info_filename (str, 可选) – 用于存储 Woodwork 类型信息 JSON 数据的可选文件名。如果未指定,将默认为“woodwork_typing_info.json”。序列化为 parquet 时将被忽略。

  • compression (str, 可选) – 要使用的压缩名称。可能的值包括: {‘gzip’, ‘bz2’, ‘zip’, ‘xz’, None}。默认为 None。

  • profile_name (str, 可选) – 要使用的 AWS 配置文件名称,如果为 False 则使用匿名配置文件,如果为 None 则不指定。默认为 None。

  • kwargs (关键词, 可选) – 要作为关键词参数传递给底层序列化方法或用于指定 AWS 配置文件的其他关键词参数。