woodwork.deserialize.read_woodwork_table#
- woodwork.deserialize.read_woodwork_table(path, filename=None, data_subdirectory='data', typing_info_filename='woodwork_typing_info.json', profile_name=None, validate=False, format=None, **kwargs)[源码]#
从磁盘、S3 路径或 URL 读取 Woodwork 表。
- 参数:
path (str) – 要读取数据和类型信息的磁盘目录、S3 路径或 URL。
filename (str, 可选) – 序列化期间用于存储数据的文件名。如果未指定,将从类型信息文件确定。从单个 parquet 文件反序列化时必须指定。
data_subdirectory (str, 可选) – 序列化期间存储数据的子目录。默认为“data”。
typing_info_filename (str, 可选) – 序列化期间用于存储 Woodwork 类型信息的 JSON 文件名。默认为“woodwork_typing_info.json”。
format (str, 可选) – 用于序列化数据的格式。如果序列化文件名后缀与格式不匹配,则此项为必填项。
profile_name (str, bool) – 用于写入 S3 的 AWS 配置文件。默认为 None 并搜索 AWS 凭据。设置为 False 以使用匿名配置文件。
validate (bool, 可选) – 反序列化期间初始化 Woodwork 数据框时是否应该进行参数和数据验证。默认为 False。注意:如果在 Woodwork 之外修改了序列化数据,且不确定数据或类型信息的有效性,应将 validate 设置为 True。
kwargs (关键字参数) – 作为关键字参数传递给底层反序列化方法的额外关键字参数。
- 返回:
带有 Woodwork 类型信息的数据框(DataFrame)。
- 返回类型:
DataFrame