woodwork.table_schema.ColumnSchema#

class woodwork.table_schema.ColumnSchema(logical_type=None, semantic_tags=None, use_standard_tags=False, description=None, origin=None, metadata=None, validate=True)[源]#
__init__(logical_type=None, semantic_tags=None, use_standard_tags=False, description=None, origin=None, metadata=None, validate=True)[源]#

创建 ColumnSchema

参数:
  • logical_type (LogicalType, 可选) – 列的逻辑类型。

  • semantic_tags (str, list, set, 可选) – 为列指定的语义标签。

  • use_standard_tags (boolean, 可选) – 如果为 True,并且为列定义了逻辑类型,则将基于指定的逻辑类型为列添加标准语义标签。默认为 False。

  • description (str, 可选) – 用户对列的描述。

  • origin (str, 可选) – 列的来源(例如,“base”或“engineered”)。

  • metadata (dict[str -> json serializable], 可选) – 用户提供的额外元数据。字典必须包含可 JSON 序列化的数据类型,如字符串、整数和浮点数。不支持 DataFrame 和 Series 类型。

  • validate (bool, 可选) – 是否执行参数验证。默认为 True。

方法

__init__([logical_type, semantic_tags, ...])

创建 ColumnSchema

属性

custom_tags

为列指定的自定义语义标签。

description

列的描述

is_boolean

ColumnSchema 是否为布尔列

is_categorical

ColumnSchema 本质上是否为类别类型

is_datetime

ColumnSchema 是否为日期时间列

is_latlong

ColumnSchema 是否为经纬度列

is_natural_language

ColumnSchema 是否为自然语言列

is_numeric

ColumnSchema 本质上是否为数值类型

is_ordinal

ColumnSchema 是否为有序类别列

is_unknown

ColumnSchema 是否为未知列

metadata

列的元数据

origin

列的来源