woodwork.table_accessor.WoodworkTableAccessor#
- class woodwork.table_accessor.WoodworkTableAccessor(dataframe)[source]#
-
方法
__init__
(dataframe)add_semantic_tags
(semantic_tags)为列添加指定的语义标签,更新 Woodwork 类型信息。
dependence
([measures, num_bins, nrows, ...])计算 DataFrame 中所有支持测量依赖性的列对之间的依赖性度量。
dependence_dict
([measures, num_bins, nrows, ...])计算 DataFrame 中所有支持测量依赖性的列对之间的依赖性度量。
describe
([include, callback, results_callback])计算 DataFrame 中包含的数据的统计信息。
describe_dict
([include, callback, ...])计算 DataFrame 中包含的数据的统计信息。
drop
(columns[, inplace])从 DataFrame 中删除指定的列。
get_valid_mi_columns
([include_index, ...])检索 DataFrame 中具有支持互信息的有效逻辑类型的列列表。
infer_temporal_frequencies
([...])推断每个时间列的观察频率(每日、每两周、每年等)
init
(**kwargs)使用部分模式初始化 DataFrame 的 Woodwork 类型信息。
init_with_full_schema
(schema[, validate])使用完整模式初始化 DataFrame 的 Woodwork 类型信息。
init_with_partial_schema
([schema, index, ...])使用部分模式初始化 DataFrame 的 Woodwork 类型信息。
mutual_information
([num_bins, nrows, ...])计算 DataFrame 中所有支持互信息的列对之间的互信息。
mutual_information_dict
([num_bins, nrows, ...])计算 DataFrame 中所有支持互信息的列对之间的互信息。
pearson_correlation
([nrows, include_index, ...])计算 DataFrame 中所有支持相关性的列对之间的皮尔逊相关系数。
pearson_correlation_dict
([nrows, ...])计算 DataFrame 中所有支持相关性的列对之间的皮尔逊相关系数。
pop
(column_name)返回带有 Woodwork 类型信息的 Series,并从 DataFrame 中移除该 Series。
remove_semantic_tags
(semantic_tags)移除提供的 semantic_tags 字典中任何列名的语义标签,更新 Woodwork 类型信息。
rename
(columns[, inplace])重命名 DataFrame 中的列,同时保持 Woodwork 类型信息。
reset_semantic_tags
([columns, retain_index_tags])将指定列的语义标签重置为默认值。
select
([include, exclude, return_schema])创建一个已初始化 Woodwork 类型信息的 DataFrame,其中仅包含逻辑类型和语义标签与包含或排除的类型和标签列表中指定的条件匹配的列。
set_index
(new_index)设置 DataFrame 的索引列。
set_time_index
(new_time_index)设置时间索引。
set_types
([logical_types, semantic_tags, ...])更新提供的类型字典中任何列名的逻辑类型和语义标签,更新 DataFrame 的 Woodwork 类型信息。
spearman_correlation
([nrows, include_index, ...])计算 DataFrame 中所有支持相关性的列对之间的 Spearman 相关系数。
spearman_correlation_dict
([nrows, ...])计算 DataFrame 中所有支持相关性的列对之间的 Spearman 相关系数。
获取 Woodwork 类型信息的字典表示。
to_disk
(path[, format, filename, ...])将 Woodwork 表写入磁盘,格式由 format 指定,位置由 path 指定。
validate_logical_types
([return_invalid_values])根据逻辑类型验证 DataFrame。
value_counts
([ascending, top_n, dropna])返回一个字典列表,其中包含每列中最常见值的计数(仅适用于
属性
基于整数位置的索引,用于按位置选择。
表的索引列
按标签或布尔数组访问一组行。
包含每列逻辑类型的字典
DataFrame 的元数据
DataFrame 的名称
包含每列物理类型的字典
DataFrame 的 Woodwork 类型信息的副本。
包含每列语义标签的字典
表的时间索引列
包含模式的物理 dtypes、逻辑类型和语义标签的 DataFrame。
包含表中每列 use_standard_tags 设置的字典