ClusterBasedNormalizer vs GaussianNormalizer vs PowerTransformer

When using CTGAN, data is normalized using ClusterBasedNormalizer.

In RDT, GaussianNormalizer is also implemented.

What are the advantages of ClusterBasedNormalizer and GaussianNormalizer compared to using sklearn's PowerTransformer (https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.PowerTransformer.html) with the Yeo-Johnson method? Couldn't a power transform be used instead (which would perhaps be faster than ClusterBasedNormalizer)?

Thank you

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ClusterBasedNormalizer vs GaussianNormalizer vs PowerTransformer #613

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

ClusterBasedNormalizer vs GaussianNormalizer vs PowerTransformer #613

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions