Facets是Google开源的一款可视化机器学习开源数据集工具, 包含两个部分 —— Facets Overview 和 Facets Dive ,允许用户以不同的粒度查看其数据的整体图像。Facets Overview 可用于可视化数据的每一个特征,Facets Dive 用来探索个别的数据观察集。

Facets Overview 可展示和比较数据集特征值的分布情况,例如训练集和测试集。阻碍机器学习的常见数据问题被高亮,比如出乎意料的特征值、具有高比例遗失值的特征、带有不平衡分布的特征,数据集之间的特征分布偏差等等。Facets Dive 则展示和探索数据集中不同特征数据点之间的关系。用户可以控制数万个数据点的位置、颜色和视觉表现。通过其特征值在多个维度上通过细分和过滤 faceting/bucketing 来定位点,识别复杂数据集的规律样式和异常值。

演示网站:https://pair-code.github.io/facets/