此页面由 Cloud Translation API 翻译。

数据陷阱

学习目标

在本单元中，您将学习：

调查原始数据集或已处理数据集的潜在问题，包括收集和质量问题
识别偏见、无效推论和合理化。
发现数据分析中的常见问题，包括相关性、相关性和相关性。
检查图表中是否存在常见问题、误解和误导性的显示和设计选择。

机器学习的动机

虽然没有模型架构和其他下游模型工作那么迷人，数据探索、文档和预处理对于机器学习系统。机器学习从业者可能会遇到 Nithya Sambasivan 等人名为数据级联在 2021 年 ACM 论文中如果客户不能深入了解：

收集其数据的条件
数据的质量、特征和限制
数据可以显示和不能显示的内容

用不良数据训练模型代价很高，只有在输出质量不佳时，数据。同样，如果无法理解数据的局限性，在收集数据时存在偏差，或者误将相关性判断为因果关系，则可能导致过度承诺和交付不足，从而可能导致信任。

本课程详细介绍了机器学习和数据可以发现的常见但微妙的数据陷阱从业者在工作中可能会遇到的各种问题。

数据质量和解释

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2024-07-26。