Detecting Hidden Bias in Datasets Before Models Fail Berlin Buzzwords 2026

Detecting Hidden Bias in Datasets Before Models Fail
.ical
2026-06-09 14:50–15:30, Palais Atelier

Hidden bias in datasets silently breaks machine learning systems in production. This talk shows how to detect data imbalance, leakage, and coverage gaps early using practical metrics, visualizations, and open-source tools—before misleading offline metrics turn into costly real-world failures.

Machine learning models rarely fail because of algorithms — they fail because of data. This talk focuses on practical techniques for detecting hidden bias in datasets before models reach production. Drawing from real-world ML systems, it covers how regional, temporal, and behavioral imbalances distort model behavior while remaining invisible to standard metrics. Attendees will learn how to identify distribution drift, uncover feature leakage, and detect coverage gaps across segments and time windows. The session demonstrates concrete workflows, diagnostics, and visualizations that can be applied using open-source tools to improve data quality, model reliability, and long-term trust in ML-driven products.

Level: Advanced

See also: Presentation (340.0 KB)

Stas Don

Stanislav Don is a Data Scientist at eBay, working on production machine learning systems and model reliability. His work focuses on data quality, bias detection, and monitoring ML models in real-world environments. He regularly shares practical lessons from deploying ML at scale through conference talks and applied research.

Detecting Hidden Bias in Datasets Before Models Fail .ical 2026-06-09 14:50–15:30, Palais Atelier

Detecting Hidden Bias in Datasets Before Models Fail
.ical
2026-06-09 14:50–15:30, Palais Atelier