Обработка данных — систематизация громоздких массивов информации для их упорядочивания и подготовки к дальнейшему анализу. Data scientists преобразуют большие наборы разрозненных данных в более понятный и структурированный вид, манипулируют ими, чтобы было удобнее провести анализ. Подготовку и преобразование данных можно провести при помощи Orange, NodeXL, Python, R, Power BI, Excel, Tableau, RapidMiner.