Ao serem armazenados no HDFS (Hadoop Distributed File System), os dados do Hadoop são divididos em blocos e distribuídos em discos distintos de um mesmo servidor, o que acelera o seu processamento, já que são pesquisados de forma simultânea, e não de forma sequencial.