Comparados aos arquivos textuais em formato html, os repositórios organizados por metadados facilitam a extração de conteúdos na recuperação automática de documentos publicados na Web.