Imagem de fundo

João recebeu um arquivo texto, com dados sobre as dezenas de milhares de clientes da su...

João recebeu um arquivo texto, com dados sobre as dezenas de milhares de clientes da sua empresa, e precisa organizar e analisar esses dados. No arquivo, cada linha corresponde a um cliente, todas elas com o mesmo número de colunas separadas por tabulação. Há uma linha de títulos no início do arquivo.

Uma das melhorias que João pretende alcançar é padronizar a grafia dos nomes e códigos. Por exemplo, a cidade do Rio de Janeiro aparece como “Rio”, “R. Janeiro”, “Rio de Jan”, “RJ”, e assim por diante.

O mesmo ocorre para outras cidades. Para começar, é preciso identificar as diferentes grafias que ocorrem nas colunas a serem padronizadas. Há várias maneiras para fazer isso no MS Excel 2010, mas uma forma bastante simples é:

A
classificar todas as linhas usando as colunas no critério de classificação;
B
usar a função CONT.VALORES nas colunas;
C
usar o recurso de Validação de Dados nas colunas;
D
na guia Dados, importar o arquivo texto e aplicar filtros nas colunas;
E
usar a função FIND.DUPS nas colunas.