Abstract:
Automatic classification of deprived urban areas provides vital information for implementing pro-poor policies. In this paper, an approach for the classification of these areas in Brazilian cities is presented. Satellite images were obtained free of charge from six cities in the Brazilian semi-arid region using Google Earth Engine software. To assess the discriminative power of census data, data made publicly available by Brazilian Institute of Geography and Statistics (IBGE) were used to train SVM classifiers together with features extracted from images. The image features were extracted using the following approaches: color histograms, LBP histograms, and lacunarity. Four evaluation tests were investigated based on two criteria: use of census data and cross-validation method. Two types of cross-validation were used: 10-fold and leave-one-city-out. The use of census data caused a negative impact on the results. This impact is justified by the criteria on which census tracts are mapped in the country, not only morphological and visually perceptible through satellite images, as opposed to adopted extraction approaches. The best results obtained were average accuracy of 91.81% and average F1-score of 92.27%. This research contributes to the recognition of deprived urban areas and urban socio-spatial dynamics, supporting urban-territorial planning. A classificação automática de áreas urbanas desfavorecidas fornece informações vitais para a implementação de políticas pró-pobres. Neste artigo, é apresentada uma abordagem para a classificação dessas áreas nas cidades brasileiras. As imagens de satélite foram obtidas de modo gratuito para seis cidades do Semiárido brasileiro utilizando o software Google Earth Engine. Para avaliar o poder discriminativo dos dados censitários, foram utilizados dados disponibilizados publicamente pelo Instituto Brasileiro de Geografia e Estatística (IBGE) para treinar classificadores SVM juntamente com características extraídas de imagens. As características da imagem foram extraídas usando as seguintes abordagens: histogramas de cores, histogramas de LBP e lacunaridade. Quatro testes de avaliação foram investigados com base em dois critérios: uso de dados censitários e método de validação cruzada. Foram utilizados dois tipos de validação cruzada: 10 vezes e deixar uma cidade de fora. O uso de dados censitários causou impacto negativo nos resultados. Esse impacto é justificado pelos critérios sobre os quais os setores censitários são mapeados no país, não apenas morfológicos e visualmente perceptíveis por meio de imagens de satélite, ao contrário das abordagens de extração adotadas. Os melhores resultados obtidos foram acurácia média de 91,81% e F1-score médio de 92,27%. Essa pesquisa contribui para o reconhecimento de áreas urbanas precárias e de dinâmicas socioespaciais urbanas, dando suporte ao planejamento urbano-territorial.