Removendo a acentuação com Python e Bash

Por Sem comentários , ,

O título deste post/dica está meio vago, pelo menos para mim, mas sinceramente não estava inspirada para colocar algo melhor, mas garanto que o conteúdo é de muita utilidade ;)

Às vezes quando buscamos alguma informação em algum banco, arquivo, ou seja onde for, essa informação vem acentuada e isto um boa parte das vezes não é algo que facilite o trabalho, então o que fazer, remover eles e se possível de maneira rápida, prática e principalmente limpa.

Darei dois exemplos de como fazer isso, o primeiro é em Python onde usaremos o módulo unicodedata:

import unicodedata
 
name = 'Krix Apolinário'
 
print unicodedata.normalize('NFKD', name.decode('utf-8')).encode('ascii', 'ignore')

O segundo por linha de comando, nosso queridinho Bash:

echo "Krix Apolinário" | iconv -f "utf-8" -t "ascii//TRANSLIT"

Parece bem simples não é? Rsrs na verdade é, pois o que acontece aqui é que estamos convertendo o charset de uma string para outro e o mesmo pode ser feito com arquivos também.