O título deste post/dica está meio vago, pelo menos para mim, mas sinceramente não estava inspirada para colocar algo melhor, mas garanto que o conteúdo é de muita utilidade
Às vezes quando buscamos alguma informação em algum banco, arquivo, ou seja onde for, essa informação vem acentuada e isto um boa parte das vezes não é algo que facilite o trabalho, então o que fazer, remover eles e se possível de maneira rápida, prática e principalmente limpa.
Darei dois exemplos de como fazer isso, o primeiro é em Python onde usaremos o módulo unicodedata:
import unicodedata name = 'Krix Apolinário' print unicodedata.normalize('NFKD', name.decode('utf-8')).encode('ascii', 'ignore') |
O segundo por linha de comando, nosso queridinho Bash:
echo "Krix Apolinário" | iconv -f "utf-8" -t "ascii//TRANSLIT" |
Parece bem simples não é? Rsrs na verdade é, pois o que acontece aqui é que estamos convertendo o charset de uma string para outro e o mesmo pode ser feito com arquivos também.