Consistência dos dados no ep2

Consistência dos dados no ep2

by Viktor Chust Bugno Pires de Almeida -
Number of replies: 1

Quando o programa faz a separação das palavras, como devem ser tratados os sinais de pontuação? Preciso fazer meu programa de tal forma que ele processe ou elimine os sinais? Ou simplesmente devo assumir que o texto de entrada não contenha pontuação?

In reply to Viktor Chust Bugno Pires de Almeida

Re: Consistência dos dados no ep2

by José Coelho de Pina -

Preciso fazer meu programa de tal forma que ele processe ou elimine os sinais?

Veja o exemplo a seguir.

Python 3.4.3 (default, Mar 26 2015, 22:07:01) 
[GCC 4.9.2] on linux
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>>
>>> # vejamos o conteúdo do arquivo pessoa.txt
>>> nome_arquivo = "pessoa.txt"
>>> with open(nome_arquivo,"r",encoding="utf-8") as arq:
	texto = arq.read() # leia todo o arquivo


>>> # vejamos o conteúdo so string texto	
>>> texto
'E eu, tantas vezes reles, tantas vezes porco, tantas vezes vil,\nEu tantas vezes irrespondivelmente parasita,\nIndesculpavelmente sujo,\nEu, que tantas vezes não tenho tido paciência para tomar banho,\nEu, que tantas vezes tenho sido ridículo, absurdo,\nQue tenho enrolado os pés publicamente nos tapetes das etiquetas,\nQue tenho sido grotesco, mesquinho, submisso e arrogante,\nQue tenho sofrido enxovalhos e calado,\n'
>>> # vejamos o conteúdo mostrado pela função print()
>>> print(texto)
E eu, tantas vezes reles, tantas vezes porco, tantas vezes vil,
Eu tantas vezes irrespondivelmente parasita,
Indesculpavelmente sujo,
Eu, que tantas vezes não tenho tido paciência para tomar banho,
Eu, que tantas vezes tenho sido ridículo, absurdo,
Que tenho enrolado os pés publicamente nos tapetes das etiquetas,
Que tenho sido grotesco, mesquinho, submisso e arrogante,
Que tenho sofrido enxovalhos e calado,

>>> # agora vou testar o meu ep
>>> main()
Programa contado de palavras em um texto
Digite o nome do arquivo: pessoa.txt
Conteudo do arquivo: 
E eu, tantas vezes reles, tantas vezes porco, tantas vezes vil,
Eu tantas vezes irrespondivelmente parasita,
Indesculpavelmente sujo,
Eu, que tantas vezes não tenho tido paciência para tomar banho,
Eu, que tantas vezes tenho sido ridículo, absurdo,
Que tenho enrolado os pés publicamente nos tapetes das etiquetas,
Que tenho sido grotesco, mesquinho, submisso e arrogante,
Que tenho sofrido enxovalhos e calado,

Lista de palavras no arquivo pessoa.txt:
E: 1
eu: 1
tantas: 6
vezes: 6
reles: 1
porco: 1
vil: 1
Eu: 3
irrespondivelmente: 1
parasita: 1
Indesculpavelmente: 1
sujo: 1
que: 2
não: 1
tenho: 5
tido: 1
paci: 1
ncia: 1
para: 1
tomar: 1
banho: 1
sido: 2
ridículo: 1
absurdo: 1
Que: 3
enrolado: 1
os: 1
pés: 1
publicamente: 1
nos: 1
tapetes: 1
das: 1
etiquetas: 1
grotesco: 1
mesquinho: 1
submisso: 1
e: 2
arrogante: 1
sofrido: 1
enxovalhos: 1
calado: 1
>>>