curiosidade ep14

curiosidade ep14

por Guilherme Jordan Castro Nascimento -
Número de respostas: 6

pessoal, como está agindo o grau de similaridade pra vocês?

em alguns testes que eu fiz, comparando dois arquivos de plagio tipo 4, se eu troco 1 while por 1 for o grau fica 0.996.

se eu troco isso e a ordem de duas funções o grau já cai pra 0,965

 

Em resposta à Guilherme Jordan Castro Nascimento

Re: curiosidade ep14

por Guilherme Jordan Castro Nascimento -

se eu troco de ordem varias funções no teste anterior, o grau cai pra 0.845

 

pra fazer um controle, comparando 2 a 2 20 eps que aparentemente nao sao plagios, rolou isso aqui:

max = 0.868

min = 0.105

mediana = 0.705

media = 0.650

desvio padrao = 0.181

Em resposta à Guilherme Jordan Castro Nascimento

Re: curiosidade ep14

por Yuri Vargas Guedes -

Não cheguei a fazer um estudo dos resultados do meu EP ainda, mas estou preocupado com o tempo que ele demora para realizar os cálculos, de alguns segundos comparando igualdades para algumas horas testando similaridade.

Quanto ao seu problema, como não sei que tipo de teste de similaridade você está aplicando não tenho certeza de como posso ajudar além do básico:

Tem certeza que você efetua as comparações dos EP's na forma canônica?

Você efetua os cálculos com tipo int e só converte para float quando necessário?

Em resposta à Yuri Vargas Guedes

Re: curiosidade ep14

por Guilherme Jordan Castro Nascimento -

nao sei se meus resultados estao com algum problema, achei que em media estou obtendo um grau de similaridade razoavel para eps que nao sao plagios e um grau tambem razoavel para os que sao, o que eu queria mais era comparar com os resultados de mais alguem

 

o teste de sinilaridade que eu faço é baseado em LCS e por isso estou com um problema de tempo semelhante ao seu.

 

a "solução" que eu adotei foi fazer os testes de semelhança sob demanda do usuário, mas isso não é muito pratico caso seja necessario testar todos os eps.

 

embora pra comparar 2 a 2 ate uns 30 eps a espera é tolerável.

Em resposta à Guilherme Jordan Castro Nascimento

Re: curiosidade ep14

por Eduardo Galvani Massino -

Será que você ou os monitores teriam alguns arquivos pra testar com  o EP14 ? Porque testar 2130 não rola nessa vida, e ficar inventando não tem muita graça.

Obrigado !

Em resposta à Eduardo Galvani Massino

Re: curiosidade ep14

por Sergio Silva -

Eu copiei parte dos 2130 EPs para uma pasta separada para testar o EP14.

Em resposta à Sergio Silva

Re: curiosidade ep14

por Yuri Vargas Guedes -

Só agora que me dei conta disso, mas qual deve ser a saída do EP 14?

Devemos imprimir os arquivos com chance de serem plagio ou imprimir a chance calculada?

A partir de que valor devemos considerar que dois arquivos são parecidos demais? Ou devemos pedir para o usuário decidir isso?