M'assabento, gràcies a un article a Barrapunto, d'una nova tècnica per identificar als autors de correus electrònics.
Investigadors de la Concordia University de Canadà, han presentat un estudi en el que desenvolupen una nova tècnica per identificar a l'autor d'un correu electrònic, allunyant-se d'aproximacions més conegudes, com l'anàlisi de les capçaleres dels missatges, rastreig d'IPs, etc., que sempre tenen un problema: tot i poder ubicar la connexió física des de la que s'ha enviat el missatge, és molt difícil provar qui n'ha estat l'autor, especialment en el cas de connexions compartides. El seu enfocament es basa en la utilització de tècniques de mineria de dades, com explica en Gabriel Molina, a "Identificando correos electrónicos anónimos":
Para determinar si un sospechoso ha sido el autor de un determinado correo, primero identifican los patrones encontrados en correos electrónicos escritos por el sujeto. Posteriormente, filtran cualquiera de estos patrones que se encuentran también en los correos de otros sospechosos. Los patrones restantes son únicos para el autor de los correos electrónicos que están siendo analizados. Estos constituyen la “huella de escritura” del sospechoso, un identificador distintivo como la huella digital. “Digamos que el correo anónimo contiene errores tipográficos o gramaticales, o está escrito completamente en minúsculas”, comenta Fung. “Utilizamos todas esas características especiales para crear una huella de escritura. Utilizando este método, podemos incluso determinar con una gran nivel de exactitud quién escribió un correo electrónico dado, e inferir el sexo, nacionalidad y el nivel educativo del autor”.
Si voleu, us podeu descarregar l'estudi (en pdf):
A novel approach of mining write-prints for authorship attribution in e-mail forensics
Farkhund Iqbal, Rachid Hadjidj, Benjamin C.M. Fung, Mourad Debbabi
Concordia Institute for Information Systems Engineering, Faculty of Engineering and Computer Science, Concordia University, Montreal, Quebec, Canada
Farkhund Iqbal, Rachid Hadjidj, Benjamin C.M. Fung, Mourad Debbabi
Concordia Institute for Information Systems Engineering, Faculty of Engineering and Computer Science, Concordia University, Montreal, Quebec, Canada
Us en copio l'abstract:
There is an alarming increase in the number of cybercrime incidents through anonymous e-mails. The problem of e-mail authorship attribution is to identify the most plausible author of an anonymous e-mail from a group of potential suspects. Most previous contributions employed a traditional classification approach, such as decision tree and Support Write-print Vector Machine (SVM), to identify the author and studied the effects of different writing style features on the classification accuracy. However, little attention has been given on ensuring the quality of the evidence. In this paper, we introduce an innovative data mining method to capture the write-print of every suspect and model it as combinations of features that occurred frequently in the suspect’s e-mails. This notion is called frequent pattern, which has proven to be effective in many data mining applications, but it is the first time to be applied to the problem of authorship attribution. Unlike the traditional approach, the extracted write-print by our method is unique among the suspects and, therefore, provides convincing and credible evidence for presenting it in a court of law. Experiments on real-life e-mails suggest that the proposed method can effectively identify the author and the results are supported by a strong evidence.
Comentaris