PlaM-DeP: una plataforma modular para el desarrollo y evaluación de algoritmos de detección de plagio académico

PlaM-DeP: a modular platform for the development and evaluation of academic plagiarism detection algorithms

Hernán Fajardo Heras, Manuel Barrera Maura, Vladimir Robles Bykbaev, Cristian Timbi Sisalima, Eduardo Calle Ortiz

Resumen


En este trabajo se presenta un modelo de plataforma de software para desarrollar y evaluar los algoritmos de detección de plagio. La plataforma se basa en un diseño modular escalable, que implementa un conjunto de servicios que posibilitan realizar automáticamente tareas como: análisis sintáctico y semántico a través de WordNet y Freeling, extracción automática de texto de múltiples formatos de archivos (PDF, Word y texto), extracción de contenido de páginas web (empleando algunos motores de búsqueda como Google, Yandex, Yahoo, Bing), el almacenamiento, la carga y el uso de algoritmos de detección de plagio. Estos servicios permiten a un programador desarrollar el código centrando el esfuerzo en el diseño del algoritmo y la base matemática/estadística. Actualmente, la plataforma se probó usando varias consultas de texto (n-gramas), y los resultados de rendimiento son prometedores.

Palabras clave


detección; freeLing; MultiWordNet; plagio; plataforma plagio

Texto completo:

PDF

Referencias


IEEE. Plagiarism. http://www.ieee.org/publications_standards/ publications/rights/plagiarism_FAQ.html

H. A. Maurer, F. Kappe, and B. Zaka, “Plagiarism-a survey.” Journal of Universal Computer Science, vol. 12, no. 8, pp. 1050–1084, 2006.

El Espectador. (2012) Suspenden a periodista de time y cnn por un caso de plagio. [Online]. Available: http://www.elespectador.com/ impreso/cultura/medios/

A. Rodríguez, “Plagios y fraudes en la era de la globalización,” Revista médica de Uruguay, no. 22, pp. 83–86, 2006.

ATL (Association of Teachers and Lecturers). (2008, January, 18) School work plagued by plagiarism atl survey. [Online]. Available: http://www.atl.org.uk/media-office/media-archive/ School-work-plagued-by-plagiarism-ATL-survey. asp

H. Maurer. (2007, October 15) Narayanan kulathuramaiyer, coping with the copy-paste-syndrome. World Conference on ELearning in Corporate, Government, Healthcare, and Higher Education. [Online]. Available: http://www.editlib.org/p/26479

S. Urbina, R. de Ozollo, J. Gallardo, C. Martí, A. Torres, and M. Torrens. (2010) Análisis de herramientas para la detección del ciberplagio.

A. Cedeño, M. Vila, and P. Rosso, “Detección automática de plagio, de la copia exacta a la paráfrasis,” pp. 76–96, 2010.

D. Rodríguez-Torrejón and J. Martín-Ramos, “Leap: Una referencia para la evaluación de sistemas de detección de plagio con enfoque intrínseco,” Universidad de Huelva, pp. 1–12, 2012.

Turnitin. Detector de plagio online. [Online]. Available: http://turnitin.com/es

D. Fúnez and M. Errecalde, “Detección de plagio intrínseco usando la segmentación de texto,” in CACIC – XVII Congreso argentino de Ciencias de la Computación, 2011, pp. 91–100.

M. Potthast, A. Barrón-Cedeño, B. Stein, and P. Rosso, “Cross-language plagiarism detection,” Language Resources and Evaluation, vol. 45, no. 1, pp. 45–62, 2011.

M. Potthast, B. Stein, A. Barrón-Cedeño, and P. Rosso, “An evaluation framework for plagiarism detection,” in Proceedings of the 23rd international conference on computational linguistics: Posters. Association for Computational Linguistics, 2010, pp. 997–1005.

S. M. Alzahrani, N. Salim, and A. Abraham, “Understanding plagiarism linguistic patterns, textual features, and detection methods,” Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 42, no. 2, pp. 133–149, 2012.

M. Ortiz and A. Plaza, Programación orientada a objetos con Java y UML, 1st ed. Editorial Universitaria Abya-Yala, 2014.




DOI: http://dx.doi.org/10.17163/ings.n11.2014.04

Copyright (c) 2014 Universidad Politécnica Salesiana

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.

INDIZACIONES PRINCIPALES

   Resultado de imagen para logo redib logo

   

© 2017, Universidad Politécnica Salesiana del Ecuador