PlaM-DeP: una plataforma modular para el desarrollo y evaluación de algoritmos de detección de plagio académico

Main Article Content

Hernán Fajardo Heras
Manuel Barrera Maura
Vladimir Robles Bykbaev
Cristian Timbi Sisalima
Eduardo Calle Ortiz

Palabras Clave

detección, freeLing, MultiWordNet, plagio, plataforma plagio

Resumen

En este trabajo se presenta un modelo de plataforma de software para desarrollar y evaluar los algoritmos de detección de plagio. La plataforma se basa en un diseño modular escalable, que implementa un conjunto de servicios que posibilitan realizar automáticamente tareas como: análisis sintáctico y semántico a través de WordNet y Freeling, extracción automática de texto de múltiples formatos de archivos (PDF, Word y texto), extracción de contenido de páginas web (empleando algunos motores de búsqueda como Google, Yandex, Yahoo, Bing), el almacenamiento, la carga y el uso de algoritmos de detección de plagio. Estos servicios permiten a un programador desarrollar el código centrando el esfuerzo en el diseño del algoritmo y la base matemática/estadística. Actualmente, la plataforma se probó usando varias consultas de texto (n-gramas), y los resultados de rendimiento son prometedores.
Abstract 0 | PDF Downloads 243

Citas

IEEE. Plagiarism. http://www.ieee.org/publications_standards/ publications/rights/plagiarism_FAQ.html

H. A. Maurer, F. Kappe, and B. Zaka, “Plagiarism-a survey.” Journal of Universal Computer Science, vol. 12, no. 8, pp. 1050–1084, 2006.

El Espectador. (2012) Suspenden a periodista de time y cnn por un caso de plagio. [Online]. Available: http://www.elespectador.com/ impreso/cultura/medios/

A. Rodríguez, “Plagios y fraudes en la era de la globalización,” Revista médica de Uruguay, no. 22, pp. 83–86, 2006.

ATL (Association of Teachers and Lecturers). (2008, January, 18) School work plagued by plagiarism atl survey. [Online]. Available: http://www.atl.org.uk/media-office/media-archive/ School-work-plagued-by-plagiarism-ATL-survey. asp

H. Maurer. (2007, October 15) Narayanan kulathuramaiyer, coping with the copy-paste-syndrome. World Conference on ELearning in Corporate, Government, Healthcare, and Higher Education. [Online]. Available: http://www.editlib.org/p/26479

S. Urbina, R. de Ozollo, J. Gallardo, C. Martí, A. Torres, and M. Torrens. (2010) Análisis de herramientas para la detección del ciberplagio.

A. Cedeño, M. Vila, and P. Rosso, “Detección automática de plagio, de la copia exacta a la paráfrasis,” pp. 76–96, 2010.

D. Rodríguez-Torrejón and J. Martín-Ramos, “Leap: Una referencia para la evaluación de sistemas de detección de plagio con enfoque intrínseco,” Universidad de Huelva, pp. 1–12, 2012.

Turnitin. Detector de plagio online. [Online]. Available: http://turnitin.com/es

D. Fúnez and M. Errecalde, “Detección de plagio intrínseco usando la segmentación de texto,” in CACIC – XVII Congreso argentino de Ciencias de la Computación, 2011, pp. 91–100.

M. Potthast, A. Barrón-Cedeño, B. Stein, and P. Rosso, “Cross-language plagiarism detection,” Language Resources and Evaluation, vol. 45, no. 1, pp. 45–62, 2011.

M. Potthast, B. Stein, A. Barrón-Cedeño, and P. Rosso, “An evaluation framework for plagiarism detection,” in Proceedings of the 23rd international conference on computational linguistics: Posters. Association for Computational Linguistics, 2010, pp. 997–1005.

S. M. Alzahrani, N. Salim, and A. Abraham, “Understanding plagiarism linguistic patterns, textual features, and detection methods,” Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 42, no. 2, pp. 133–149, 2012.

M. Ortiz and A. Plaza, Programación orientada a objetos con Java y UML, 1st ed. Editorial Universitaria Abya-Yala, 2014.