1.Introducción
El plagio, cada vez más visible en la sociedad actual debido a la disponibilidad de información en línea, afecta diversas áreas como la educación, academia, literatura y música. En entornos educativos, especialmente en escuelas y universidades, los estudiantes a menudo recurren al plagio, ya sea de manera involuntaria debido a la falta de conocimientos sobre citas adecuadas o de manera intencional como un acto consciente de fraude.
La literatura revisada por Espinoza-Freire (2020) identifica dos tipos de plagio: involuntario, relacionado con prácticas inapropiadas de "copia y pega", y el intencional, donde el estudiante está plenamente consciente de su infracción ética. Otros autores, como Hernández (2016), Gantús (2016), y Comas & Sureda (2010), describen el plagio como apropiarse indebidamente de elementos de propiedad intelectual de otros sin atribución adecuada.
Según Svyrydenko (2016) existen varios tipos de plagio, como el verbatim (cita sin reconocimiento claro), cortar y pegar de Internet sin reconocimiento, parafrasear sin atribución, colusión (colaboración no autorizada entre estudiantes), cita inexacta, no reconocer la asistencia, uso de material escrito por agencias profesionales, y autoplagio. El plagio presenta diversas manifestaciones, desde la reproducción directa de textos hasta la colaboración no autorizada entre estudiantes, siendo esencial abordar este problema en el ámbito académico y promover la integridad académica.
En abril de 2023, se llevó a cabo un Taller de Formación en métodos combinados en Educación e Investigación en Salud en la Universidad de Aveiro. Durante este taller, se planteó una cuestión sobre la naturaleza del plagio y el autoplagio, y nos dimos cuenta de que hubo muy pocas respuestas correctas en cuanto a la definición de estos términos. Se generaron diversas líneas de discusión entre los asistentes al curso, como la conceptualización, la repercusión y las formas de prevenirse en el contexto académico. Este hecho, junto a la revisión de la literatura realizada, nos llevó a reflexionar sobre cuánto conocimiento real existe acerca de este tema y dónde podemos encontrar ejemplos específicos de plagio y autoplagio que hayan pasado desapercibidos en la sociedad. Por ello, se planteó la siguiente pregunta de investigación: ¿Qué repercusión tienen el plagio y autoplagio académico en la literatura científica? Para dar respuesta a esta pregunta de investigación, se formularon los siguientes objetivos de investigación:
Explorar la conceptualización del plagio y autoplagio.
Determinar la repercusión en la publicación sobre el plagio y autoplagio.
Valorar los autores más relevantes en el área y su procedencia.
Analizar los aspectos más destacados de las publicaciones sobre plagio y autoplagio.
2.Método y materiales
El desarrollo metodológico para esta investigación se ha basado en los trabajos previos de revisión sistemática realizados por Gregorio-Chaviano et al. (2020) y Cabanillas et al. (2022). En base al modelo ReSiste-CHS Framework (Codina, 2018) se han ejecutado cuatro fases para la realización de una revisión sistemática, los cuales son: Búsqueda (1), evaluación (2), análisis (3) y síntesis (4).
La búsqueda de documentos se ha realizado en las bases de datos internacionales Web of Science (WOS) y SCOPUS. La fecha de corte de la búsqueda fue el 2 de marzo de 2023. Se empleó la ecuación de búsqueda para la extracción de documentos ("Plagiarism" AND "Scientific" AND "Education" en todos los campos. Se normalizaron las variables de autor, institución, país y palabras-clave, dado que a partir de ellas se generaron los indicadores bibliométricos.
Se siguió el procedimiento PRISMA (Page et al., 2021) para la evaluación de documentos (ver Figura 1). PRISMA es una guía diseñada para la presentación eficiente de informes en revisiones sistemáticas y metaanálisis, que incluye una lista de verificación de elementos recomendados y un documento de explicación y elaboración. Estas recomendaciones han sido ampliamente respaldadas y adoptadas en diversas disciplinas. La estrategia de búsqueda inicial recuperó 1594 documentos indexados en lenguaje castellano e inglés, que fueron sometidos a normalización de metadatos y filtración por años de publicación. Tras eliminar duplicados (156 documentos), la muestra para el análisis sistemático quedó en 257 documentos. Posteriormente, se seleccionaron 40 artículos científicos de este conjunto para el análisis de contenido, considerando criterios como revisión por pares, identificación implícita del diseño de investigación, población y muestra utilizada, tipo de muestreo, procedimientos, discusión y conclusiones con epígrafes distintos, y calidad contrastada con el nivel de citación del documento y sus autores. La herramienta bibliográfica Zotero se empleó para el procesamiento de datos, y las listas de distribución de frecuencia se generaron con Microsoft Excel 2010.
Se construyeron y analizaron redes de palabras-clave y coautoría para entender la colaboración científica. La red de coautoría, que refleja vínculos entre investigadores, se visualizó con VOSviewer, destacando la colaboración y trabajo individual. Además, se realizó un análisis de contenido clásico (Huberman & Miles, 1984), reduciendo datos y diferenciando unidades de contexto y de registro. Luego, se aplicó disposición y agrupamiento en NVivo para revelar la estructura profunda del texto y representar visualmente las relaciones entre conceptos contexto (Cabanillas-García et al., 2020; Cabanillas-García et al., 2022; Cabanillas-García et al., 2023).
En la fase final de síntesis, se emplearon recursos visuales como redes de concurrencia, nubes y árboles de palabras para presentar los resultados de manera gráfica y efectiva (Del Brío et al., 2023).
Fuente: Autores del estudio
3.Resultados
En este epígrafe, serán descritos los resultados más destacados, los cuales fueron obtenidos en las búsquedas realizadas en las bases de datos WOS y SCOPUS.
En primer lugar, analizamos la evolución de trabajos en relación con el número de publicaciones por año vinculadas al plagio. En la Figura 2, se puede observar que el punto de partida para ambos conceptos es parejo en ambas bases de datos. Entre los años 2014 y 2016, se produce un elevado incremento en la producción de trabajos relacionados con plagio y autoplagio en la base de datos SCOPUS, a diferencia de lo que sucede en la base de datos WOS en la cual desciende ligeramente (ver Figura 2).
Entre los años 2017 y 2019 se mantienen constantes las producciones en ambas bases de datos, hasta que, en el año 2020 aparece el primer y único año en el que la producción es mayor en WOS que en SCOPUS. A partir de este año - 2020, se produce un descenso progresivo en el número de publicaciones indexadas en ambas bases de datos vinculadas al plagio (ver Figura 2).
Fuente: Autores del estudio
Seguidamente, en relación con el número de documentos por país, podemos observar que en SCOPUS (ver Figura 3), los países con mayor número de publicaciones sobre plagio son Estados Unidos, Inglaterra, India y Rusia, mientras que el mayor número de publicaciones indexadas en WOS, hacen referencia a países como Estados Unidos e Rusia, seguidos por España, India e Italia (ver Figura 3).
Fuente: Autores del estudio
Con respecto a las áreas temáticas a las que están vinculados los documentos analizados en WOS (ver Figura 4).
Podemos observar que estas se asocian preferentemente al área de la investigación en educación (28 referencias) y en menor medida al área de las ciencias multidisciplinares (13 referencias), ciencia computacional, ética y disciplinas científicas de la educación (todas estas con 10 referencias cada una) (ver Figura 4).
Fuente: Autores del estudio
Por otro lado, como se muestra en la figura 5, los resultados obtenidos en la base de datos SCOPUS, presentan a la ética en función de las áreas temáticas, preferentemente relacionadas con las ciencias sociales (62 referencias) seguido por las ciencias médicas (42 referencias) y las ciencias computacionales (30 referencias) (ver Figura 5).
Fuente: Autores del estudio
Con relación al tipo de documentos publicados sobre la temática del plagio (ver Figura 6). Para ambas bases de datos, estas temáticas se publican prioritariamente en formato de papel, teniendo una mayor presencia en SCOPUS (92 referencias) frente a WOS (74 referencias). Le siguen la publicación en formato de actas de congresos, donde tiene una ligera mayor presencia las publicaciones en WOS (22 referencias) frente a las de SCOPUS (21 referencias), seguido de los artículos de revisión (10 referencias) y (8 referencias) respectivamente (ver Figura 6). Hay que destacar, que no hay ningún libro sobre la temática del plagio indexado en ambas bases de datos, situación que evidencia una baja profundización en la comprensión de esta área temática.
Fuente: Autores del estudio
A continuación, se muestra el análisis de las concurrencias entre las palabras-clave de los documentos en ambas bases de datos. Por un lado, se muestra el esquema resultante en la base de datos WOS (ver Figura 7). Esta red tiene el eje central del plagio, donde a partir de él se ubican los cuatro clústeres de análisis. Como poden ver en la Figura 7, el primero de ellos tiene una mayor representatividad por medio de las palabras-clave: authors; authorship; education; misconduct; policies; publication; publication ethics; research ethics; scientific misconduct y self-plagiarism. Este clúster está relacionado con el área de educación, haciendo referencia a la integridad de la autoría, mencionando las inadecuadas conductas de investigadores en la realización de autoplagio, destruyendo la integridad y la ética científica, haciendo mención incluso a la necesidad de que es preciso una actuación en la política para corregir esta problemática. El segundo de los clústeres (ver Figura 7), se centra en la honestidad académica y en las actitudes de los estudiantes de la educación superior, colocando énfasis en la buena escritura y comunicación científica, así como en el conocimiento necesario para realizar las citaciones. Algunos ejemplos de palabras-clave para este clúster son: academic honesty; attitudes; citations; higher-education; inquiry; knowledge; scientific communication; scientific writing y student.
Fuente: Autores del estudio
No obstante, analizando la Red de SCOPUS (ver Figura 8), se puede observar que en esta base de datos se forman cuatro clústeres de concurrencia. En el primero de ellos, que es el que alcanza una mayor relevancia, figuran palabras-clave vinculadas al área de la salud, destacando la integridad de la autoría, la calidad en la escritura y las conductas inadecuadas por parte de los investigadores, las cuales ocasionan agravios en la calidad de la investigación en esta área y un cuestionamiento de la ética. Ejemplos de Palabras-clave son: authorship; biomedical research; medical research; ethics; personnel; research ethics; research integrity; research misconduct; research personnel; scientifict misconduct; writing. El segundo de los clústeres se vincula a la perspectiva de género (ver Figura 8), dentro de las técnicas de recogida de datos utilizadas, siendo principalmente mencionado el cuestionario a las condiciones éticas incluidas dentro de los trabajos que condicionan la experimentación humana en la población adulta. Ejemplos de palabras-clave son: adult; article; female; human experiment; male; female; questionnaire; surveys and questionnaires.
El tercero de los clústeres está vinculado al área de la educación (ver Figura 8), haciendo referencia a las acciones de plagio, realizadas tanto por estudiantes como por docentes, las cuales destruyen la propiedad intelectual condicionando la calidad de los procesos de enseñanza y aprendizaje. Ejemplos de Palavras-clave para este Clúster son: education; intellectual property; plagiarism; student; students; teaching. El último de los clústeres resultantes (ver Figura 8), destaca los criterios y recursos para poder garantizar la calidad de la publicación científica, a través de una adecuada revisión por pares. Ejemplos de palabras-clave para este clúster son: human; peer review; publication; publishing; scientific literatura.
Fuente: Autores del estudio
Con respecto al análisis de los autores relacionados con los conceptos Plagio y Autoplagio (ver Figura 9), se puede observar que existe un autor en el eje central de referencia en la red - Armen Yuri Gasparyan - sobre el que se sitúan los otros autores distribuidos en 4 clúster. Este autor es Profesor Asociado de Medicina, en el Dudley Group NHS FT, Teaching Trust de la Universidad de Birmingham en Reino Unido. Es a su vez, el autor más productivo con un total de 4 publicaciones indexadas en estas bases de datos. Según la red de coautoría (ver Figura 9), cuanto más cerca uno de otro se ubican los investigadores en la red, mayor es la relación de coautoría entre ellos. Por ejemplo, Armen Yuri Gasparyan presenta una estrecha vinculación con Zerem, E., Dobric, S., Zimba, O., y Kostyukova, e. i. Los colores indican agrupaciones de investigadores que están relativamente relacionados entre sí. De las 4 agrupaciones presentes, ninguna está conformada por un único autor, lo que evidencia la tendencia al trabajo colaborativo por parte de los investigadores que publican en el ámbito educativo del plagio (ver Figura 9).
Fuente: Autores del estudio
Finalmente, con respecto al análisis de contenido de las reflexiones incluidas en las conclusiones de los documentos analizados (ver Figura 10), es posible analizar la nube de palabras con las palabras más frecuentes. Las palabras más relevantes de esta nube de palabras, que poseen una elevada carga de aparición son: plagio (135 referencias); académica (109 referencias); investigación (103 referencias); estudiantes (94 referencias); educación (66 referencias); ética (51 referencias) y profesoras (40 referencias). Este conteo, nos permite observar que hay una mayor mención hacia el concepto del plagio que hacia la ética haciendo un mayor hincapié en las acciones a realizar en relación al estudiantado por sobre el profesorado (ver Figura 10).
Fuente: Autores del estudio
Seguidamente y como se muestra en el árbol de palabras (ver Figura 11). La formación, educación y realización de cursos son esenciales a la hora de concientizar al alumnado y de capacitar al profesorado, con el objetivo de dar a conocer cómo prevenir y detectar las actuaciones inadecuadas. No obstante, las publicaciones también hacen referencia en educar a otros colectivos como son los autores y los editores de las publicaciones científicas (ver Figura 11), apareciendo menciones como: “la necesidad de capacitación y educación en materia ética de violaciones” (ID3); “debe impartir educación ética permanente” (ID6); “los estudiantes deben recibir educación sobre la integridad de la ética” (ID10); “los editores de revistas deberían educar a los autores” (ID11); “la administración debe educar al personal sobre métodos para evitar y controlar el plagio” (ID14).
Fuente: Autores del estudio
Por otra parte, se ha detectado una tendencia a mencionar el análisis de la conducta en plagio (ver Figura 12), con una mayor aparición de conductas inadecuadas, como por ejemplo: “mala conducta científica por la necesidad de incrementar la producción científica” (ID4);
“La mala conducta científica está más extendida de lo que se cree” (ID28) y “la magnitud de la mala conducta y el descuido de los autores puede apuntan a la participación de máquinas generadoras de papel y agencias editoriales con intereses comerciales y desconocimiento de las Normas de publicación académica” (ID34). Se observa también que la mala conducta en plagio tiene una relación con la ética y el código que establecen las instituciones y los investigadores a la hora de publicar sus trabajos. Los estudios analizados muestran que estos comportamientos errados pueden ser disminuidos si se realizan acciones de formación (ver Figura 12). Algunos ejemplos: “es necesaria la introducción de la educación obligatoria en ética de la investigación” (ID23); “la ética y la buena conducta deben ser tratadas en toda formación de futuros profesionales, y no sólo en la educación superior y en una sola disciplina, sino en todas las áreas” (ID32) y “queremos señalar que existe un bajo nivel de ética académica, así como un rudimentario nivel de disposiciones procesales de política contra el autoplagio” (ID39).
Fuente: Autores del estudio
Los procedimientos utilizados para el autoplagio han sido una de las fuentes de mayor controversia, ya que se sitúan como un “terreno fértil” para incrementar la corrupción y las actividades fraudulentas. Hay una amplia mención que el software especializado, no es eficiente para detectar autoplagio si este es utilizado de forma única (ver Figura 13).
Algunos ejemplos: “confiar en una sola herramienta autoplagio no es eficaz. Incluso los software autoplagio potentes, diseñados para rastrear superposiciones textuales y calcular puntuaciones de similitud, pueden ser engañados por los plagiadores” (ID9); “considerando que el factor humano es más importante en muchas de las ocasiones para garantizar la veracidad de los textos científicos, entre todas las estrategias preventivas contra el plagio, aquellas que confían en el factor humano son probablemente las más fiables” (ID20); “Es necesario un papel más activo de autores, revisores, editores y lectores en el continuo de la prevención del autoplagio” (ID35).
Fuente: Autores del estudio
Por último, como se evidencia en el análisis del árbol de palabras que se presenta en la figura 14, se ha notado un destacado énfasis en la incidencia más alta de plagio entre los investigadores jóvenes y novatos. Se ha observado que los documentos seleccionados que muestran señales de plagio corresponden al primer envío realizado por el autor principal o el autor de correspondencia (ver Figura 14). Este hecho, puede ser debido a la falta de experiencia, desconocimiento de las reglas de citación, comportamiento inadecuado o falta de atención. Existe un amplio consenso en que las políticas específicas relacionadas con el plagio deben estar claramente establecidas en las revistas y comunicadas a los autores por parte de los editores.
Fuente: Autores del estudio
Presentamos algunos de los ejemplos aquí encontrados (ver Figura 14): “para crear conciencia sobre plagio es importante mencionarlo en las instrucciones a los autores.
Es importante especialmente para autores jóvenes que no tienen experiencia y no siempre son conscientes de todas las posibles consecuencias de las malas conductas en la comunicación científica” (ID8); “la mayoría de los jóvenes saben que los diferentes tipos de fraude son faltas serias, aunque les atribuyen menor gravedad de la que les atribuyen los maestros e indican que probablemente no sea suficiente hacer cada vez más duras las sanciones y más efectiva la detección del fraude, sino centrarse en mejorar pedagógicamente” y “es importante referir la falta de familiaridad con los géneros académicos y la inexperiencia en relación con la producción de artículos científicos en los autores noveles” (ID29).
4.Discusión y conclusiones
En respuesta a la pregunta de investigación sobre la repercusión del plagio y autoplagio académico en la literatura científica, se observa que este tema tiene una limitada presencia en las bases de datos internacionales, con un ligero descenso reciente en su producción. La repercusión varía según la región geográfica, siendo más notable en áreas anglosajonas con políticas de autoplagio más estrictas. La definición de plagio se ha clarificado y estandarizado, destacando su importancia ética en el ámbito académico, las cuales están en línea con investigaciones previas como las realizadas por Comas & Sureda (2010), Hernández (2016) y Gantús (2016) estandarizándose por el acto en el que una persona se apropia de contenido creado por otros autores, ya sea de manera intencionada o no intencionada.
Aunque se reconoce el papel crucial del factor humano en la detección de plagio, como menciona Gottardello et al. (2017) y se sugiere la necesidad de aumentar la producción científica que aborde las actitudes de estudiantes y docentes desde una perspectiva personal. La presión para aumentar la producción académica es identificada como un factor clave en el plagio (Kokkinaki et al., 2015; Hu & Sun, 2017; Moreels, 2018), instando a instituciones educativas a diseñar programas de formación ética (Ison, 2015). Por último, consideramos que la limitación principal de este estudio es su naturaleza exploratoria, sin comparaciones con otras bases de datos. Situación que nos insta a ampliar futuramente esta investigación a través de la realización de entrevistas y grupos focales (Ochoa y Cueva, 2016; Torné y Luque, 2015).
5.Agradecimientos
Trabajo financiado por la FCT - Fundación para la Ciencia y la Tecnología, en el ámbito de la beca de doctorado con referencia 2020.07331.BD, y por Fondos Nacionales a través de la FCT - Fundación para la Ciencia y la Tecnología, IP, en el ámbito del proyecto UIDB/00194/2020, referente al CIDTFF - Centro de Investigación en Didáctica y Tecnología en la Formación de Formadores, Portugal y financiada por el Fondo Europeo de Desarrollo Regional y Junta de Extremadura. Proyecto GR21093.