1. Introducción
La declaración falsa, incompleta o distorsionada de la verdad generan el falso testimonio. Históricamente el falso testimonio (Burgos, 2010) tiene origen en el derecho romano castigándose con dureza la declaración testimonial falsa, similarmente en el derecho canónico quien lo realizaba estaba cometiendo un triple crimen: contra Dios, contra la sociedad y contra la persona perjudicada con el falso testimonio. En el Tahuantinsuyo, el gran imperio incaico que comprendió gran parte del territorio de Sudamérica, los preceptos quechuas: Ama Sua (No seas ladrón), Ama Llulla (No seas mentiroso) y Ama Quella (No seas flojo), consideraban a la mentira como falta grave. En la actualidad, a nivel mundial existen castigos severos y ligeros establecidos en los códigos de justica de diferentes países. En una revisión de castigos de al menos 24 países (Rey et al., 2019) encontró diferencias, en algunos establecían penas de prisión de hasta 12 o 15 años y en otros la pena máxima más grave era de 3 años. Actualmente las declaraciones falsas siguen generándose por las personas, sea por desconocimiento de que hacerlo representa un delito o porque a sabiendas de que lo están cometiendo consideran que no serán detectados.
La presente investigación tiene por objetivo proponer nuevos enfoques de detección de mentiras en declaraciones escritas como método no invasivo y silencioso que permita al profesional de psicología disponer de nuevas herramientas basadas en Inteligencia Artificial (IA). Por ejemplo el medir la actitud de las personas utilizando instrumentos psicológicos como cuestionarios (Snyman & Kruger, 2017), se perturba el real comportamiento. Consecuentemente el ciudadano deshonesto se alerta de que existe un control y por tanto busca alternativas de como burlarlo. Planteamos el modelo de detección de mentiras en declaraciones escritas basadas en la IA, para lo cual se elaboró una estrategia de obtención de datos que consistió en declaraciones escritas de voluntarios que participaron en la presente investigación.
El presente estudio es motivado por el aporte y utilidad que puede significar al conocimiento de los profesionales y académicos. Disponer de nuevos enfoques desde la perspectiva de una disciplina sobre otra permitirá generar nuevo conocimiento interdisciplinario para la creación de modelos que detecten la falsedad en declaraciones escritas en forma inmediata.
2. Trabajos relacionados
En general, las declaraciones se generan antes y durante un proceso civil o penal. En sus inicios son conocidas como denuncias policiales y en el proceso penal tienen diferentes nombres como por ejemplo testimonios, declaraciones del imputado, declaraciones del testigo, declaraciones del agraviado, etc. (ver Figura 1). Estas declaraciones sirven para el análisis de los hechos o para las investigaciones en el lugar de los hechos.
En las etapas previas de un proceso civil o penal, el ciudadano agraviado o que se considera como tal presenta una declaración en las Comisarias o en el Ministerio Público, dicha declaración será llamada denuncia. El personal que recibe las declaraciones carece de las herramientas que identifique inmediatamente cuando una declaración del denunciante ha sido narrada con la verdad, si ha mentido, si ha distorsionado o modificado los hechos, sea por un acto involuntario o premeditado. Por ejemplo, denuncias con declaraciones falsas por el robo de un bien con el fin de obtener beneficios del seguro o en los casos que se incriminan a personas inocentes como un acto de venganza o revanchismo enfermizo. La veracidad del contenido de una declaración ocurre después que se ha culminado el proceso de investigación. Según (Geven et al., 2020) las consecuencias de la falsedad pueden ser perjudiciales cuando no se reconocen correctamente como tales.
Las declaraciones falsas tienen repercusiones negativas. En primer lugar, genera pérdidas económicas al gobierno por el tiempo, logística empleada y asignación de recursos humanos como policías, jueces, fiscales, psicólogos, etc., necesarios para el proceso de investigación o para el proceso judicial. En segundo lugar, generan consecuencias negativas a la reputación o pérdidas económicas de empresas o personas inocentes que se ven implicadas. En tercer lugar, incrementan la inseguridad ciudadana debido a que el personal policial es ocupado en las tareas de investigación.
2.1. Detección del engaño desde la experiencia del uso de la psicología.
La investigación sobre la mentira se ha centrado principalmente en la búsqueda de los indicios del engaño que permiten detectar la mentira de forma eficaz, distinguiéndose cuatro grupos de indicadores objetivos de la mentira: fisiológicos, conductuales, paraverbales y del mensaje verbal (Hernández-Fernaud & Alonso-Quecuty, 2004). Para determinar la credibilidad de un testimonio (Günter Köhnkena, 2015) analizó la aplicabilidad y limitaciones del Statement Validity Assessment (SVA) concluyendo que el SVA posee fortalezas, debilidades y limitaciones que deben ser consideradas para una correcta aplicación. En los trabajos donde el fenómeno de la detección de la mentira ha sido investigado directa o indirectamente, para (Sánchez et al., 1995) la precisión de los jueces experimentados no superan los valores esperados por azar, entre el 40 y el 60 por ciento. En ese sentido no es extraño las historias de inocentes condenados a prisión por un crimen que no cometieron.
Por otro lado, los trabajos de laboratorio de la Psicología del Testimonio para (Ibabe Erostarbe, 2000) han sido criticados por la posibilidad de diferencias entre los testimonio de laboratorio y las reales debido a que las situaciones emocionales de la vida real y sus implicaciones en las personas no se pueden simular. Esta situación puede estar creando limitaciones en nuevos desarrollos para incrementar el grado de confiabilidad y aciertos en la detección de testimonios falsos y disminuir el tiempo empleado en dichos procesos. Siendo el testimonio el más fácil y común medio de obtener información, y pudiendo resultar de él tanto la condena de un inocente como la absolución de un culpable (Lemoine, 1967). Se requiere la apertura de nuevos enfoques interdisciplinarios que permita la detección de los testimonios falsos.
2.2. Avances del uso de la inteligencia artificial.
Existen mucha literatura en el área de la Inteligencia Artificial (IA) que anuncian grandes avances en el tratamiento de texto. Por ejemplo, en la detección de informes de robos verdaderos o falsos basados en el engaño verbal registrados en la redacción del informe policial de España, para (Quijano-Sánchez et al., 2018), consideraron un caso de detección y clasificación de textos utilizando una metodología que combinó algoritmos de procesamiento del lenguaje natural (PLN), métodos de selección de características y algoritmos de clasificación de Machine Learning (ML) para proponer un modelo de detección de denuncias falsas que denominaron Veripol, señalando que presenta un error de clasificación errónea muy bajo, inferior al 9%, mientras que los policías expertos mostraron un error del 25%, aproximadamente. En un segundo caso, la detección de perfiles de twitter fraudulentos (Albahar, 2019) presenta un modelo donde analiza el contenido de los tweets que es texto no estructurado, utilizando los conceptos de procesamiento del lenguaje natural (PLN) obteniendo una precisión promedio del 95% de acierto. En un tercer caso, en la extracción automatizada de los tipos de abuso y tipos de lesiones sufridas por las víctimas de violencia doméstica en las narrativas registradas por la Fuerza Policial de Nueva Gales del Sur, (Karystianis et al., 2018) empleó el método de text mining diseñando e implementando patrones de expresión del lenguaje basados en reglas combinados con términos de diccionario para el reconocimiento de tipos de abuso y lesiones de las víctimas a nivel narrativo obteniendo un modelo con una precisión del 90.2% y 85.0% para los tipos de abuso y lesiones respectivamente. Estos casos presentados tienen una característica en común que es la de identificar patrones para detectar el delito por medio del análisis del texto escrito a través de técnicas de IA en particular del PLN.
2.3. Nuevo paradigma para detectar el engaño en las declaraciones.
En la detección de mentiras se emplean técnicas de la psicología que permiten obtener información relevante y su interpretación puede ser subjetiva. Por otro lado, el desarrollo de la IA ha demostrado precisiones razonables en diferentes modelos de análisis de datos como la detección de mentiras en narrativas.
En la psicología forense los aspectos psicológicos de la persona son materia de preocupación por las implicancias en la declaración testimonial (Solís Espinoza, 2000) y su análisis generalmente es centralizado a dicha persona. Para la IA la diferencia fundamental con la del enfoque psicológico es utilizar las declaraciones históricas para construir un modelo de identificación de patrones que permitan la detección de declaraciones falsas.
Las declaraciones, ver Figura 1, sean escritas o transcripciones verbales contiene texto libre y son datos no estructurados debido a que es la narrativa sobre los hechos. El paradigma propuesto es analizar con IA la parte no estructurada de estas declaraciones con la finalidad de detectar patrones de engaño.
3. Metodología
Nos interesa identificar la mentira dentro de un proceso complejo donde la persona construye una historia que según (Blandón-Gitlin et al., 2017) las operaciones mentales del mentiroso para construir y contar su historia son muy distintas respecto a la persona sincera por lo que construir una historia falsa es más complejo que describir los hechos vividos. En ese sentido, para la recolección de datos se han realizado encuestas abiertas para obtener narrativas de declaraciones verdaderas y falsas debido a la restricción que representa obtenerlas directamente de las denuncias policiales por la protección de los datos personales. En la primera encuesta abierta, se obtiene las declaraciones falsas solicitándole al participante que relate un caso inventado de robo, agresión física o agresión psicológica. En la segunda encuesta abierta, se obtiene la declaración verdadera, se solicitó al participante que relate un hecho real sobre robo, agresión física o agresión psicológica. En la tercera encuesta abierta, se solicitó al participante que lea un relato preparado sobre un caso de robo y el participante debía de tergiversar el relato original con la finalidad de obtener un beneficio indebido. Esta última narración correspondería a las declaraciones falsas. Se obtuvieron un total de 69 declaraciones escritas, donde 24 declaraciones son verdaderos y 45 declaraciones son falsas.
3.1. Modelo de predicción utilizando IA.
En el análisis textual de las declaraciones obtenidas, existen situaciones a considerar, para (Sciforce, 2019) la exactitud o inexactitud gramatical no siempre se correlaciona con la validez de una frase, argumenta que existen frases gramaticalmente correctas, pero sin sentido como las que cita como ejemplo: "las ideas verdes incoloras duermen furiosas" que no expresan algún significado, que en contraparte a una oración con errores gramaticales puede contener un mensaje valido. En ese sentido, el lenguaje escrito contiene muchas formas de expresar información no necesariamente en un sentido estricto de una estructura gramaticalmente valida, sino que esta información se enmarca más en el contexto de la oración, ósea en la semántica. Sin embargo, para fines de la presente investigación, se considera que no existe ironía en las declaraciones policiales, por lo que se excluye el análisis pragmático en el contenido del texto (casos de sarcasmos).
Se siguió la siguiente secuencia para la creación del modelo de predicción: primero, la normalización de la data por cada declaración fue realizada mediante la eliminación de signos de puntuación, números, stopwords, steeming y la conversión a minúsculas. Se utilizó la librería NLTK en Python que es un conjunto de algoritmos para el procesamiento de lenguaje natural. Segundo, las declaraciones normalizadas fueron agrupadas, un grupo representó la data de prueba y el otro grupo la data de entrenamiento, en un porcentaje de agrupación de 30% y 70% respectivamente. Tercero, la conversión del texto de cada declaración fue realizado mediante el modelo Vector Space Model (VSM) utilizando el paquete tf-idf vectorizer de SKlearn de Python. Cuarto, utilizando la misma data vectorizada, se realizaron pruebas con los siguientes algoritmos de clasificación: Ridge Classifier, Perceptron, Passive-Aggressive, L1 penalty, L2 penalty, Naive Bayes y Random Forest.
4. Resultados
Los resultados obtenidos son mostrados en la Tabla 1, donde el clasificador Random Forest tiene una precisión de 71% frente al valor más cercano del clasificador L2 penalty que obtiene una precisión del 62%. En cuanto a los valores positivos correctamente clasificados, se aprecia a través de la métrica “recall” que el clasificador Random Forest obtiene un valor del 100% frente al valor más cercano del clasificador L2 penalty que obtiene un valor del 89%. En cuanto a los casos correctamente clasificados tanto positivos como negativos, a través de la métrica “accuracy” se aprecia que el clasificador Random Forest obtiene un valor de 71% frente al valor más cercano del clasificador L2 penalty con un valor del 57%.
Algoritmos de clasificación | Precision | Recall | f1-score | |
---|---|---|---|---|
Ridge Classifier | ||||
0.00 | 0.50 | 1.00 | 0.67 | |
1.00 | 0.00 | 0.00 | 0.00 | |
Accuracy | 0.50 | |||
Perceptron | ||||
0.00 | 0.45 | 0.71 | 0.56 | |
1.00 | 0.33 | 0.14 | 0.20 | |
Accuracy | 0.43 | |||
Passive-Aggressive | ||||
0.00 | 0.50 | 0.86 | 0.63 | |
1.00 | 0.50 | 0.14 | 0.22 | |
Accuracy | 0.50 | |||
L1 penalty | ||||
0.00 | 0.58 | 0.78 | 0.67 | |
1.00 | 0.00 | 0.00 | 0.00 | |
Accuracy | 0.50 | |||
L2 penalty | ||||
0.00 | 0.62 | 0.89 | 0.73 | |
1.00 | 0.00 | 0.00 | 0.00 | |
Accuracy | 0.57 | |||
Naive Bayes | ||||
0.00 | 0.50 | 0.44 | 0.47 | |
1.00 | 0.17 | 0.2 | 0.18 | |
Accuracy | 0.36 | |||
Random Forest | ||||
0.00 | 0.71 | 1.00 | 0.83 | |
1.00 | 0.00 | 0.00 | 0.00 | |
Accuracy | 0.71 |
En la Tabla 1, las métricas: precision, recall, f1-score y accuracy corresponden a sus traducciones al español, precisión, exhaustividad, valor-f y exactitud, respectivamente. En la columna “Algoritmos de clasificación” los valores 0.00 y 1.00 corresponden a las etiquetas de “testimonio falso” y “testimonio verdadero” respectivamente. La métrica accuracy representa el total de valores correctamente clasificados. La métrica precision representa los valores que fueron clasificados como positivos realmente lo sean. La métrica recall representa la cantidad de valores positivos son correctamente clasificados. La métrica f1-score representa un valor objetivo entre las métricas precision y recall.
5. Discusión
Las declaraciones falsas en los testimonios son tipificados como delitos en todo el mundo, sin embargo en lugar de disminuir los casos, estos han mejorado los métodos de engaño debido a que el infractor busca obtener un beneficio personal, generalmente económico logrando falsedades cada vez más sutiles o difícilmente demostrables (Rey et al., 2019). Por ejemplo, declaraciones falsas que conllevan a fraudes financieros con el fin de encubrir una mala aplicación de fondos o engañar a los reguladores (Ramírez et al., 2020). La ventaja de las tecnologías IA en comparación con el enfoque psicológico para la detección de declaraciones falsas radica en la velocidad de procesamiento y obtención de resultados.
Según la métrica “accuracy”, de los diferentes algoritmos de clasificación el clasificador Random Forest ocupa el primer lugar con un valor del 71%, sin embargo, por el desbalance entre las cantidades de datos de declaraciones falsas y verdaderas, la métrica “f1-score” es la apropiada para conocer la calidad del modelo a través de la combinación de las métricas “precision” y “recall” con un valor del 83%. Sin embargo, a pesar de estos resultados señalados en la Tabla 1, aún no podríamos afirmar que el clasificador Random Forest sería el óptimo para la detección de testimonios falsos a través del texto escrito, debido a que la fortaleza en la confiabilidad y precisión de los algoritmos de IA recae en la utilización de grandes cantidades de datos que son utilizados en los procesos de entrenamiento del modelo. Sin embargo, para fines de la presente investigación es un buen punto de partida que a través de la data por encuestas se haya generado el prototipo de modelo. Dicho prototipo de modelo al ser utilizado con la data de las declaraciones registradas en las denuncias policiales culminaría su ciclo de entrenamiento.
Otras consideraciones a tener en cuenta en los resultados, es lo señalado por (Köhnken et al., 2015) una declaración puede ser incorrecta por errores no intencionales o inconscientes como resultado de la percepción incompleta, falta de atención para el evento en cuestión, olvido o confusiones de memoria, además de la ambigüedad como característica del lenguaje humano (Vázquez-Rodríguez & Pinto-Elías, 2019), que impacta en la semántica del contexto de una declaración. Por tanto, el porcentaje de aciertos podría ser influenciado por estas declaraciones en los diferentes algoritmos de clasificación aplicados, esta situación se deja al lector como trabajos futuros de investigación.
6. Conclusiones
El uso de la Inteligencia Artificial (IA) basados en el autoaprendizaje viene demostrando desarrollos en los modelos de detección de declaraciones falsas con menores tasas de errores, por lo que debe considerarse como una nueva herramienta estratégica que complementen las técnicas psicológicas.
Los aportes del estudio son: (a) Al personal de psicología, les permitirá disponer de una herramienta de apoyo en sus procesos de análisis propios de la especialidad, (b) Los gobiernos podría realizar una eficiente distribución de recursos logísticos y humanos para la realización de investigaciones en denuncias que realmente requieran atención por ser veraces, (c) Los ciudadanos tendrían mayor asistencia del personal policial en materia de seguridad ciudadana, orden interno y orden público, (d) Las empresas o personas naturales inocentes involucrados en testimonios falsos establecerían lazos de confianza hacia sus autoridades policiales por la rapidez en que se esclarecerían los casos.
Sin embargo, dada la complejidad de las declaraciones falsas, por el momento no se asigna un peso por grado de veracidad, que serviría para priorizar los casos según la urgencia de estos. Por ello se requieren de nuevos estudios que analicen la asignación de pesos de prioridad a las denuncias veraces, con lo cual las investigaciones enfocarían sus recursos y personal a los casos que realmente merecen atención prioritaria.
Otra oportunidad para estudios futuros es la utilización de otras fuentes de datos que permita la correlación entre ellas para aumentar el grado de exactitud del modelo, así como el análisis del contexto en el cual ocurren los hechos.