Humanidades digitales: Lectura distante, fragmentada y colaborativa en el archivo infinito

20.01.2021

A continuación, te invito a leer este breve extracto del análisis que presentó el Dr. Jairo Antonio Melo Flórez en "Lectura distante, fragmentada y colaborativa en el archivo infinito". Espero que lo disfrutes:

La traducción y reciente publicación en Argentina del libro Lectura distante de Franco Moretti[1], publicado en inglés en el año 2013, constata el interés que viene generando el área de las humanidades digitales en América Latina. Moretti se ha convertido en una de las figuras visibles dentro del campo de los estudios histórico-literarios, en especial, después de publicar su afamado y en cierta medida polémico Graphs, Maps and Trees: Abstract Models for Literary History, en el cual, propone el análisis cuantitativo de los textos literarios en periodos de larga duración.

Moretti pretende trascender propuestas de lectura cercana (Close Reading) como el análisis de contenido[2] y procura llevar los estudios literarios hacia los grandes volúmenes de texto al aplicar una lectura no literal sino cuantitativa de grandes volúmenes de información que permitan superar la interpretación y en cambio hacer evidentes estructuras, entendidas como repeticiones, regularidades, órdenes y patrones que se hacen visibles al percibir la literatura desde la longue dureé.

En sus palabras: "the models I have presented [graphs, maps and trees] also share a clear preference for explanation over interpretation; or perhaps, better, for the explanation of general structures over the interpretation of individual texts".[3] Apreciaciones como las de Moretti constatan el sentido cuantitativo y no narrativo de ciertas tendencias en las humanidades digitales y ratifican el recelo por un posible enfoque neopositivista[4].

A pesar de los esfuerzos de Moretti y su equipo del Standford Literary Lab,[5] los resultados no han sido como esperaba, por lo menos así lo manifestó en una entrevista al diario argentino La Nación en la cual dijo: "Lo que tratamos de responder es si al estudiar grandes archivos de textos con estos nuevos métodos ha cambiado nuestra visión de la historia. Honestamente debo decir que, hasta ahora, eso no ha sucedido. Por eso, este método es por ahora más una promesa que una realidad".[6]

Esta declaración de Moretti evidencia la dicotomía entre las capacidades de las aplicaciones informáticas y las posibilidades explicativas que se pueden derivar de su uso. No hay duda que con un algoritmo se podría "leer" una cantidad de textos más allá de la capacidad de cualquier ser humano, pero a pesar de su capacidad para extraer y relacionar contenidos aún no se ha encontrado la manera en que el programa entienda la forma del texto, por ejemplo, si las oraciones tienen un sentido literal o irónico.[1]

Hay que entender asimismo que, para un historiador, como en general para cualquier humanista, tratar con datos masivos no significa lo mismo que para un analista de mercado u otro ingeniero que trabaja con big data. Siguiendo la explicación dada por Shawn Graham, los datos masivos pueden comprenderse como una cantidad de información más grande de lo que normalmente un investigador podría abarcar en su trabajo cotidiano;[2] es decir, que es humanamente imposible leer e interpretar de manera tradicional.

Para el científico de las humanidades, el contenido de la información suele encontrarse de forma semiestructurada, es decir, catalogada de tal manera que es posible identificar el tipo de documento, las características físicas del original, el lugar de procedencia, autores, e incluso un resumen o descriptor del contenido; todo ello es lo que se denomina como metadatos, es decir, información que permite ubicar, ordenar y guardar datos de manera automatizada.

Pero hay mucha información que no está estructurada y consiste en una inmensa colección de unidades de lenguaje para cuyo análisis no es posible fiarse de la automatización, por ello en muchas ocasiones se prefiere construir las bases de datos antes que "minar" los recursos Web para recolectar información útil para resolver los problemas planteados por las ciencias humanas. Así, las humanidades digitales se han enfrentado a lo que puede considerarse una nueva necesidad de lectura en el sentido de un novel paradigma de interpretación de textos históricos denominada la lectura distante.

Si este texto llamó tu atención y te dejó cierta curiosidad para ahondar más en la materia, te invito a descargar el texto completo aquí, y a formar parte del curso  Humanidades digitales que ofrecemos en Diplomados IBERO

Diego Miguel Ángel Rivera Mares, responsable de Investigación en Tendencias y Mercados de la Coordinación de Comercialización y Comunicación Digital de Diplomados IBERO. 

[1] Esta crítica a la "minería de datos" proviene de "Franco Moretti"

[2] Shawn Graham, Exploring Big Historical Data-The Historian's Macroscope Book Launch @Carleton_U (Ottawa, 2015), https://www.youtube.com/watch?v=NjrZAJeDVYA. Desde una perspectiva de la ingeniería de la información el big data representa un conjunto de datos cuyo tamaño supera la capacidad de captura, almacenaje, gestión y análisis de un software estándar de análisis estadístico. Chris Snijders, Uwe Matzat y UlfDietrich Reips, "'Big Data': Big Gaps of Knowledge in the Field of Internet Science", International Journal of Internet Science 7(1) (2012): 1.

[1] Franco Moretti, Lectura distante, trad. Lilia Mosconi (Buenos Aires: Fondo de Cultura Económica, 2015).

[2] Klaus Krippendorff, Content analysis: an introduction to its methodology, 2a ed. (Thousand Oaks: Sage, 2004)

[3] Franco Moretti, Graphs, Maps, Trees: Abstract Models for Literary History (Londres, Nueva York: Verso, 2007), 91. Es interesante cómo Moretti recupera el sentido dado por Dilthey al acercamiento que se puede adoptar en relación con un texto, esto es como explicación, en el sentido de una aplicación del modelo de las ciencias naturales a las ciencias históricas (enfoque positivista) o como interpretación, entendida como la actitud fundamental de las ciencias humanas ante los textos. Paul Ricœur, From Text to Action, Essays in Hermeneutics 2 (Evanston: Northwestern University Press, 1991), 105.

[4] Son muchos los artículos, ensayos y mensajes de blog que han tratado el sentido neopositivista de las humanidades digitales entre los cuales destaco el texto de Johanna Drucker, "Humanistic Theory and Digital Scholarship", en Debates in the Digital Humanities, ed. Matthew Gold, 85-95 (Minneapolis: Universidad de Minnesota, 2012). https://dhdebates.gc.cuny.edu/debates/text/34. También es de resaltar el comentario hecho por Anaclet Pons al enfoque de Moretti en Anaclet Pons, El desorden digital: guía para historiadores y humanistas (Madrid: Siglo XXI, 2013), 125-26.

[5] "Stanford Literary Lab-Directed by Franco Moretti and Mark Algee-Hewitt", https://litlab.stanford.edu/ (Fecha de consulta: 29 de mayo de 2016).

[6] Natalia Blanc, "Franco Moretti: 'El estudio de la cultura perdió mucho por no seguir un método científico'", La Nación, jueves 17 de septiembre de 2015. https://www. lanacion.com.ar/1828487-franco-moretti-el-estudio-de-la-cultura-perdio-mucho-porno-seguir-un-metodo-cientifico (Fecha de consulta: 30 de mayo de 2016).