Introducción

El presente informe se enmarca en el PI3CET Producción del espacio y derecho a la ciudad. Conflictos, vivencias y discursos. Mar del Plata, siglo XXI.1 Es un primer avance en el análisis del activismo vecinal y territorial en el partido de General Pueyrredon. Está centrado en identificar el índice de conflictividad barrial a lo largo del período 2006-2021. Asimismo, pretende ser una aproximación a las problemáticas y demandas barriales a lo largo del período bajo análisis. También se hará un ejercicio de georreferenciación por polígono barrial para visualizar los índices de problemáticas sociales según barrio.El sentido último del informe es ser un insumo para el trabajo en el territorio y una contextualización histórica (historia reciente) y panorámica sobre el activismo en los distintos barrios de la ciudad. También tiene la pretensión de contribuir a una perspectiva computacional basada en la minería de textos para el análisis de la conflictividad social que sea reproducible en el marco de otros proyectos.

Técnicas

Como dijimos, adoptamos una perspectiva analítica computacional tanto en la recolección como en el análisis de los datos. Todo el proceso de recolección, estructuración, normalización, análisis y visualización de la información semiestructurada disponible en el sitio web del diario La Capital, nuestra fuente de información, se realizó a través de programación computacional. Por este motivo, cada etapa de la investigación requirió un desarrollo específico de líneas de código en lenguaje R Project. Muchas de las ideas para desarrollar el código fueron producto del diálogo con los avances realizados en el marco de otras investigaciones (Albrieu & Palazzo, 2020; Franzosi, 2020; Liang & Zhu, 2017; Palazzo, 2017).

El trabajo de archivo requirió extraer información semiestructurada de forma automatizada de La Capital. La unidad de extracción de información fue la nota individual publicada en formato de marcado HTML y el recurso específico para llevar adelante esta tarea fue el paquete rvest (Wickham, 2021). Es un paquete para raspado y análisis web creado por Hadley Wickham e inspirado en el módulo Beautiful Soup de Python. Internamente utiliza funciones de otros paquetes como xml2. La información extraída se reorganiza en formato tabular, cada fila de la tabla refiere a una única nota publicada en La Capital, mientras que cada columna refiere a una parte de la nota como puede ser el título, la bajada, el cuerpo de la nota, la fecha, el link, la foto, etc. El formateo estructurado de la información extraída se logra con el uso del paquete tibble (Müller & Wickham, 2021). Los tibbles son data frames, pero con un formato más ágil que los clásicos marcos de datos. El análisis de los datos requiere de un conjunto de paquetes, muchos de ellos agrupados en tidyverse que está diseñado para facilitar la instalación y la carga de los paquetes principales en un solo comando gracias a compartir representaciones de datos comunes y diseño de API (Wickham et al., 2019). Finalmente, para la visualización de los datos principalmente hacemos uso del paquete ggplot2, un sistema para crear gráficos de forma declarativa (Wickham, 2016).

Una vez obtenidos los datos (las notas del diario La Capital), su procesamiento se llevó a cabo en base a técnicas computacionales de minería de textos. Según las definiciones más extendidas la minería de textos refiere al proceso de minar grandes corpus de escritos con el objetivo de generar nueva información, de identificar patrones. Así, los textos son «datificados» para posteriores análisis estadísticos. Una de las técnicas más usada dentro del campo de la minería de textos es el procesamiento de lenguaje natural (NLP). El NLP permite un tratamiento computacional del lenguaje humano a partir de procesos de modelización matemática. Se puede decir que es un conjunto de técnicas lingüísticas que permiten el procesamiento léxico, morfo-sintáctico y semántico de los corpus de texto. Dos elementos clave en esta etapa fueron los diccionarios y la tokenización (separación por palabras del corpus de notas). Asimismo, realizamos procesos computacionales de lematización (atribución a una cadena finita de caracteres de la representación de todas las formas flexionadas de una palabra) y etiquetado POS (etiquetado gramatical). Todo esto lo realizamos con la ayuda de distintos paquetes como tidyr, tm, quanteda, udppipe, spacyr (Silge & Robinson, 2017).

Ahora bien, el uso de lenguajes de programación como R Project requiere de un soporte físico para su ejecución. Lo interesante del caso es que podemos optar por algo distinto a la tradicional PC de escritorio. Se trata de un hardware reducido en tamaño y precio (Raspberry Pi) que solo necesita periféricos o acceso remoto para ser utilizado y que tiene una gran potencia de procesamiento. Su tamaño se asemeja al de una caja de naipes españoles. Si bien es verdad que su origen estuvo ligado al espacio educativo (Yamanoor & Yamanoor, 2017), desde muy temprano fue utilizado como una PC alternativa, y en los últimos años cosechó adherentes en las humanidades digitales y las ciencias sociales computacionales (Smithies, 2016).

Objetivos

  • En primer lugar, presentamos una caracterización de la fuente de información utilizada, el diario La Capital.
  • En segundo lugar, nos abocamos al análisis estadístico elemental de los datos construidos con técnicas computacionales de minería de textos.
  • En tercer lugar, realizamos un ejercicio de georreferenciación de los datos construidos en base a la división barrial del partido de General Pueyrredon.


Alcances y problemas de La Capital como fuente de información

El diario La Capital es el periódico de mayor alcance y cobertura temporal de la ciudad de Mar del Plata. Si bien sigue siendo un periódico que se edita y comercializa en formato «papel», desde 1998 cuenta con una versión web en formato html (captura hecha por INTERNET ARCHIVE). La página web no cuenta con un archivo online, pero es posible acceder a las notas publicadas desde el año 2006 en adelante. Es importante saber que en 2009 La Capital cambió su dominio, pasó del inicial «www.lacapitalnet.com.ar» al actual «www.lacapitalmdp.com». Entre 1998 y la actualidad, el portal de noticias cambió su estructura y estética en varias oportunidades. Sin embargo, para el periodo aquí abordado es importante saber que en 2016 el portal de La Capital cambió su formato y comenzó a tener, al menos hasta hoy, una regularidad en su periodicidad y en la cantidad de notas publicadas. Más importante es conocer que el flujo de notas publicadas en formato papel difiere en relación al flujo de notas en el portal web. Esto hace que no siempre coincida la cantidad de notas en ambos soportes. La versión online no reproduce todo lo que se publica en la versión papel. Tampoco año a año reproduce en su versión web una proporción estable del total de notas publicadas en papel. Para poder lidiar con estas diferencias trabajamos con valores relativos cuando necesitamos realizar comparativas entre años o períodos de tiempo.

Ahora pasemos a ver cómo es la distribución anual de la frecuencia de notas publicadas en la versión online de La Capital en sus secciones “La Ciudad” y “Policiales” , ya que son estas dos secciones las que nos brindan información sobre lo ocurrido en el partido de General Pueyrredon. Comencemos por un resumen estadístico básico:

Estadísticas Valores
Min. 1333
1st Qu. 4381
Median 6257
Mean 5870
3rd Qu. 6850
Max. 10613


Si tenemos en cuenta que es una serie temporal solo tres valores del resumen son relevantes para indicar la fluctuación en el flujo de notas publicadas: el valor mínimo correspondiente al año 2008 (1333), el valor promedio 5870, y el valor máximo correspondiente el año 2011 (10738). El valor mínimo está 4537 notas por debajo del número promedio de notas, mientras que el valor máximo está 4743 notas por encima del número promedio de notas. De los dos valores extremos, por obvias razones, el más problemático es el mínimo ya que daría un promedio diario de notas publicadas en cada sección de 1.83. Esto implica que durante el año 2008 hubo días en los que la versión online de La Capital no publicó nada en estas dos secciones del diario.

Gráfico 1


En el gráfico 1 podemos observar la desigual distribución anual de la cantidad de notas de las secciones «La Ciudad» y «Policiales». La línea horizontal de color verde marca la media anual de notas, la línea azul marca la mediana, y la línea vertical de color rojo marca el cambio en la página web de La Capital. El gráfico confirma lo que presumíamos, desde el año 2016 hay una regularidad en la frecuencia de notas publicadas. Asimismo, parece que a partir de aquel año hay un piso más cercano al total de notas salidas en la versión papel, mientras que en el período previo hay valores extremadamente bajos que contrastan con valores muy altos.

El gráfico 1 permite que nos hagamos una idea aproximada de los años más problemáticos, pero no nos dice nada sobre los días en los cuales el portal de La Capital no publicó ni una nota. Para hacernos una primera idea vamos a realizar un nuevo resumen estadístico básico sobre el vector de frecuencia de notas diarias.

Estadísticas Valores
Min. 1.00
1st Qu. 11.00
Median 17.00
Mean 17.43
3rd Qu. 22.00
Max. 83.00
NA’s 430.00


Uno de los datos más importantes es el referido a los valores pedidos NA’s. Estos valores alcanzan un total de 430 y refieren a días en los cuales no hay ni una sola nota publicada online. Por otra parte, los valores máximo (83) y mínimo (1) son muy extremos. Si tenemos en cuenta que el valor promedio es de 17.4, el valor mínimo está 16 notas por debajo y el valor máximo está 66 notas por encima. Pero mientras el valor 83 es excepcional, el valor 1 es común a un conjunto de fechas. Veamos qué frecuencia presentan las distintas cantidades diarias de notas publicadas a lo largo del período 2006-2021.

Gráfico 2


El histograma muestra, por un lado, los valores atípicos en color rojo que representan fechas en las cuales el portal web publicó más de 43 notas. Por otro lado, las frecuencias diarias más bajas no son valores atípicos, pero si son un rasgo problemático para el análisis ya que hay más de 300 fechas con menos de 5 notas publicadas que se suman a las 430 fechas sin notas publicadas (NAs).

Gráfico 3


El gráfico 3 nos permite identificar los años con mayor número de outliers y los años que concentran fechas con una o dos publicaciones. Los años 2009, 2010 y 2011 tienen los valores atípicos más altos, mientras que los años 2007, 2008, 2012, 2013, 2014 y 2015 tienen una alta concentración de fechas con muy pocas publicaciones. Ahora vamos a visualizar en un gráfico de barras el total de notas publicadas por día a lo largo del período 2006-2021.

Gráfico 4


El gráfico 4 permite que identifiquemos en qué fechas hay valores perdidos o de frecuencia mínima (1 a 4 notas). En este sentido, los años 2008 y 2012 aparecen como los más problemáticos. Por su parte el período 2016-2021 se muestra con una frecuencia diaria relativamente homogénea que gira en torno a las 20 notas. Si bien ya nos podemos hacer una idea sobre los años en los cuales hay mayor número de valores pedidos (días sin publicaciones), es oportuno que analicemos este problema más de cerca.

Gráfico 5

## 
##  Variables sorted by number of missings: 
##  Variable       Count
##      2008 0.461748634
##      2007 0.346994536
##      2006 0.196721311
##      2012 0.035519126
##      2013 0.032786885
##      2010 0.016393443
##      2009 0.010928962
##      2014 0.010928962
##      2015 0.010928962
##      2011 0.008196721
##      2016 0.008196721
##      2017 0.008196721
##      2018 0.008196721
##      2019 0.008196721
##      2020 0.008196721


El gráfico 5 nos muestra que el mayor número de valores perdidos (fechas sin publicación de notas) está concentrado en tres años: 2008, 2007 y 2006. Estos tres años reúnen 368 (86%) fechas sin notas sobre un total de 430 valores perdidos. Solo el 2008 tiene 169 días sin notas, casi la mitad del año (46%). El 2007 tiene 127 días sin notas (35% de los días del año) y el 2006 tiene 72 días sin notas (20% de los días del año). Si a esta situación le sumamos los días con una o dos notas publicadas el panorama es mucho más complejo. Lo más sensato es desestimar esto tres años para los análisis de series temporales.

La Capital en los barrios

En lo que sigue, ya no trabajaremos con el total de notas publicadas online, si no solo con aquellas que refieran a alguna cuestión barrial o mencione a algún barrio. La técnica para construir este sub-corpus de notas consiste en la elaboración de un diccionario sobre la cuestión barrial que nos permite filtrar las notas según refieran o no a lo barrial. Se trata de un conjunto de palabras con el que es cotejada cada nota. La condición excluyente para que una nota sea seleccionada, es que en ella se encuentren al menos una palabra del diccionario. La línea de código que usamos para realizar el primer filtro sobre lo barrial en el corpus de notas es la siguiente: filter(str_detect(nota, “asentamientos | villas | fomentismo | vecinal | vecino | usurp | terreno | fomento | barrial | barrio | barriada”)).

Gráfico 6


En el gráfico 6, al igual que en el gráfico 1, podemos observar la desigual distribución anual de la cantidad de notas publicadas en las secciones «La Ciudad» y «Policiales» referidas a alguna cuestión barrial. Los años 2006, 2007, 2008 y 2013 están muy por debajo de la media con menos de 1100 notas publicadas por año. Estos cuatro años tienen un promedio diario de 2 notas. Por otra parte, podemos decir que, a simple vista, parece haber una proporcionalidad a lo largo de los años entre las notas referidas a los barrios y el resto de las notas publicadas por La Capital.

Gráfico 7


El gráfico 7 nos permite comprobar la proporcionalidad sospechada. Efectivamente, más allá de los valores absolutos de notas totales por año, los valores relativos fluctúan en torno al 30%. La excepción es el año 2006 que presenta un valor muy por debajo del 30%. Este gráfico también es una primera aproximación a la variación interanual en la frecuencia de cuestiones y problemáticas barriales en el partido de General Pueyrredon. Decimos esto porque la mayor visibilidad en la prensa expresada en el peso relativo mayor o menor de las notas sobre cuestiones barriales en relación al resto de las notas se pude asumir como un indicador indirecto de mayor o menor activación barrial. En concreto, 2008, 2013 y 2015 son los años con mayor peso relativo. Veremos más adelante si este dato se corresponde o no con los índices de conflictividad barrial.

El diagnóstico sobre el corpus de notas a ser analizado en el próximo apartado nos permitió detectar y ubicar los segmentos temporales problemáticos, ya sea por escasez de notas diarias o por ausencia de notas, también por la presencia de valores atípicos extremadamente altos. Queda para otro momento el análisis de los porqués de esta irregularidad en el flujo diario e interanual de notas posteadas en el portal del diario La Capital y las posibles soluciones para completar los datos faltantes o escasos y suavizar el peso de los outliers.


Los barrios en la prensa comercial

En este apartado nos ocuparemos, en primer lugar, de realizar un análisis exploratorio del sub-corpus de notas de La Capital referido a cuestiones barriales. El objetivo es identificar el grado de visibilidad mediática de los distintos barrios del partido de General Pueyrredon. En segundo lugar, desarrollaremos un índice de conflictividad barrial para estimar las modulaciones que asumen los conflictos de los diferentes barrios en el partido de General Pueyrredon. Finalmente nos ocuparemos de listar los distintos tipos de demandas, reclamos y problemáticas barriales y territoriales que emergen en el sub-corpus de notas.

Comencemos por las notas que tienen al menos una mención sobre los distintos barrios del partido de General Pueyrredon entre 2006 y abril de 2021. Aquí hacemos uso nuevamente de los diccionarios de palabras, en esta ocasión referidos a las nominaciones posibles de los distintos barrios. Esto nos permite individualizar y contar las notas en las que al menos un barrio fue mencionado y la cantidad total de menciones de los distintos barrios del partido de General Pueyrredon.

Tabla 1

FRECUENCIA ABSOLUTA DE MENCIONES DE BARRIOS. PERÍODO 2006-2021
BARIOS FREC
AREA CENTRO 3464
zona sur 1048
DE LAS HERASJUAN GREGORIO 948
NUEVE DE JULIO 806
RIVADAVIA BERNARDINO 787
BATAN 727
PUNTA MOGOTES 660
DE LA PLAZA FORTUNATO 642
SIERRA DE LOS PADRES 633
SAN JUAN 623
NEWBERY JORGE 607
LIBERTAD 580
CERRITO SUR 576
SANTA ROSA DEL MAR DE PERALTA RAMOS 562
FRAY LUIS BELTRAN 533
EL MARTILLO 530
PLAYA GRANDE 488
GENERAL BELGRANO 465
ESTRADA JOSE MANUEL 442
LA PERLA 431
PARQUE CAMET 426
LOS ACANTILADOS 424
JURAMENTO 403
ALFAR 376
PARQUE LURO 344
ROLDAN BELISARIO 344
AMEGHINO FLORENTINO 341
COLINAS DE PERALTA RAMOS 338
PARQUE PALERMO 336
PLAYA SERENA 328
LOS PINARES 304
ESTACION CAMET 302
PARQUE INDUSTRIAL 293
MALVINAS ARGENTINAS 282
JOSE HERNANDEZ 281
PARQUE HERMOSO Y VALLE HERMOSO 280
BOSQUE PERALTA RAMOS 269
SAN JOSE 268
CERRITO Y SAN SALVADOR 267
LA HERRADURA 267
LAS AMERICAS 267
AUTODROMO 260
FARO NORTE 258
CAMET FELIX U. 255
DON BOSCO 246
SAN CAYETANO 246
VILLA PRIMERA 246
EL GAUCHO 245
SAN PATRICIO 243
NUEVO GOLF 238
EL PROGRESO 218
HIPODROMO 216
DON EMILIO 207
SANTA RITA 203
LAS LILAS 199
ANTARTIDA ARGENTINA 198
AEROPARQUE 195
LAS AVENIDAS 195
ZACAGNINI JOSE MANUEL 194
BOSQUE GRANDE 192
LOPEZ DE GOMARA 192
SAN JACINTO 191
SANCHEZ FLORENCIO 187
SANTA ROSA DE LIMA 184
LA FLORIDA 179
SAN ANTONIO 178
VILLA LOURDES 176
LA PEREGRINA 169
DOS DE ABRIL 164
ESTACION CHAPADMALAL 163
GENERAL SAN MARTIN 162
SANTA PAULA 158
PRIMERA JUNTA 155
SAN JORGE 154
LOS ANDES 150
SANTA CELINA 144
NUEVA POMPEYA 142
LOS TRONCOS 140
GENERAL PUEYRREDON 135
LAS CANTERAS 134
PARQUE INDEPENDENCIA 133
LOS TILOS 132
CONSTITUCION 130
PERALTA RAMOS OESTE 128
SAN CARLOS 122
EL BOQUERON 120
TERMAS HUINCO 113
SAN EDUARDO DEL MAR 110
ESTACION NORTE 108
PARQUE MONTEMAR-EL GROSELLAR 100
SANTA MONICA 96
CORONEL DORREGO 92
DEL PUERTO 88
LOMAS DEL GOLF 84
LAS MARGARITAS 78
BOSQUE ALEGRE 76
EL JARDIN DE PERALTA RAMOS 76
GENERAL ROCA 73
PLAYA LOS LOBOS 71
EL JARDIN DE STELLA MARIS 64
EL MARQUESADO 60
PLAYA CHAPADMALAL 56
DIVINO ROSTRO 53
RUMENCO 53
EL COLMENAR 52
PARQUE EL CASAL 49
PINOS DE ANCHORENA 40
PLAZA PERALTA RAMOS 40
SAN EDUARDO DE CHAPADMALAL 39
QUEBRADAS DE PERALTA RAMOS 37
COLONIA BARRAGAN 36
LA GLORIA DE LA PEREGRINA 36
LOMAS DE STELLA MARIS 36
LEANDRO N. ALEM 33
ESTACION TERMINAL 30
COLINA ALEGRE 27
SARMIENTO DOMINGO FAUSTINO 25
ARROYO CHAPADMALAL 22
VIRGEN DE LUJAN 21
LOS ZORZALES 15
FUNES Y SAN LORENZO 14
REGIONAL 10
LAS RETAMAS 8
ARENAS DEL SUR 4
CAMINO A NECOCHEA 3
LOMAS DE BATAN 3
CARIBE 1
VILLA SERRANA 1
LA ARBOLEDA 0
LA GERMANA 0


Aclaremos que, sobre el corpus de notas referidas a la realidad barrial listamos menciones de barrios porque en una nota pueden aparecer mencionados dos o más barrios. En el «top ten» de frecuencias más altas destacan el área centro, la zona sur, los barrios 9 de Julio, Bernardino Rivadavia, Punta Mogotes, Fortunato de la Plaza, la localidad de Sierra de los Padres y la localidad de Batán, con más de 9.000 menciones en conjunto. Solo dos barrios aparecen con frecuencia 0 (La Arboleda y La Germana). Por otra parte, los últimos 9 barrios con al menos una mención están por debajo de 16, esto es menos de una mención por año.

En relación a los barrios incluidos en el PI3CET podemos decir que Las Heras con 948 menciones está en el puesto 3 del ranking, mientras que el barrio Dos de Abril con 164 menciones se ubica en el puesto 69 del ranking. Por su parte, el barrio Estación Camet (incluido en el proyecto de extensión) con 302 menciones ocupa el puesto 32.

Tabla 2

FRECUENCIA ABSOLUTA DE MENCIONES DE LOS TRES BARRIOS DE REFERENCIA. PERÍODO 2006-2021
BARIOS FREC
LAS HERAS 948
ESTACION CAMET 302
DOS DE ABRIL 164


Sobre el corpus de notas referidas a la realidad barrial, aplicaremos ahora un diccionario que nos permita detectar aquellas notas que específicamente versan sobre conflictividad. De esta forma comenzamos a explorar el activismo barrial.

En el siguiente gráfico nos ocuparemos de mostrar la frecuencia absoluta anual de palabras conflictivas emergentes en el corpus de notas referidas a la realidad barrial del partido de General Pueyrredon.

Gráfico 8


El gráfico 8 nos permite tener una idea sobre en qué años hay más información disponible en torno a las demandas de vecinxs y la conflictividad barrial, y en qué años hay menos o muy poca información disponible. Los años 2007, 2008, 2013 y 2014 tienen un promedio diario de palabras conflictivas menor a 7. También podemos decir que, con algunas leves diferencias, la silueta dibujada por la frecuencia de palabras conflictivas es similar a la silueta que dibuja la frecuencia de las notas. O sea, parece haber cierta proporcionalidad entre número de notas sobre los barrios y numero de palabras conflictivas. Sin embargo, no nos dice mucho sobre las variaciones en los índices de conflictividad barrial (ICB) año a año. En el próximo gráfico avanzamos en la construcción de un ICB. El enfoque que elegimos para construir el índice se centra en el peso relativo de las palabras conflictivas (identificadas con un diccionario de palabras referentes a todo tipo de conflicto o situación conflictiva) en relación a las palabras totales de cada una de las notas. Veamos…

Gráfico 9


El gráfico sobre el índice de conflictividad barrial (ICB) muestra dos cuestiones significativas. Primero, algo que ya habíamos visto con la carga manual de la base de datos para la conflictividad social general del período 2011-2016, el menor peso relativo de la conflictividad en los años electorales (años impares). Las excepciones son el año 2009 en relación al año 2010 y el año 2021 en relación al año 2020. En torno a la primera excepción, cabe mencionar que entre 2008 y 2010, pero de forma específicamente intensa a lo largo del año 2009 se desarrolló en la ciudad de Mar del Plata un conflicto en torno al acceso a la vivienda digna protagonizado por 200 familias del barrio Gral. Pueyrredon (Núñez & Brieva, 2013). Este conflicto podría estar explicando la excepción si tomamos en cuenta su duración, su instalación en la agenda mediática, la cantidad de actores que involucró, y las múltiples respuestas estatales que generó. En torno a la segunda excepción, hay que tener en cuenta que el 2021 solo computa hasta el 26 de abril y que se da en un contexto novedosamente atípico (pandemia). En segundo lugar, se detecta una tendencia al incremento del ICB en los últimos seis años (2016-2021) que coincide con el gobierno de Macri (2016-2019) y la pandemia con sus políticas de aislamiento y distanciamiento (2020-2021), en un contexto de agudización de la crisis económica, la desocupación y la pobreza.

En las próximas líneas nos ocuparemos de analizar el ICB acumulado entre 2016 y 2021 para los doce primeros barrios ordenados decrecientemente según el ICB. El uso del ICB nos permite evitar el impresionismo causado por las frecuencias absolutas. Sin la aplicación de un índice ponderado el ranking barrial es acaparado por los barrios de la zona céntrica debido a su centralidad política, económica y social. Es decir, las notas que hablan de la zona céntrica tienen más palabras conflictivas, pero también tienen más palabras totales. Como ya dijimos, el índice nos permite ponderar el peso relativo de las palabras conflictivas sobre el total de palabras del corpus de notas bajo análisis.

Gráfico 10


Como preveíamos, el gráfico 10 nos deja ver el peso relativo de la conflictividad en los barrios no céntricos de la ciudad. En general, estos barrios son los que, por un lado, concentran agravios en torno al derecho a la ciudad (Núñez, 2015) y, por otro lado, son territorialidades de organización popular, organizaciones que vehiculizan las demandas emergentes. También son procesos territoriales emergentes en donde se construyen nuevas relaciones sociales y se disputan derechos. General Pueyrredon, El Martillo y José Hernández son los tres barrios con mayor ICB acumulado durante el período 2006-2021.

Veamos ahora cual es el ICB acumulado en los barrios Las Heras, Dos de Abril y Estación Camet.

Tabla 3

DISTRIBUCIÓN ACUMULADA DEL ICB PARA LAS HERAS, DOS DE ABRIL Y ESTACIÓN CAMET. PERÍODO 2006-2021
BARRIOS ICB
LAS HERAS 89.2
DOS DE ABRIL 77.0
ESTACION CAMET 61.9


La tabla muestra que, si bien no encabezan el ranking, los barrios Las Heras, Dos de Abril y Estación Camet tienen un ICB acumulado alto, muy por encima de los valores más bajos de la tabla (Villa Serrana: 3.5; Caribe: 2.5, Camino a Necochea: 1.6). Pasemos a ver ahora la distribución del ICB discriminado por año y barrio.

Gráfico 11


El gráfico 11 suma la dimensión temporal en la medición del ICB según barrio. Un primer aspecto a destacar es la alternancia en el ranking, en ninguno de los seis años se repite la dupla que encabeza el ranking. Los barrios que encabezan el top 12 varían y se alternan año a año. En segundo lugar, el barrio que encabeza el gráfico 10 (General Pueyrredon) sobre la distribución acumulada del ICB para el período 2006-2021 no aparece en la desagregación anual del top 12. Esto se debe a que tiene un índice anual más bajo para el período 2016-2021, pero mucho más alto durante el período anterior (2006-2015), lo que le permite encabezar el top 12 del ICB acumulado durante el período 2006-2021. En este punto debemos recordar, que entre 2008 y 2010 se desarrolló el conflicto en torno al acceso a la vivienda digna del que emergió el Complejo Dignidad de El Martillo, barrio que aparece en segundo lugar en el top 12 del ICB general. Este conflicto fue protagonizado por 200 familias del barrio Gral. Pueyrredon (Núñez & Brieva, 2013). En el gráfico 12 vemos cómo las problemáticas relativas al acceso a la vivienda tienen sus valores máximos en los años 2009-2012, el año 2008 aparece con valores bajos, esto se puede deber a que no se publicó ninguna nota en el portal web de La Capital para el último período del año (como se ve en el gráfico 4). Asimismo, el año con mayor Índice de Problemática Barrial (IPB) es el 2009, el año más intenso de este conflicto, cuando se produjo una toma que duró más de tres meses y que finalmente fue desalojada. Por otra parte, el gráfico 11 nos permite percibir con facilidad que los índices más altos se concentran en el último bienio. Este dato se condice con los datos mostrados en el gráfico 9.

Gráfico 12


En el siguiente gráfico posaremos nuestra mirada en los tres barrios que nos ocupan: Dos de Abril, Las Heras y Estación Camet para el período 2016-2021. La intención es detectar los años con mayores índices de conflictividad en cada barrio.

Gráfico 13


Lo primero que notamos es que hay marcadas diferencias en la temporalidad de los procesos conflictivos entre los barrios Dos de Abril, Las Heras y Estación Camet. Por otro lado, aclaremos que la poca frecuencia de palabras conflictivas (PC) para el 2021 se debe a que contamos solo con sus primeros 4 meses.

Gráfico 14


En relación al gráfico 14 podemos destacar como rasgo distintivo la variación del año de mayor ICB en cada barrio. Mientras que los barrios Estación Camet y Dos de Abril tienen sus picos en 2017, Las Heras tiene su máximo valor en el año 2021, al menos durante sus primeros 4 meses.

En lo referido a la conflictividad, aún quedan muchos aspectos para desarrollar. Hay dos que nos interesan especialmente. Por un lado, analizar las formas de la conflictividad (qué tipo de acciones produjeron quienes protestan en los barrios). Por otro lado, avanzar en el armado de un nuevo índice de conflictividad barrial que combine el actual ICB con un índice proxi de cantidad de conflictos. De esta forma podremos ponderar tanto la cantidad como la intensidad de los conflictos. Pero esto queda pare el segundo informe, ahora pasaremos a analizar las problemáticas barriales emergentes.


Las problemáticas barriales

En este apartado del informe realizaremos un primer análisis exploratorio sobre los distintos tipos de problemáticas emergentes en los barrios del partido de General Pueyrredon para el período 2006-2021. Para llevarlo a cabo agrupamos distintas problemáticas en una quincena de tópicos, los cuales no carecen de cierta arbitrariedad. Vale aclarar que el corpus refiere al total de notas que menciona al menos a un barrio del partido de General Pueyrredon con independencia de que sean o no notas que refieran a conflictos. Veamos los primeros resultados.

Gráfico 15

Top 10 de problemáticas en los barrios. Período 2006-2021
Problemáticas Menciones Notas Índice de menciones
Inseguridad 17828 5103 3.49
Vivienda 12401 5296 2.34
Infraestructura 11625 3094 3.76
Educación 7312 2712 2.70
Mantenimiento 3954 1808 2.19
Salud 3818 1528 2.50
Infancias 3439 1536 2.24
Alimentación 2496 1142 2.19
Trabajo 2298 1124 2.04
Género 1943 919 2.11


Un primer dato básico que muestra el gráfico es el promedio de menciones por nota que tiene un rango que va de 4 a 2. Por otra parte, si bien, como ya dijimos, el corpus de notas no refiere a conflictos, la frecuencia de problemáticas nos permite imaginar cuales son los motivos por los que la población de los barrios se moviliza y protesta, así como también detectar problemáticas existentes que no se traducen en activación barrial. Por otra parte, no parece raro que el top de problemáticas esté encabezado por cuestiones vinculadas con la llamada «inseguridad», un tema, a la vez que real, privilegiado por la agenda mediática. Tampoco es de extrañar que los tópicos «Vivienda» e «Infraestructura» sean las dos siguientes problemáticas más mencionadas. Cuestiones como el acceso a la vivienda, al agua potable, a las cloacas y al gas, o la demanda de luminarias, pavimentos, etc. son cotidianas en los barrios menos céntricos del partido de General Pueyrredon. La educación es otro de los tópicos con mayor presencia debido a reclamos reiterados por el mejoramiento edilicio y de servicios en las escuelas de los distintos barrios de la ciudad, entre otras cuestiones.

Hasta aquí analizamos las problemáticas acumuladas durante todo el período para el conjunto de los barrios, ahora pasaremos analizar las variaciones anuales de la frecuencia de menciones y notas en base a un índice de problemáticas barriales (IPB), esto es, en función del peso relativo de las palabras que refieran a problemáticas barriales (identificadas a partir de un diccionario) en relación a las palabras totales de cada una de las notas.


Gráfico 16


Las variaciones anuales tienen en el primer lugar el tópico de la «Inseguridad». Sin embargo, los tópicos siguientes en el ranking varían de año a año. El dato más saliente es el lugar del tópico «Salud» que en los dos últimos años desplazó del segundo lugar al tópico «Infraestructura». Es claro que esto se debe al impacto de la pandemia en los barrios. Por el mismo motivo, las problemáticas educativas disminuyeron su peso durante los dos últimos años.

Ahora nos ocuparemos de ver la distribución anual del IPB según sea el tipo de problemática. De esta forma podremos detectar el valor máximo anual para cada uno de los tópicos.

Gráfico 17


Los tópicos «Salud» e «Inseguridad» tienen su valor máximo en el año 2020. Por su parte, «Género», «Espacios_Públicos», «Mantenimiento», «Infraestructura» y «Vivienda» tienen su valor máximo en el año 2017. Los tópicos de «Ambiente», «Derechos_Humanos», «Educación», «Infancias», «Trabajo», «Economía» y «Transporte» tienen su valor máximo en el 2016. Los años 2018 y 2019 no encabezan el índice de ninguno de los tópicos referentes a las problemáticas barriales.

Llegados a este punto nos parece oportuno posar la mirada en los tres barrios que están implicados en los proyectos en curso (PI3CET y Extensión), nos referimos a Las Heras, Dos de Abril y Estación Camet. Primero nos ocuparemos de analizar la distribución de la frecuencia de menciones de palabras referidas a problemáticas barriales para los tres barrios en conjunto.

Gráfico 18


El gráfico 18 muestra cómo varía año a año el ranking de problemáticas en estos tres barrios. La «Inseguridad» solo encabeza los años 2018 y 2019, los años 2021 y 2020 están encabezados por las problemáticas referidas a la salud (en un marco de pandemia). Por su parte, los años 2017 y 2016 son encabezados por las cuestiones referidas a la infraestructura barrial.

Los siguientes tres gráficos replican el mismo análisis, pero barrio por barrio.

Gráfico 19


Como se habrán dado cuenta, el Gráfico 19 es muy similar al Gráfico 18. Solo presenta algunas variaciones en los tópicos de menor peso. Esto es así porque la gran mayoría de las menciones que suman los tres barrios la concentra Las Heras. Veamos qué sucede en el barrio Dos de Abril.

Gráfico 20


Este gráfico sí varía mucho en relación a los dos anteriores. Un aspecto claro es la perdida de centralidad del tópico «Inseguridad» que solo encabeza el ranking de problemáticas dos años, el 2020 y el 2016, y en este último año lo hace junto al tópico «Educación». Otro aspecto claro es el acrecentamiento en importancia del tópico «Infraestructura» que encabeza el trienio 2017-2019. Por otra parte, es de destacar que durante el año 2021 (lo que va de él) emerge el transporte como problemática central. En este sentido, cabe destacar que en los primeros meses del año en curso (2021) se desarrolló un conflicto en torno al transporte público de pasajeros protagonizado por la Unión Tranviarios Automotor (UTA).

Gráfico 21


Este gráfico también varía mucho en relación a los anteriores. Para el año 2021 solo emergen (ganan visibilidad pública) dos problemáticas: «Inseguridad» e «Infraestructura». El año 2020 está centrado en los tópicos «Vivienda», «Salud» y «Educación». Durante el año 2019 «Infraestructura» es el tópico más destacado. «Infancias» y «Vivienda» encabezan las problemáticas del año 2018. El grueso de las problemáticas del año 2017 se reparte entre «Infraestructura» e «Inseguridad». Finalmente, el grueso de las problemáticas del año 2016 gira en torno a cuestiones de infraestructura barrial.

Veamos ahora estos datos sobre el mapa del partido de General Pueyrredon.

La geografía urbana de las problemáticas barriales

En este apartado nos ocuparemos de visualizar en el mapa el IPB barrio por barrio según tópico. El objetivo es poder identificar visualmente en qué barrios tuvo mayor incidencia cada una de las problemáticas. Comenzamos con las problemáticas vinculadas a los tópicos «Infraestructura», «Inseguridad» y «Vivienda».

Mapa 1


A primera vista, la distribución del IPB (acumulado durante el período 2006-2021) entre los barrios presenta rasgos distintos según sea la problemática. Mientras las problemáticas referidas a la infraestructura barrial se presentan con un grado de dispersión significativo (algo similar ocurre con el tópico «Inseguridad»), la cuestión del acceso a la vivienda, por el contrario, se muestra fuertemente concentrada en torno al barrio San Carlos. Este barrio fue escenario de un proceso de relocalización de un barrio popular conocido como «Villa de Paso» (Núñez, 2016). Asimismo, este proceso inconcluso y que se remonta al 2005, está conectado con el conflicto por la vivienda digna de las 200 familias del barrio General Pueyrredon.

Pasemos ahora a observar cómo fue la distribución del IPB en relación a los tópicos «Educación», «Mantenimiento» y «Salud».

Mapa 2


A diferencia del mapa anterior, las diferencias en el grado de dispersión no son tan extremas. Esto quiere decir que año a año los conflictos más intensos en torno a estos tópicos no tuvieron la tendencia de concentrarse en un solo barrio, como si lo es en el caso de las problemáticas vinculadas a la vivienda. Para que puedan darse una idea de los grados de dispersión según tópico y barrio, abajo dejamos una tabla interactiva que permite acceder a los barrios que superaron el umbral de 6 puntos en el IPB para cada una de las problemáticas. Según el grado mayor o menor de dispersión en la intensidad del conflicto, el rango de barrios incluido en la tabla puede variar tópico a tópico de uno (Vivienda: San Carlos) a muchos (Infraestructura: 7 barrios).


Top IPB


Para finalizar el apartado y este primer informe, nos ocuparemos de desmenuzar las problemáticas en torno a la infraestructura barrial, ya que aparece con el mayor grado de dispersión, situación que la posiciona como la problemática más extendida entre los barrios de General Pueyrredon.


Tabla de contexto sobre las protestas en torno a las problemáticas de infraestructura barrial


La tabla precedente nos permite acceder al contexto de las problemáticas vinculadas al tópico «Infraestructura». Y nos habilita una primera aproximación a la dimensión conflictual en torno a las protestas por infraestructura barrial.

Informe en desarrollo…

Aún quedan muchos aspectos a revisar y ampliar: mejorar y complejizar los índices, cruzar los datos de conflictividad con los de las problemáticas barriales, la identificación computacional de actores, el análisis de sentimientos en base a los comentarios de lectorxs, el desarrollo de mapas interactivos con múltiples capas de información, etc.

Bibliografía

Albrieu, R., & Palazzo, G. (2020). Categorización de conflictos sociales en el ámbito de los recursos naturales: Un estudio de las actividades extractivas mediante la minería de textos. Revista CEPAL, 131, 29–59. https://econpapers.repec.org/article/ecrcol070/45952.htm
Franzosi, R. (2020). What’s in a text? Bridging the gap between quality and quantity in the digital era. Quality & Quantity, 1–28.
Liang, H., & Zhu, J. J. (2017). Big data, collection of (social media, harvesting). The International Encyclopedia of Communication Research Methods, 1–18.
Müller, K., & Wickham, H. (2021). Tibble: Simple data frames. https://CRAN.R-project.org/package=tibble
Núñez, A. (2015). El derecho a la ciudad: Alienación, contradicción y práxis. In C. Mattos de & F. Link (Eds.), Lefebvre revisitado: Capitalismo, vida cotidiana y el derecho a la ciudad. RiL Editores.
Núñez, A. (2016). La producción del espacio. Reflexiones en torno a los procesos de relocalización de población. Mar del plata, 1998-2013. Territorios, 34, 113–135.
Núñez, A., & Brieva, S. S. (2013). Tensiones y conflictos en torno al problema habitacional. El caso de las familias sin techo. Mar del plata, 2008-2010. Cuaderno Urbano, 15(15), 72–92.
Palazzo, G. (2017). Minerı́a de datos, conflictos sociales y explotación de recursos naturales: Un aporte metodológico. Compendium: Cuadernos de Economı́a y Administración, 4(7).
Silge, J., & Robinson, D. (2017). Text mining with r: A tidy approach. " O’Reilly Media, Inc.".
Smithies, J. (2016). Full stack DH: Building a virtual research environment on a raspberry pi. Digital Humanities 2016: Conference Abstracts, 364–365.
Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer-Verlag New York. https://ggplot2.tidyverse.org
Wickham, H. (2021). Rvest: Easily harvest (scrape) web pages. https://CRAN.R-project.org/package=rvest
Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., Grolemund, G., Hayes, A., Henry, L., Hester, J., Kuhn, M., Pedersen, T. L., Miller, E., Bache, S. M., Müller, K., Ooms, J., Robinson, D., Seidel, D. P., Spinu, V., … Yutani, H. (2019). Welcome to the tidyverse. Journal of Open Source Software, 4(43), 1686. https://doi.org/10.21105/joss.01686
Yamanoor, N. S., & Yamanoor, S. (2017). High quality, low cost education with the raspberry pi. 2017 IEEE Global Humanitarian Technology Conference (GHTC), 1–5.

  1. Proyecto de Investigación Interfacultades integrado con actividades de Extensión y Transferencia (período 2020/2022 - RR 3502/20), desarrollado en el marco del proyecto Articulación interna y externa de la investigación en Ciencia y Tecnología de la Universidad Nacional de Mar del Plata II, del Programa de apoyo al fortalecimiento de la ciencia y la técnica en las universidades nacionales de la Secretaría de Políticas Universitarias (SPU), Ministerio de Educación nacional.↩︎