Mapa76 en el Media Party de Hacks/Hackers Buenos Aires y otras novedades

September 7, 2012 Uncategorized No comments

Después del agotador Hacks/Hackers Ba Media Party, seguimos avanzando sobre el prototipo de Mapa76, que ya está disponible en mapa76.hhba.info. Ya se integró una parte del georreferenciamiento de documentos, y ahora estamos trabajando en detectar correlaciones entre lugares. La idea es que al poder subir un documento, veamos visualmente y con cierta celeridad si alguna de estas direcciones encontradas está cerca de algún Centro Clandestino de Detención, y esto nos permitirá también geolocalizar los Centros Clandestinos que no estén georreferenciados en el texto. Aquí les dejo un mapa de CCD georreferenciados.

Mapa76: work day en la ex ESMA

June 19, 2012 Uncategorized No comments

Mapa76+ESMA from Ezequiel Clerici on Vimeo.

Tras una intensa jornada de trabajo, el pasado 16 de junio, en el Archivo Nacional de la Memoria, en la ex Escuela de Mecánica de la Armada (ESMA); lugar donde funcionó el mayor centro clandestino de detención (CCD), tortura y asesinato, durante la última dictadura en Argentina (1976/83). El equipo de Mapa76, logró visualizar el contenido de una base de datos aportada por la Comisión Nacional sobre Personas Desaparecidas (CONADEP).

En resumidas cuentas lo que hizo el grupo fue tomar un muestreo aleatoreo de 50 registros contenidos en la base de datos y probó su impacto visual al mapear (geolocalizar) los CCD y cómo fueron los recorridos realizados por los detenidos desaparecidos.

Ésta tarea permitió establecer relaciones materiales de tiempo y lugar entre un importante número de detenidos desaparecidos ya que sus recorridos se cruzaron en diferentes CCD a lo largo y ancho del país. Esto a su vez hizo suponer una cronología jerárquica (no confirmada de manera cabal) en el orden de traslado de los detenidos.

Luego con otro conjunto de datos (nombre de la persona, lugar donde fue secuestrado, filiación política, etcétera) se realizó un Timeline de testeo con la historia de quince detenidos desaparecidos. Por último se configuró un diagrama de red (network) gracias a las variadas formas de visualización que ofrece Google Fusion Tables.

 ————

Mapa76.info es un software de investigación periodística dedicado a la extracción automática de datos, análisis semántico y la estructuración de la información recopilada con el propósito de mostrar relaciones de manera visual e interactiva (líneas de tiempo, mapas interactivos y árboles de conexiones -treemap-) en la información relacionada con los juicios de la última dictadura militar y los juicios en curso. Esta herramienta debe permitir que el investigador pueda seleccionar y cruzar datos de diversas fuentes documentales para generar historias e identificar relaciones difíciles de encontrar y/o comprender por métodos tradicionales.

[más fotos aquí]

– Ezequiel Clerici, Hacks/Hackers Bs. As.

Mapa de Relaciones por organización política (50 casos)

June 19, 2012 Uncategorized No comments

El gráfico muestra los lugares de destino de los detenidos-desaparecidos en la última dictadura militar según organización política a la que pertenecían. El tamaño de los globos indica la cantidad de casos.

Mapa de relaciones por Centro Clandestino de Detención (50 casos)

June 16, 2012 Uncategorized No comments

Fuente Conadep

Mapa76 Hackathon at The Data Journalism Handbook

May 2, 2012 News No comments
spacer
Figure 41. Mapa76 (Hacks/Hackers Buenos Aires)

datajournalismhandbook.org/1.0/en/case_studies_7.html

We opened the Buenos Aires chapter of Hacks/Hackers in April 2011. We hosted two initial meetups to publicize the idea of greater collaboration between journalists and software developers, with between 120 and 150 people at each event. For a third meeting we had a 30-hour hackathon with eight people at a digital journalism conference in the city of Rosario, 300 kilometers from Buenos Aires.

A recurring theme in these meetings was the desire to scrape large volumes of data from the web, and then to represent it visually. To help with this a project called Mapa76.info was born, which helps users to extract data, and then to display it using maps and timelines. Not an easy task.

Why Mapa76? On March 24, 1976 there was a coup in Argentina, which lasted until 1983. In that period there were an estimated 30,000 disappeared people, thousands of deaths, and 500 children born in captivity appropriated for the military dictatorship. Over 30 years later, the number of people in Argentina convicted of crimes against humanity committed during the dictatorship amounts to 262 people (September 2011). Currently there are 14 ongoing trials and 7 with definite starting dates. There are 802 people in various open court cases.

These prosecutions generate large volumes of data that are difficult for researchers, journalists, human rights organizations, judges, prosecutors, and others to process. Data is produced in a distributed manner and investigators often don’t take advantage of software tools to assist them with interpreting in. Ultimately this means that facts are often overlooked and hypotheses are often limited. Mapa76 is an investigative tool providing open access to this information for journalistic, legal, juridical, and historical purposes.

To prepare for the hackathon we created a platform which developers and journalists could use to collaborate on the day of the event. Martin Sarsale developed some basic algorithms to extract structured data from simple text documents. Some libraries were also used from DocumentCloud.org project, but not many. The platform would automatically analyze and extract names, dates and places from the texts — and would enable users to explore key facts about different cases (e.g. date of birth, place of arrest, alleged place of disappearance and so on).

Our goal was to provide a platform for the automatic extraction of data on the judgments of the military dictatorship in Argentina. We wanted to a way of automatically (or at least semi-automatically) displaying key data related to cases from 1976-1983 based on written evidence, arguments and judgments. The extracted data (names, places and dates) are collected, stored and can be analyzed and refined by the researcher, as well as being explored using maps, timelines and network analysis tools.

The project will allow journalists and investigators, prosecutors and witnesses to follow the story of a person’s life, including the course of their captivity and subsequent disappearance or release. Where information is absent, users can comb through a vast number of documents for information which could be of possible relevance to the case.

For the hackathon, we made a public announcement through Hacks/Hackers Buenos Aires, which then had around 200 members (at the time of writing there are around 540). We also contacted many Human Rights associations. The meeting was attended by about forty people including journalists, advocacy organizations, developers and designers.

During the hackathon, we identified tasks that different types of participants could pursue independently to help things run smoothly. For example, we asked designers to work on an interface that combining maps and timelines, we asked developers to look into ways of extracting structured data and algorithms to disambiguate names, and we asked journalists to look into what happened with specific people, to compare different versions of stories, and to comb through documents to tell stories about particular cases.

Probably the main problem we had after the hackathon was that our project was very ambitious, our short-term objectives were demanding, and it is hard to coordinate a loose-knit network of volunteers. Nearly everyone involved with the project had a busy day job and many also participated in other events and projects. Hacks/Hackers Buenos Aires had 9 meetings in 2011.

The project is currently under active development. There is a core team of four people working with over a dozen collaborators. We have a public mailing list and code repository through which anyone can get involved with the project.

Mariano Blejman, Hacks/Hackers Buenos Aires

 

IJnet: Mapa76: revelando secretos de la última dictadura argentina a través del periodismo de datos

May 2, 2012 News No comments

spacer

by Maite Fernandez

spacer

Saber más sobre el destino y los tortuosos caminos recorridos por las personas desaparecidas durante la última dictadura militar argentina.

Ese es el objetivo de Mapa76, una plataforma de software abierto que surgió en Buenos Aires hace casi un año y que se propone utilizar el periodismo de datos para encontrar patrones o destinos comunes en personas desaparecidas que no estaban relacionadas, pero que recorrieron los mismos trágicos caminos.

Las cifras oficiales de desaparecidos durante la última dictadura militar argentina (1976-1983) ascienden a 13.000, pero las organizaciones de derechos humanos afirman que son 30.000.

A 36 años del golpe, los sucesivos procesamientos y causas judiciales generaron una gran cantidad de información, sumada a la aparición de nuevos testimonios.

Durante una reunión del grupo Hacks/Hackers Buenos Aires, surgió la idea de crear una plataforma de extracción automática de datos tomando como fuente los documentos públicos que surgen de los juicios de la dictadura y así lograr una visualización de historias de vida que permita descubrir conexiones hasta el momento ignoradas.

Para su creador, el editor del Suplemento No de Página 12, Mariano Blejman, el proyecto tiene como objetivo trabajar conceptos de data mining, big data y visualización de datos.

“Es periodismo de datos, pero sus fuentes son documentos no estructurados”, explicó Blejman a IJNet.

La plataforma, que aún está siendo construida y se espera que esté funcionando en 2015, consta de tres partes: la extracción automática de datos, la consulta y depuración de datos de contexto y la visualización de los datos seleccionados en mapas y líneas de tiempo.

Además, se busca que sea un modelo exportable para cualquier tipo de proyecto periodístico que utilice grandes cantidades de datos, desde conflictos sociales hasta causas judiciales complejas.

El software que usa, construido en Ruby, explora los documentos usando patrones de búsqueda determinados como nombres propios, organizaciones, lugares y fechas. Cuando encuentra las palabras deseadas, las almacena en una base de datos.

La visualización de los datos proyectada se inspira en los plotlines que sirven para explicar películas o acontecimientos, como esta ilustración que explica las historias de los personajes de El Señor de los Anillos o Jurassic Park, y este gráfico que muestra la campaña de Napoleón en Rusia. De este mismo tema trató el último encuentro convocado por Hacks/Hackers Buenos Aires, del que Blejman es cofundador.

“El periodismo de datos sirve para interpretar grandes volúmenes de datos, y necesita herramientas propias para hacerlo, herramientas que los periodistas no tenemos a disposición o no sabemos manejar”, dijo.

Probablemente tome algo de tiempo para que Mapa76 avance en este nuevo territorio, pero Blejman parece decidido. Tal vez acechado por su propia obsesión periodística, él dio este consejo para aquellos que recién comienzan en periodismo.

“Si tiene una obsesión, no la deje nunca”, dijo.

Data journalism project hopes to trace Argentina’s desaparecidos

April 22, 2012 News No comments
Published at IJNET Center
ijnet.org/blog/data-journalism-project-hopes-trace-argentinas-desaparecidos
spacer by Maite Fernandez
spacer

A data journalism project hopes to show what happened to thousands of people who disappeared during the violent rule of Argentina’s military dictatorship.

The fate of these desaparecidos, or disappeared, will be tracked by Mapa76, an open software platform started in Buenos Aires about a year ago. Currently in the works, the project will analyze data to find patterns or common destinations of missing persons who initially didn’t seem related, but met the same tragic end.

The idea for Mapa 76, whose name is a nod to the year the military swept into power, came about at a Hacks/Hackers Buenos Aires meetup, where members discussed extracting data from public documents from court trials to create a global timeline or map of these life stories–and, they hope, to uncover new connections in the process.

According to the Associated Press, about 13,000 people are officially listed as dead or missing as a result of the “Dirty War”, although human rights organizations put the toll at nearly 30,000. Thirty-six years after the coup, court cases have generated a wealth of information, including fresh testimonies and evidence.

Mariano Blejman, creator of the project and editor-in-chief of Suplemento No, told IJNet that Mapa76 will use data mining, big data and data visualization to reach its goal.

To mine information contained in court documents, Mapa76 will include three modules to extract, query and debug contextual data and data visualization on maps and timelines.

The software it uses, built on Ruby, will sift through documents using defined search patterns such as personal names, organizations, places and dates. When it finds words that match the query, it will funnel that info into a database. Blejman expects the work to result in a timeline such as this chart explaining the plot of multi-episode films like “The Lord of the Rings” or “Jurassic Park” or this one of Napoleon’s campaign in Russia.

Blejman hopes the platform will serve as an exportable model for any journalism project that uses large amounts of data, from social conflicts to complex legal cases.

“Data journalism is used to interpret large volumes of data and requires certain tools to do so, tools that we journalists don’t have available or don’t know how to use,” he said.

Co-founded by Blejman, Hacks/Hackers Buenos Aires recently hosted a hackathon to work on this and other projects.

It may take time for Mapa76 to chart new territory, but Blejman is determined.

“If you have an obsession, never let it go,” he said.

ShowTimeLine! Avanza Mapa76.info

April 18, 2012 News One comment

spacer

La mañana soleada del sábado 14 de abril era ideal para salir a correr. Pero en este caso no se trataba de cuerpos bien entrenados físicamente (aunque también los había) sino más bien intelectualmente preparados para un buen hackatón. Convocados por Hacks/Hackers Buenos Aires cerca de 45 personas se juntaron en Buenos Aires, Argentina, en AreaTres Soho para trabajar sobre la resolución de un problema de visualización de relaciones complejas a través de líneas de tiempos y para familiarizarse con herramientas disponibles.

Se trabajó sobre Mapa76.info, un ambicioso proyecto de software de extracción automática de datos desde documentos de textos para su visualización en líneas de tiempo y en mapas.Y se desarrolló el prototipo de una nueva herramienta de visualización de líneas de tiempos ShowTimeLine, con la pretensión de llegar a modular el plotline de El señor de los anillos.



Cómo se hizo ShowTimeLine!

La propuesta era generar algoritmos y librerías modulares para poder ensamblar uno o varios softwares que permitan visualizar datos en líneas de tiempo complejas y otros tipos de visualizaciones posibles.  La idea original fue de Andrés Snitcofsky quien desarrolló la ingeniería inversa de El Señor de Los Anillos. Finalmente, la información fue estructurada de esta manera El código desarrollado durante el hackatón se encuentra aquí: GitHub  

Fue inicialmente pensada para resolver un problema de visibilización de relaciones complejas en el proyecto de mapa76.info. ¿Cómo podemos encontrar relaciones entre historias de vida que no podemos ver de manera “manual”? “Tiramos” las historias de vida sobre una tabla estructurada y luego observamos los recorridos. Se parte de la línea de tiempo/plotline propuesta por Randall Munroe para graficar la saga de El Señor de los Anillos. Trabajaron César Miquel, Martín Sarsale, Rafa, Nicolás Cisco, Osvaldo Toja, Walter, Felipe Lerena y Martín Szyszlican. Read more

Mapa76.info: software de investigación periodística

April 18, 2012 Uncategorized One comment

spacer

Objetivo: Esta es una explicación del proyecto Mapa76.info surgido de los encuentros de Hacks/Hackers Buenos Aires. Este proyecto pretende ser un software de extracción automática de datos desde documentos de textos, que nació aplicado a una problemática particular de los juicios por la dictadura ocurrida entre 1976 y 1983, pero puede ser extendible a otro tipo de problemáticas donde sea necesario trabajar grandes volúmenes de contenido. Por esto, imaginamos Mapa76 como herramienta de investigación periodística y histórica de acceso libre (y también privado) a través de la web, con el propósito también de darle usabilidad a las potencialidades de las técnicas de scrapping y visualización. Mapa76.info nació como un proyecto colaborativo y de software libre, pero es necesario encontrar una sistematización al trabajo voluntario de unas cuarenta personas que participaron en el proyecto.spacer

Contexto
Inauguramos el capítulo de Hacks/Hackers Buenos Aires en abril de 2011, e hicimos dos encuentros para dar a conocer la idea de trabajar entre periodistas y programadores de software. A estos encuentros fueron entre 120 y 150 personas en cada uno. El tercer encuentro fue un hackatón de 30 horas, en donde ocho personas trabajamos la visualización interactiva en html5 y popcorn de una conferencia en un congreso de periodismo digital en la ciudad de Rosario, a 300 kilómetros de Buenos Aires. En el transcurso de esos encuentros, surgió la idea de generar desde Hacks/Hackers Buenos Aires un “proyecto de demostración” que aplique técnicas de scrapping para interpretar grandes volúmenes de datos y que permita visualizarlos en forma significativa. Entonces surgió el proyecto que dimos en llamar Mapa76, que pretende ir desde la extracción automática de datos hacia la visualización en línea de tiempo y en mapas de historias de vida.

¿Por qué Mapa76?
El 24 de marzo de 1976 se produjo un golpe de Estado en Argentina que duró hasta 1983. En ese período hubo 30 mil desaparecidos, miles de muertos, y 500 niños apropiados por los militares nacidos en cautiverio. Más de 30 años después, en Argentina el número de condenados por delitos de lesa humanidad cometidos durante la última dictadura, ascendía a 262 personas (a setiembre de 2011). Actualmente existen 14 juicios en curso y 7 con fecha definida para su inicio repartidos por todo el país. En tanto, se sabe públicamente que hay 802 personas procesadas en las distintas causas judiciales que se encuentran abiertas. De ese total, 412 tienen una o más causas elevadas a juicio, mientras que otras 102 cuentan con el pedido de elevamiento a juicio por parte de la fiscalía.

Dichos procesos judiciales generan grandes volúmenes de información que hacen que la labor de los investigadores —periodistas, organismos de derechos humanos, jueces, fiscales, etc.— se complejice al momento de recabar y analizar datos que pueden ayudar al esclarecimiento de hechos. Se produce mucha más información de manera dispersa de la que los investigadores pueden analizar. Y todavía se encuentran testimonios de manera azarosa.

En la gran mayoría de los casos, tanto desde la perspectiva periodística como desde el Poder Judicial, el relevamiento de datos se hace en forma manual sobre expedientes judiciales ya generados (algunos digitalizados, otros no). Estas prácticas suponen sesgar el universo de análisis, pasar por alto ciertos datos y en definitiva inhiben significativamente la exploración sobre los hechos, y la construcción de conjeturas y/o conclusiones a nivel global por parte de los investigadores periodísticos pero también imposibilita el acceso del resto de ciudadanos a esta información.

Conceptualización y objetivos
El objetivo de Mapa76.info es realizar una plataforma de extracción automática de datos sobre los juicios de la última dictadura militar en Argentina. El objetivo es lograr una visualización de historias de vida del período 1976-1983 basada en testimonios, pericias, informes, alegatos y sentencias judiciales sobre la dictadura. Esta plataforma pretende brindar herramientas para analizar una base documental (un grupo de documentos) y facilitar la identificación de relaciones de difícil hallazgo en forma analógica (manual). Los datos extraídos (nombres, lugares y fechas) son recopilados, almacenados y pueden ser depurados por el investigador, además de visualizarlos en forma geolocalizada, en líneas de tiempo y en mapas de relaciones entre personas. Pensamos que el modelo que iniciamos para Mapa76.info se puede replicar como un software de investigación periodística.

¿Para qué podría servir mapa76?
Tanto periodistas como investigadores, fiscales podrán utilizar Mapa76 para establecer relaciones entre detenidos desaparecidos en correspondencia a lugares, fechas y condiciones de detención.  Permitirá seguir la historia de vida de una persona determinada y conocer cómo fue su derrotero durante su cautiverio y posterior desaparición o liberación. Para el caso de que no se cuente con información acerca de una persona, el periodista, podrá acceder a la plataforma de Mapa76 y “peinar” una vasta cantidad de documentos en busca de información calificada. Esto podría permitir la identificación de nuevos testigos, indagar sobre criterios de prueba, reafirmar que hubo un plan sistemático para la apropiación de menores por parte de las fuerzas armadas, etc. Read more

 
gipoco.com is neither affiliated with the authors of this page nor responsible for its contents. This is a safe-cache copy of the original web site.