Barómetro de Datos Globales ¿Cuál es el estado actual de los datos abiertos en el mundo?

Global Data Barometer What is the current state of open data worldwide?

¿Hasta qué punto los países están adoptando políticas y sistemas de datos para el bien público?

Foto de Stephen Picilaidis en Unsplash

Recientemente leí un libro sobre la adopción de políticas de datos abiertos en ciudades de todo el mundo. Se llama Más allá de la transparencia (disponible públicamente en este enlace) y consiste en estudios de casos que muestran los éxitos y obstáculos de las políticas de datos abiertos a principios de la década de 2010. Como sugiere el título, proporcionar conjuntos de datos accesibles y gratuitos es un paso hacia un gobierno más transparente, pero no solo eso. El libro habla sobre cómo estos datos impulsaron la innovación, mejoraron la eficiencia gubernamental y fomentaron nuevos hábitos cívicos, como una mayor participación ciudadana. Los profesionales de datos, incluidos ingenieros y científicos de datos, también desarrollaron sus propias soluciones en torno a estos nuevos conjuntos de datos, creando mejores modelos y aplicaciones. Para algunos ejemplos de estos nuevos ecosistemas tecnológicos cívicos, echa un vistazo al capítulo “Construyendo un Chicago más inteligente” y al trabajo de análisis que surgió de sitios web como Data SF o Chicago Data Portal. Otro capítulo favorito personal: “La ciudad impulsada por datos”, sobre cómo la recolección de llamadas al 311 permite a Nueva York modelar los servicios de emergencia y la asignación de recursos.

Desde la década de 2010, cientos de países han promulgado sus propias leyes de datos abiertos. El Barómetro Global de Datos (licencia: Creative Commons Attribution 4.0) mide el estado de los datos abiertos en 109 de ellos, respondiendo a la pregunta “¿Hasta qué punto los países gestionan los datos para el bien público?”. El estudio utiliza una combinación de indicadores cuantitativos y descripciones cualitativas para proporcionar una imagen clara de cómo le está yendo al mundo en términos de datos abiertos. Este es un trabajo increíblemente exhaustivo, así que creo que es interesante dedicar un tiempo a explorar parte de él con esta historia.

Nota rápida: para la historia, estoy utilizando cuadernos Observable (basados en JS) para hacer las visualizaciones y Jupyter para el manejo de datos; los enlaces a ambos se encuentran al final.

¡Empecemos!

Resumen del índice: ¿cómo se clasifican los países?

El índice general de los países varía de 0 (inexistente) a 100 (exhibiendo mejores prácticas).

Índice General de Datos Abiertos (imagen del autor)

El gráfico anterior muestra bastante dispersión. El país con la puntuación más alta (70) es Estados Unidos y el país con la puntuación más baja (10) es Turkmenistán, mientras que la puntuación media es de 38.51. Este índice se genera examinando las prácticas de datos abiertos de cada país en 4 frentes o “pilares”: gobernanza, capacidades, disponibilidad y uso e impacto. Para cada uno de estos pilares, los países proporcionan información sobre la existencia de un elemento en particular (por ejemplo, un marco de protección de datos), elementos (características relacionadas con la calidad y características de datos abiertos) y alcance (las limitaciones y aplicabilidad de un marco específico en todo un país). El estudio también realiza un seguimiento de indicadores secundarios para cada pilar, cada uno de los cuales se calificó sobre 100. Por lo tanto, una puntuación de índice general de 100 representaría un tipo de “ideal normativo” en todos estos indicadores primarios y secundarios.

Los países con puntuaciones similares aún tienen una gran variación en los indicadores

Enfoquémonos en los países cuyo índice está alrededor del promedio (35 a 45). Hay 20 de ellos, incluyendo Albania y Kosovo, así como países de todo el mundo: Jamaica, Kazajistán, Paraguay, Filipinas, Perú, Tailandia y Sudáfrica, entre otros.

A pesar de la similitud del índice general, al examinar las puntuaciones medias en los módulos, su rendimiento no es tan consistente. El Barómetro compila puntuaciones temáticas o de módulos además de los pilares, y los 7 módulos analizan las prácticas de datos abiertos en las siguientes áreas: Salud y COVID-19, Tierra, Finanzas Públicas, Contratación, Acción Climática, Integridad Política e Información de Empresas. Aquí tienes una vista de los módulos Acción Climática, Integridad Política y Contratación para estos 20 países:

Acción Climática (imagen del autor)
Integridad Política (imagen del autor)
Adquisiciones (imagen del autor)

Muchos países tienen inconsistencias:

  • Jamaica tiene la mayor Acción Climática pero solo obtiene una puntuación baja en Adquisiciones. Un análisis más profundo de los indicadores climáticos revela que Jamaica proporciona datos ambientales a través de su Instituto de Estadísticas, que incluyen métricas sobre “lluvia, sol, incidentes de contaminación, gases de efecto invernadero, área de bosque protegida, nivel del mar”, así como tener “ninguna evidencia de brechas de datos”. Sin embargo, en cuanto a Adquisiciones, no hay información pública en la etapa de planificación y los datos son de baja calidad: no contienen nombres/identificadores de las empresas adjudicatarias de contratos ni información sobre “gastos frente al contrato”.
  • En Albania, hay información detallada sobre adquisiciones disponible en línea (enlace aquí), sin embargo, no se cubren las implementaciones de contratos y los datos solo son parcialmente legibles para las máquinas. También hay datos disponibles sobre financiamiento político, pero no contienen datos de ingresos de los partidos y candidatos ni información de seguimiento histórico.

Avanzar en todos estos módulos conduce a un gobierno más transparente y eficiente. Por ejemplo, tener mejores datos de adquisiciones permite a los ciudadanos analizar dónde y cómo se gasta el dinero en todas las etapas de un proyecto o exigir asignaciones más equitativas. De manera similar, tener datos transparentes sobre el lobby y declaraciones de activos permite una mayor rendición de cuentas en cuanto a la integridad política. La información climática permite que el público se mantenga informado sobre aspectos como la biodiversidad, las emisiones o las vulnerabilidades.

Existen marcos de gobernanza pero están en gran medida fragmentados

Gobernanza es uno de los pilares principales del conjunto de datos. Las preguntas que responde involucran evaluar el estado de las políticas y los marcos que guían cómo se protege y administra los datos. La investigación sobre gobernanza realiza un seguimiento de un par de indicadores: “Política de datos abiertos” es uno de ellos, y “protección de datos”, “marcos de intercambio de datos”, “gestión de datos” son otros de ellos. Así es como los países obtienen puntuaciones en estos indicadores de gobernanza:

Indicadores de Gobernanza en 109 países (imagen del autor)

Muchos países están teniendo un desempeño moderadamente bueno en métricas como Protección de Datos, Política de Datos Abiertos o Gestión de Datos. Alrededor del 92% de las políticas analizadas tienen una definición común de datos abiertos, el 72% de los países tienen algún tipo de marco de gestión de datos en su lugar, y el 90% de ellos ofrecen regulaciones de protección de datos (informe aquí). Muchos de los países ofrecen regulaciones parciales o completas sobre temas de consentimiento de datos, derechos de reparación y acceso o corrección.

Aunque existen formas de marcos de gobernanza de datos, Global Open Data muestra que los países aún tienen limitaciones graves. Por ejemplo, solo el 24% de los marcos abordan cuestiones de información de ubicación y solo el 31% abordan la toma de decisiones algorítmicas (también en el informe). La mayoría de estos países se encuentran en Europa y América del Norte: estas dos regiones comprenden 17 de los 23 países que respondieron “Sí” a “Los marcos cubren explícitamente la protección de datos relacionados con la ubicación”, y 20 de los 31 cuyo “marco aborda la toma de decisiones algorítmicas”.

Los últimos dos indicadores, Accesibilidad y Cobertura de idioma, evalúan las regulaciones para garantizar que los datos sean accesibles para las personas con discapacidades y estén disponibles en el idioma oficial de cada país. Este último es particularmente importante para los países con muchos idiomas, pero aún así también está fragmentado: 13 de los 109 países obtienen una puntuación de 100 en esta categoría (poseen un marco con fuerza de ley).

Manejar la respuesta al COVID-19 fue un desafío pero también una oportunidad para la gobernanza de datos

La pandemia del COVID-19 puso a prueba muchos de estos sistemas de datos, especialmente los a nivel local. El estudio mide las capacidades de los datos no solo en cuanto a la disponibilidad de datos de vacunación, sino también en datos de atención médica en tiempo real (por ejemplo, camas de cuidados intensivos) y estadísticas vitales. Las estadísticas vitales incluyen información de nacimientos y defunciones, períodos históricos y qué tan disponibles están estos datos a nivel local en un país. Aquí hay un mapa de calor que muestra cómo están los países:

Puntajes del módulo de Salud y COVID-19 (imagen del autor)

Los datos de vacunación estaban ampliamente disponibles en la mayoría de los países del conjunto de datos, sin embargo, no sin sus problemas. Solo alrededor del 50% de los conjuntos de datos disponibles se desglosaron por edad y aproximadamente el 33% se desagregaron por sexo (estadísticas del informe). Además, los datos de atención médica en tiempo real solo estaban disponibles en aproximadamente el 50% de los países e incluso menos publicaron información sobre la cantidad de camas disponibles. Para algunos de estos países, este tipo de datos solo estuvo disponible por primera vez durante la pandemia, lo que permite a los países comenzar a construir sobre ellos para una mejor informe de atención médica en el futuro.

¿Y qué tan fácil fue para los usuarios explorar los datos? Un análisis más profundo revela que 61 de los 109 países no ofrecieron herramientas abiertas oficiales que permitieran a los ciudadanos acceder a datos de estadísticas vitales. De manera similar, 63 de los 109 no proporcionaron datos oficiales y accesibles sobre la vacunación contra el COVID-19. Además, 57 países tampoco ofrecieron datos legibles por máquina (como CSV), lo cual es importante para una distribución y reproducción sencillas.

¿Qué sigue para el futuro de los datos abiertos? (y los recursos)

Una de las principales conclusiones del informe fue la falta relativamente escasa de entornos de datos abiertos a nivel global (recordemos el índice promedio general: 38/100). Como ya vimos en esta historia, tener leyes completamente formadas en torno a los datos abiertos es simplemente esencial. Además de la investigación realizada por el Global Data Barometer, hay otros repositorios que rastrean nueva legislación sobre temas de datos abiertos en todo el mundo. El Estado de los Datos Abiertos por The Gov Lab es uno de ellos. ¡Así que échale un vistazo para ver las leyes por sector o tipo de colaboración!

En términos generales, sin embargo, el informe del Global Data Barometer iluminó los desafíos prácticos en la adopción de estas leyes, incluidas las brechas de datos o datos inaccesibles o no disponibles. Un ejemplo impactante que observamos fue la publicación y gestión de datos de salud, especialmente en situaciones de emergencia como el COVID-19, donde contar con información oportuna es crucial. Este ejemplo, sin embargo, también mostró cómo los nuevos desafíos también pueden impulsar el uso de datos para promover la transparencia y permitir a los ciudadanos mantenerse informados, ¡lo cual es muy prometedor! En general, el informe señala áreas muy específicas en las que cada país debe centrarse, ofreciendo estrategias específicas para la recolección de datos mejorada al tiempo que proporciona una visión panorámica de los desafíos actuales con los datos abiertos.

Aquí están los cuadernos (Jupyter y Observable),

¡Gracias por leer!

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Cerrando la brecha de inclusión en la informática

Los estudiantes del Instituto Politécnico y Universidad Estatal de Virginia buscan abordar la falta de diversidad en ...

Ciencia de Datos

La guía de campo de datos sintéticos

Si quieres trabajar con datos, ¿cuáles son tus opciones? Aquí tienes una respuesta lo más general posible podrías obt...

Inteligencia Artificial

Estudiantes y profesores critican los sensores en los edificios

Los funcionarios de la Universidad Queen Mary de Londres, en el Reino Unido, anunciaron a principios de este año que ...

Inteligencia Artificial

Segmentación de Imágenes Una Guía Detallada

La segmentación de imágenes se refiere a la capacidad de las computadoras (o más precisamente, los modelos almacenado...

Inteligencia Artificial

Rosalyn revela StableSight AI para combatir el creciente fraude en exámenes en línea

En medio de la creciente complejidad de la deshonestidad académica en la educación en línea, Rosalyn ha presentado St...