En el caso particular de la Administración pública, estos datos provienen de usuarios privados, de sensores automáticos y de datos recopilados rutinariamente por el sector público mismo. Esto se puede combinar con las bases de datos tradicionales del gobierno (Mergel et al., 2016). Los analistas de datos pueden entonces sacar conclusiones e identificar tendencias, y luego, en teoría23, los tomadores de decisión en la Administración pública pueden usar esa información e incorporarla en sus decisiones. Puesto que la Administración pública debe garantizar la prestación de servicios y entrega de productos públicos, la ciencia de datos puede ayudar a crear nuevos bienes y servicios, mejorar la prestación de los existentes y también identificar beneficiarios de manera más eficiente y precisa.
La ciencia de datos se puede usar para detectar irregularidades, por ejemplo, en las áreas de evasión tributaria, enriquecimiento ilícito y fraude a la seguridad social. En los Estados Unidos se emplea también la ciencia de datos para temas de riesgo financiero y control de medicamentos (Mergel et al., 2016). Otras ventajas se aprecian en materia de transporte público, en donde el análisis de tendencias, usuarios, tarifas y otros datos ha permitido hacer más eficientes los tiempos de desplazamiento en las ciudades y evitar congestión, tal como se usó de manera exitosa en Singapur (Maciejewski, 2017). Asimismo, el análisis de redes sociales permite a las administraciones analizar las percepciones de los ciudadanos frente a las políticas públicas y al gobierno en general y medir la aceptación de medidas antes de tomarlas (Maciejewski, 2017). Al interior de la Administración pública, los datos pueden también servir para gestionar mejor los recursos, medir el desempeño de los servidores públicos y optimizar las herramientas de control interno y control de la corrupción24, entre otras ganancias en eficiencia y eficacia.
Tratándose del caso colombiano, se observan algunos desarrollos en ciencia de datos, generación y uso de macrodatos y en datos abiertos de la Administración pública. Con el fin de aumentar el aprovechamiento de datos en el país, se adoptó el Conpes 3920 de 2018, sobre política de explotación de este recurso en el que se plantean tres estrategias: desarrollo de capacidades, cultura de datos y marco jurídico e institucional. Se busca de esta forma desarrollar condiciones para que los datos sean gestionados como activos generadores de valor social y económico, haciendo una diferenciación entre datos privados, personales y públicos, para efectos de regular cada uno de manera distinta. Pese al aporte incremental que este decreto representa para el desarrollo de la política de transformación digital de Colombia, esta estrategia se enfoca en la eficiencia gubernamental, dejando por fuera a otros sectores y a la ciudadanía. A esto se suma que no se trató con profundidad en la estrategia “la transformación digital de manera que Colombia aprovechara las oportunidades y enfrentara los retos relacionados con la 4RI” (Conpes 3975 de 2019).
En cuanto a las aplicaciones prácticas de la ciencia de datos y datos abiertos por parte de la Administración pública colombiana, encontramos casos como el de la Policía Nacional, entidad que desde 2014 cruza información de cámaras, llamadas a la línea 123 y de agentes en las calles. Se trata de un proyecto ambicioso de ciencia de datos que busca prevenir el crimen en el territorio nacional. A su vez, el Departamento Nacional de Estadística (DANE) emplea herramientas de macrodatos y datos abiertos para el monitoreo de los Objetivos de Desarrollo Sostenible y en el Censo Nacional de Población y Vivienda. Otros ejemplos dados por la literatura incluyen al Ministerio de Hacienda y el Departamento Nacional de Planeación (DNP), organismos de la Administración que han hecho análisis usando datos de Google para monitorear actividades económicas (Becerra et al., 2018). De igual modo, se identifican estrategias de ciencia de datos en órganos autónomos como el Banco de la República, y en entidades del sector hacienda como el Departamento de Impuestos y Aduanas Nacionales (DIAN) y la Unidad administrativa especial de Información y Análisis Financiero (UIAF). En la Administración tributaria, la ciencia de datos es usada para cruzar diferentes fuentes de información y evitar la evasión de impuestos.
En materia de apertura de datos y su publicación en línea, se han dado los primeros pasos con la creación del programa datos abiertos (datos.gov.co), creado por la Presidencia de la República durante la pasada administración. Conforme a este programa, las entidades públicas pueden voluntariamente subir conjuntos de datos abiertos que consideren de interés para la ciudadanía. De esta manera, se han puesto a disposición del público más de 10.000 conjuntos de datos de diversas entidades públicas y aspectos de actividad del sector público25. Esto permite análisis como el que López et al. (2018) han realizado sobre la hipertensión en Cartagena, a partir de información de sensores, historias clínicas y otras fuentes y haciendo analítica de datos para prevenir o identificar a tiempo nuevos casos; o el trabajo sobre seguridad vial hecho por Hidalgo et al. (2018), el cual hace recomendaciones muy específicas para reducir los accidentes a bajo costo, enfocando esfuerzos en los puntos álgidos según fuentes combinadas de datos sobre tránsito.
Ahora bien, la Administración puede también ser el usuario de datos generados por otros, para la formulación y evaluación de políticas públicas y de políticas administrativas. Esta tendencia se ha observado en otros países en el marco de la creación de laboratorios de innovación pública centrados en ciencia de datos. Utilizando datos abiertos disponibles de diversas fuentes, estos laboratorios creados en el sector público, a veces en colaboración con actores académicos, se dedican a analizar conjuntos masivos de datos para tomar decisiones y crear nuevos y mejores programas orientados a resolver problemas públicos26. Colombia también ha participado en esta tendencia, con la creación de iniciativas como ViveLab27 y BogoLab28. Sin embargo, estos laboratorios no tienen un uso intensivo de ciencia de datos, dadas las deficiencias que tiene el país en esta materia y los problemas de calidad de los datos y acceso a datos abiertos29. Los macrodatos y la ciencia de datos han mostrado ya su utilidad para las administraciones públicas con resultados mixtos, algunos claramente útiles para agregar valor público y otros todavía en etapa de experimentación y sin haber sido evaluados. Sin embargo, estas tecnologías también han introducido retos grandes para las estructuras burocráticas tradicionales y las culturas administrativas existentes, en particular en los países latinos (Ramió, 2019).
1.2. RETOS DE LA CIENCIA DE DATOS Y LOS DATOS ABIERTOS PARA LAS ADMINISTRACIONES PÚBLICA
Los retos del uso masivo de datos por la Administración pública son éticos, sociales, administrativos, económicos y tecnológicos, derivados del uso del conocimiento por los organismos y entidades que la integran, los procedimientos de toma de decisiones y de formulación de políticas públicas, las estructuras de incentivos, las capacidades y los procedimientos administrativos (van der Voort et al., 2019). Asimismo, los seres humanos son vulnerables a sesgos cognitivos (Arinder, 2016), y las autoridades administrativas tienen desafíos en materia de coordinación al interior de su organización y con otros actores, y en razón de tiempos y recursos escasos para el análisis de toda la información disponible.
La gobernanza digital debe responder a conflictos entre imperativos y valores que se presentan en la Administración debido a las nuevas tecnologías computacionales, ayudar a reducir la incertidumbre que su uso genera, y ambientar las discusiones políticas inevitables que se van a presentar frente a las mismas (Andrews, 2018). En cada una de las dimensiones en que estos retos se presentan, habría que hacer cambios significativos, como implementar la toma de decisiones basada en evidencia, proceso que empezó a discutirse en los años ochenta con la Nueva Gestión Pública (NPM, por sus siglas en inglés)30.
Se evidencia, además, un salto desde el análisis de datos masivos a la creación de valor público, en el cual están incluidas las etapas de formulación de