Los datos abiertos y los datos abiertos son datos digitales, incluido el acceso y el uso que se dejan libres a los usuarios, que pueden ser de fuentes privadas pero en su mayoría públicas, en particular producidas por una comunidad o institución pública. Se distribuyen de forma estructurada según un método y una licencia abierta que garantiza su libre acceso y reutilización por todos, sin restricciones técnicas, legales o económicas.
L'accès aux données vise d'une part à permettre aux citoyens de mieux contrôler l'administration, d'autre part d'exploiter ces données, ce qui implique que ce droit d'accès s'accompagne d'un droit à la réutilisation datos.
Estos derechos de acceso y reutilización forman parte del pensamiento que considera la información pública como un bien común (tal como lo define Elinor Ostrom ) cuya difusión es de interés público y general .
La apertura de los datos es, pues, una filosofía de acceso a la información, un movimiento de defensa de las libertades y una política pública .
Algunos países fueron pioneros, incluidos los Estados Unidos , el Reino Unido , Australia y Canadá y luego Francia . El movimiento se ha extendido notablemente bajo el impulso de ONG como la Open Knowledge Foundation (OKFN) y la Open Government Partnership (PGO).
Los datos son abiertos si todo el mundo puede acceder a ellos, utilizarlos, modificarlos y redistribuirlos libremente, sea cual sea su finalidad.
Los Datos Abiertos es un movimiento de actores que hacen campaña a favor de los datos abiertos. También es una política pública que consiste en abrir los datos públicos para promover la innovación abierta en el sector público, rendir cuentas a la ciudadanía y mejorar la transparencia de la acción pública, y finalmente poner los recursos a disposición del sector privado. El desarrollo de nuevos servicios. .
El artículo 15 de la Declaración de los Derechos del Hombre y del Ciudadano de 1789 menciona que la sociedad tiene derecho a exigir cuentas a cualquier funcionario público de su administración. Este artículo constituye la base legal del derecho de acceso a la información pública.
La Ley de Libertad de Información , implementada en 1967, crea un derecho a la información para los ciudadanos. Fue modificado en particular en 2007 por la Ley de Gobierno OPEN .
FranciaOpen Data es una extensión del enfoque adoptado por la ley del 17 de julio de 1978 relativa al acceso a los documentos administrativos, incluso si esto no requiere la publicación de datos digitales, ni la publicación proactiva de información. Simplemente reconoce el derecho a obtener la comunicación de los documentos en poder de una administración, cualquiera que sea su forma o medio.
En la Unión Europea, la Directiva 2003/98 / EC (" Información del Sector Público " (PSI )) del Consejo de la Unión Europea del 17 de noviembre de 2003 sobre la reutilización de datos públicos y la directiva INSPIRE de 2008 fomentan los datos abiertos .
La Directiva 2019/1024 “ Directiva de Datos Abiertos” de 2019 sustituye a la de 2003.
Estados UnidosCon la elección de Barack Obama , la apertura de datos públicos se convierte en un eje central del gobierno estadounidense con la Iniciativa de Gobierno Abierto así como también que menciona los criterios para la publicación de datos abiertos.
En su discurso de inauguración, Barack Obama anunció su intención de "crear un nivel de apertura sin precedentes en el gobierno " , con el objetivo de "fortalecer la democracia y promover su eficiencia y eficacia dentro del gobierno" .
En marzo de 2009, el gobierno de los Estados Unidos lanza el portal federal de datos abiertos data.gov . En diciembre del mismo año, la directiva de gobierno abierto establece los tres pilares de la cooperación entre el Estado y la ciudadanía, que son: transparencia gubernamental, participación y colaboración. Vivek Kundra , principal sistema de información federal ( Chief Information Officer ) en la administración Obama, observa que "la liberación de estos datos ha llevado a un ahorro de aplicaciones [...] ha habido una explosión de estas comunidades de desarrolladores" .
Reino UnidoEn el Reino Unido , el artículo publicado por The Guardian en 2006 "Devuélvanos las joyas de la corona" pide una liberalización de los datos públicos y sirve como "el momento iniciático del movimiento de datos abiertos " .
Gordon Brown lanzó el portal de datos abiertos Data.gov.uk en enero de 2010 bajo el liderazgo de Tim Berners-Lee .
FranciaEn Francia , determinadas autoridades locales como Rennes o París han iniciado un enfoque de datos abiertos en 2010. A nivel nacional, en febrero de 2011 el gobierno creó la misión Etalab , un servicio del Primer Ministro responsable de coordinar esta política pública de datos abiertos. y lanzó un portal específico, data.gouv.fr , en diciembre del mismo año.
En la cumbre del G8 en 2013 , los Jefes de Estado del G8 firmaron una " Carta del G8 para la apertura de datos públicos ".
En Francia, la ley para una República Digital de octubre de 2016 en Francia, que establece el principio de datos públicos comunicables abiertos por defecto y crea la noción de servicio de datos públicos , otorga a los datos abiertos una base legislativa.
Son los datos abiertos de Public Health France sobre la pandemia Covid-19 los que han permitido a una comunidad de analistas publicar gráficos y mapas tras la pandemia a nivel nacional, entre ellos Guillaume Rozier .
La apertura de datos de finanzas públicas ha estado en el corazón del movimiento de datos abiertos desde sus inicios. En 2007, en el Reino Unido, Jonathan Gray diseñó el proyecto " ¿A dónde va mi dinero? ", Una visualización de los datos de gasto del gobierno del Reino Unido que permite a los ciudadanos acceder a ellos fácilmente.
Los datos científicos abiertos y el acceso abierto son dos temas relacionados pero distintos. El acceso abierto se refiere a las publicaciones científicas, a menudo revisadas por pares. La apertura de datos científicos puede referirse a los datos en los que se basan estos artículos, o cualquier base de datos de carácter científico (por ejemplo, registros meteorológicos u otros), con el fin de permitir la reproducción de los experimentos realizados, con el fin de confirmar o confirmar. confirmarlos, invalidarlos.
También pueden ser datos de institutos públicos de investigación científica (o privados que se benefician de la financiación pública o que deseen voluntariamente abrir y compartir sus datos), a menudo al mismo tiempo que se difunden libremente los resultados de la investigación; se habla luego en este contexto de “libre acceso” o “libre difusión” , cuya primera definición fue dada por la Declaración Internacional sobre Acceso Abierto de Budapest que se celebró el14 de febrero de 2002, conocido por el acrónimo BOAI (de la English Budapest Open Access Initiative ) .
A partir de ahí, han surgido muchas otras iniciativas en otras partes del mundo como, por ejemplo, la Declaración de Berlín de 2003 sobre el libre acceso al conocimiento en ciencias y humanidades ; seguido en marzo de 2005 de Southampton , una nueva Declaración llama Berlin III para reforzar las medidas adoptadas como parte de Berlín I .
El proyecto de secuenciación del genoma humano fue posible gracias a un Consorcio de Datos Abiertos creado a propuesta de Jim Kent (en) en 2003, cuyos beneficiarios serán, entre otros, países en desarrollo donde las universidades y los centros de investigación n no siempre tienen acceso a revistas científicas.
En 2010, la Unión Europea lanzó el proyecto legislativo sobre la apertura de datos de transporte a través de la directiva de Sistemas de Transporte Inteligentes (ITS) y aclaró su aplicación en 2017 con el Reglamento Delegado (UE) 2017/1926.
En Francia, la apertura de datos relacionados con el transporte se rige por varias leyes. En primer lugar, la Ley Macron de 2015 obliga a las autoridades organizadoras del transporte a proporcionar datos regulares sobre el transporte de pasajeros. Entonces la Ley Lemaire de 2016, a través de la obligación de abrir datos de interés general, como los producidos en el marco de las Delegaciones de Servicio Público (DSP) , amplía el campo de datos a abrir. Esto se refiere en particular a los datos de transporte porque el DSP es el modo de gestión más utilizado para el transporte urbano de pasajeros en Francia.
La Ley de Orientación a la Movilidad (LOM) de 2019 especifica estas obligaciones de apertura de datos y las amplía. Especifica que es la autoridad organizadora de la movilidad (AOM) la responsable de coordinar el suministro de datos. El propósito de abrir estos datos es facilitar el desarrollo de aplicaciones y servicios MaaS (Mobility as a service) que reúnen varias soluciones de viaje.
Estos datos son datos de tráfico y viajes estáticos y dinámicos, así como datos históricos de tráfico. En efecto, la LOM explica, a través del artículo L1115-1 del Código de Transporte , que los datos a abrir son los especificados en el anexo del Reglamento Delegado (UE) 2017/1926, a continuación algunos ejemplos:
La LOM va más allá de la normativa europea, que solo obliga a la publicación de datos estáticos, y extiende la apertura de los datos a datos dinámicos, a puntos de recarga para vehículos eléctricos o híbridos y a servicios de carpooling que deben proporcionar un punto de acceso a su oferta de servicios. .
La gobernanza de los datos abiertos también está especificada por el LOM . El artículo L1115-2 menciona que la AOM o los operadores de transporte deben garantizar "suministrar datos a la altura de los estándares y actualizaciones a través del Punto de Acceso Nacional (NAP)". En Francia, el punto de acceso nacional es el sitio transport.data.gouv , que en abril de 2021 recopiló 441 conjuntos de datos.
La licencia de publicación no la impone la LOM pero es el marco de la Ley Lemaire de 2016 la que aplica y permite abrir los datos bajo la licencia Etalab o bajo la licencia ODbL (Open Database License) .
Finalmente, en cuanto al formato de los datos , la normativa europea impone estándares que facilitan la interoperabilidad : elección de estándares NeTEx o TAP PSI y SIRI o especificaciones para tiempo real . Sin embargo, gran parte de los datos publicados por operadores privados y autoridades públicas está en formato GTFS . En última instancia, el NAP proporcionará un conversor de datos gfts al formato NETEX para permitir que AOM cumpla con la regulación.
El ecosistema de datos abiertos incluye actores de la sociedad civil como el Open Data Institute o la Open Knowledge Foundation u OpenStreetMap , administraciones públicas, empresas privadas, actores del mundo de la investigación, actores del mundo del periodismo, financiadores y organismos internacionales.
En 2010, la Sunlight Foundation estableció una lista de diez criterios que caracterizan los datos abiertos. Para que se diga que un dato está "abierto", debe ser:
En 2010, Tim Berners-Lee propuso una escala de calidad de datos abiertos (de 1 a 5 estrellas).
★ | Datos sin filtrar (posiblemente degradados), por ejemplo, cargados con cualquier formato |
★ ★ | Datos disponibles de forma estructurada (por ejemplo, datos tabulares en CSV , XML , Excel , RDF ) |
★ ★ ★ | Datos de libre explotación - legalmente (ver licencias), - técnicamente (en formatos no propietarios, no en Excel en particular) |
★ ★ ★ ★ | Datos identificados por URL (con fecha de actualización) para que podamos "señalar" un enlace a ellos (y posiblemente encontrarlos actualizados) |
★ ★ ★ ★ ★ | Datos vinculados a otros datos, para contextualizarlos y enriquecerlos |
Esta escala se refiere a datos digitales básicos, pero sus criterios se pueden adaptar a datos agregados o información pública más compleja (fotos, videos, informes, estudios, etc.) que también habrá que poner en línea, idealmente con metadatos de calidad . Y también puede incluir hipertexto en el caso de informes y estudios, o incluso ciertos videos)
El objetivo principal era poner en línea los datos producidos por el Estado u otros sin esperar la implementación de una comunidad de intereses privados ( cf. el debate que se presenta a continuación sobre la paradoja de la gallina o la gallina. El huevo ) que podría ralentizar la disponibilidad de datos. en la red y, por lo tanto, ralentizar indirectamente la aparición de avances tecnológicos dentro del movimiento de la Web Semántica del que Tim Berners-Lee es uno de los promotores.
En varios campos de investigación, a pesar de los llamados a las buenas prácticas en la transparencia y el intercambio de datos, los autores no comunican los datos en bruto, ni siquiera a los revisores.
Muchos fraudes científicos en la investigación no pudieron ser detectados temprano por los comités de revisión porque los autores se negaron a compartir sus datos (incluso con sus coautores a veces), especialmente en el campo de la psicología donde el 50% de los experimentos muestran resultados no reproducibles, lo que plantea serios problemas de confianza en los resultados y ha dado lugar a una iniciativa denominada Peer Reviewers 'Openness Initiative , según la cual cuando no existen razones éticas para no hacerlo, la transparencia y la apertura de los datos deben ser valores fundamentales de la ciencia, en particular para permitir el trabajo de los correctores de pruebas.
Existen varios medios modernos para compartir datos científicos, incluida la publicación previa y posterior. Además, los autores que comparten sus datos ven aumentan sus posibilidades de ser citados.
En Gran Bretaña , el cruce de datos abiertos ha permitido una reducción del 30% en la factura del consumo energético de los edificios públicos en tan solo dos meses.
Idealmente, los datos abiertos permiten una competencia leal entre todas las empresas. Sin embargo, estudios sociológicos en India y Canadá han demostrado que el acceso y uso de datos abiertos están condicionados por criterios materiales (electricidad, posesión de equipos informáticos) y sociales (educación).
Además, según determinados estudios, la divulgación de estos datos públicos dividiría por cinco el capital necesario para ejercer una actividad profesional en el sector de la telefonía móvil . El informe MEPSIR de 2006, financiado por la Comisión Europea, estima que el mercado europeo vinculado a la reutilización de la información pública representa 27.000 millones de euros.
Además, el impacto económico directo e indirecto se ha estimado en 140 000 millones de euros al año para Europa.
A partir de 2016, varios gobiernos tienen planes para desarrollar inteligencia artificial . Estos gobiernos subrayaron el papel fundamental de los datos abiertos para el desarrollo de un sector económico de inteligencia artificial.
Hay opiniones divergentes sobre la implementación de datos abiertos que se reducen a la “ paradoja del huevo y la gallina ”:
La apertura de los datos requiere la colocación de una licencia que establezca las condiciones bajo las cuales estos datos se pueden copiar, distribuir y reutilizar libremente. Dado que los contextos legales varían de un país a otro, en la actualidad se utilizan varias licencias en todo el mundo.
Open data commons es un proyecto lanzado en el Reino Unido en diciembre de 2007 por la Open Knowledge Foundation . La primera licencia libre del proyecto se desarrolló en marzo de 2008 por Jordan Hatcher y D r Charlotte Waelde.
Estas licencias se pueden aplicar a bases de datos y los datos que contienen se toman de forma aislada. La Open Knowledge Foundation ha desarrollado tres tipos de licencias de datos libres que se basan en su derecho interno, a su vez basado en el modelo anglosajón y que se diferencia de los derechos romano-germánicos, es decir, el derecho civil, con una protección moral más reconocida y exitosa. derechos. Por tanto, la aplicación de algunas de estas licencias a obras intelectuales no es válida en Francia, pero puede considerarse para la difusión de datos públicos en la medida en que son públicos por definición.
Dedicación y licencia de dominio públicoEl dominio público y la licencia (PDDL) da la posibilidad de usar, copiar, modificar, redistribuir una base de datos sin ninguna restricción. Es una licencia de dominio público libre de todos los derechos. Por tanto, los datos se pueden utilizar de forma totalmente gratuita y el autor renuncia a sus derechos morales.
Base de datos común abiertaEsta licencia, que se puede encontrar bajo las siglas ODC-by, autoriza el uso, copia, redistribución, modificación, producción de trabajos derivados de la base de datos, sujeto a indicar el nombre del autor de la base de datos original. Estos principios se pueden encontrar en Creative Commons By license .
Licencia de base de datos abierta de Open Data CommonsLa licencia ODbL se basa en derechos de autor y derechos de base de datos sui generis. Permite a los usuarios copiar, distribuir, utilizar, modificar y producir un trabajo derivado de una base de datos sujeto a su redistribución en las mismas condiciones impuestas por la licencia original. También implica indicar el nombre del autor de la base de datos original.
Con la excepción de la licencia CC-0 especialmente diseñada, las licencias de la familia Creative Commons no son adecuadas para el uso de bases de datos. De hecho, se centran únicamente en los derechos de autor y descuidan el derecho sui generis de las bases de datos: esto corre el riesgo, por un lado, de hacerlas ineficaces (el cumplimiento de sus obligaciones ya no está vinculado a la cesión de derechos) y, por otro, hacer incierto el estado de los datos difundidos bajo estas licencias (el posible derecho sui generis de no compartir las bases de datos).
Según la legislación francesa, se considera que es probable que los datos públicos contengan información sensible, ya sea porque permiten identificar a una persona o porque están sujetos a derechos de autor, secreto de estado o por motivos de defensa nacional . En este contexto, los datos no pueden difundirse libremente sin autorización previa o deben estar sujetos al anonimato. Una vez garantizados los derechos de transmisión, se aplicarán las licencias. Diferentes organizaciones han desarrollado licencias gratuitas aplicables a cualquier tipo de contenido, público o creaciones de la mente. Estos son modelos simples de licencias comerciales que no requieren cumplimiento. Podrán celebrarse contratos inéditos, siempre que se respete el derecho interno, tanto en lo que se refiere a las disposiciones de las leyes del 17 de julio de 1978 o incluso del 6 de enero de 1978, como en lo que respecta a las normas de orden público aplicables al contrato. En Francia, se han asignado hasta cinco licencias de reutilización diferentes a los datos abiertos. En 2013, la armonización de prácticas llevó al uso de dos licencias estándar utilizadas en proporciones equivalentes: la licencia abierta y la licencia de base de datos abierta.
Licencia del Ministerio de Justicia francésEl Ministerio de Justicia ha tomado la iniciativa de diseñar una licencia adaptada a los datos públicos, la Licencia de Información Pública de Reutilización Libre, comúnmente llamada LIP.
Brinda la posibilidad de reutilizar los datos del Directorio del ministerio de forma gratuita, incluso con fines comerciales a condición de mencionar las fuentes, la fecha de actualización, no alterar los datos y no distorsionar el significado.
También se prevé que el usuario solo podrá autorizar una nueva reutilización bajo licencia con la condición de tener valor agregado a los datos originales.
Licencia abiertaEsta licencia creada por ETALAB está destinada a ser utilizada en particular en data.gouv.fr.
Licencia de base de datos abiertaLa licencia ODbL ha sido traducida al francés por la ciudad de París para adaptarla al uso nacional. Una variedad de proyectos utilizan esta licencia, desde OpenStreetMap hasta comunidades locales (París, Nantes, Toulouse…).
La Open Knowledge Foundation publicó el índice global de datos abiertos .
La World Wide Web Foundation publica el barómetro de datos abiertos para medir la apertura de los datos y su impacto por país.
La OCDE publica un ranking denominado Open Government Data sobre la apertura de los datos públicos en sus países miembros.
Cada año, a finales de febrero o principios de marzo, la Open Knowledge Foundation organiza el día de datos abiertos (en) .