Ésta tarde, al salir de un curso sobre la LOPD con la reforma de la ley penal del marzo del año pasado en la que se añaden hasta 50 nuevos delitos informáticos, ha salido el tema del almacenamiento de los datos en la nube (cloud) y lo más importante, ¿dónde están realmente alojados los datos?
El mundo del almacenamiento de los datos en la red ha cambiado muchísimo desde que en 1965 se creó el correo electrónico (que no fue hasta el 1971 cuando se mandase el primero a través de dos ubicaciones físicamente distantes tal como estamos acostumbrados a diario).
No fue hasta el 1991, hace tan sólo 25 años, que se creó la primera página web de la historia, y hasta tan sólo 1994 que fue cuando se popularizó gracias a la w3c estandarizando el formato html, que no empezó el boom del internet que conocemos a día de hoy.
Pero mucho ha llovido desde entonces y al igual que la apariencia y el uso de las webs, además del aumento de usuarios y del tráfico, por dentro internet “se ha ido actualizando”.
Todos sabemos que podemos alojar en nuestro equipo un documento escrito por nosotros mismos (o el fichero con nuestras contraseñas guardado en un documento de word sin password), pero ¿cómo funciona realmente internet por dentro? ¿qué hay detrás lo que llamamos actualmente la nube?
Técnicamente, la nube está formada por ordenadores, con su placa base, sus discos duros, su memoria RAM, sus puertos USB, etc. en fin, no es nada mas que un ordenador como el que tienes entre las manos, pero a medida que ha ido pasando el tiempo, al igual como los coches de Fórmula 1, estos se han ido especializando para permitir una transmisión más rápida de los datos (mayor procesamiento) y sobretodo una mayor redundancia de los mismos (las piezas de estos ordenadores, que llamamos servidores, al igual que nuestros ordenadores personales por el uso también se estropean).
Hace más de 18 años, cuando monté mi primer servidor con GNU/Linux, lo hice en un pc de sobremesa, en un Pentium II en el que pocas horas antes corría un Windows 98 SE, el mismo que había usado para navegar por internet.
Por arte de magia, aunque en una red local, aquella caja blanca amarillenta, pasaba a formar parte de un pequeño trocito de internet (internet es un conjunto de redes interconectadas). En él instalé un servidor para mostrar páginas web (el recién salido apache 1.3) y colgué ahí la web, que llevaba 4 años programando y tenía alojada en geocities.
Hasta el momento sólo sabía que había una cosa llamada FTP donde subías ahí tus páginas web estáticas y por arte de magia poniendo una dirección web en el navegador aparecía lo que había diseñado con dreamweaver y retocado con el bloc de notas. Pero ver aquello fue una auténtica revolución, aunque tan sólo era una prueba, por fin entendí que los datos que tenía alojados en mi ordenador, simplemente lo que estaba haciendo era subirlos a otro ordenador.
Entendí que con ordenadores anteriores era como se había ido creando internet, incluso me derrití del gusto cuando años mas tarde, en 2005, me dijeron que en la UPC de Barcelona aún había un servidor de correo montado hacía 20 años con un viejo 386 corriendo GNU/Linux. No podía dejar de pensar en aquel viejo 486 que tenía en casa hacía años en la que le pulsabas el botón de turbo y pasaba de 33MHz a 66MHz (¡me pongo romántica sólo en recordarlo!).
Pero estamos a 2016, google, youtube, facebook, twitter, whatsapp, telegram, megaupload, pokemon go, otros muchos que han pasado a mejor vida, etc. con millones de usuarios simultáneos accediendo y compartiendo vorazmente a millones de contenidos al mismo tiempo. ¿Cómo se ha pasado de aquellas cafeteras que apenas eran capaces de ejecutar el prince of persia a duras penas a llegar a ofrecer billones de accesos por segundo?
Pues de la misma forma que es capaz alimentar a una ciudad entera, con granjas, granjas de servidores. Edificios gigantescos llenos de ordenadores muy potentes diseñados para ocupar muy poco espacio.
Pero para llegar aquí, quiero hacer una analogía (la misma que he hecho al salir del curso para explicar la evolución hasta lo que conocemos como “la nube”) con la evolución del parque automovilístico.
– Al principio se inventó la rueda: el nacimiento de la informática, el microprocesador, el chip, etc. ¡vamos prehistoria!
– Más adelante algunos aventureros decidieron empezar a usar la Mobylette, usando ordenadores y alojando ahí sus webs personales o empresariales, o incluso los programas de sus empresas. De casa no salen y muchas de las medianas empresas aún usan éste modelo. Comúnmente un servidor ofrece muchos servicios.
– Aparecen los Model T de Henry Ford, ya un vehículo con cuatro ruedas que te permite salir a la carretera. Entramos con la virtualización, ahí puede haber un servidor (o varios) en el que se divide un servicio por maquina virtual, pequeños servidores dentro de un servidor. Pero el concepto es muy similar al de la Mobylette, pero da mucho mas juego, pero los datos están ahí, aún en casa. Éste sería el caso de lo que tengo montado en capa8 o mi blog.
– A medida que se va necesitando un sistema un poco mas grande, podríamos pasar a los coches de hace 30-20 años (Citroen 2 Caballos), mucho más rápidos, también virtualizados, pero también replicados (los datos suelen estar físicamente a dos o más sitios a la vez y si falla el sistema principal hay otro de respaldo -backup- que sustituye al principal), con ellos ya podemos salir a la autopista :) Éste sería el caso de lo que tenía montado en marsupi.
– Pero éste sistema más grande, también evoluciona y lo que antes se hacía a mano, ahora ya tenemos otro más electrónico y moderno que se hace automáticamente (Citroën C4, Mazda 3), es el llamado clustering por software. En éste nos encontramos que los datos están a todos los sitios a la vez, pero individualmente no están físicamente a ninguna máquina. Ésto sería el caso de lo que tengo montado en la mar de bits.
– Pero si el número de peticiones aumenta, ya tenemos que irnos a cosas de gama alta (Audis, Mercedes, etc.) y además del clustering por software, tenemos que añadirle la redundancia por hardware. Es el mismo sistema que el anterior, pero mucho mas caro y también mucho mas grande y complejo. Aquí ya tendríamos a medianos y un poco grandes proveedores de servicio, armarios enteros llenos de servidores dentro de un edificio gris y cuadrado.
– Y ya a la cúspide, nos encontramos con los grandes monstruos de internet, como google, facebook, amazon, etc. esto son los Lamborghini, elevan a n enésimo el anterior concepto, ya no sólo están en un solo edificio, sino en varios repartidos por todo el mundo conectados entre ellos con cables casi exclusivos para ellos mismos. La redundancia de los datos ya no está fijada en una sola ubicación, sino que es global y el vídeo de tu gatito jugando con un cordel de lana la tarde pasada puede estar al mismo tiempo a cualquier parte del mundo!
– El futuro es ¡la luna! los datos van a estar (y empiezan a estarlo) en todos sitios, incluso en nuestros dispositivos móviles, nuestros móviles forman parte ya de internet y es un contínuo de transmisión bidireccional de los datos. Las fotos de tus vacaciones están en tu dispositivo móvil, pero también lo están en la nube, para poner un ejemplo la sincronización de los datos de tu ordenador o tu móvil con dropbox, google docs, etc. o el concepto que se lleva años hablando ya, el del bigdata, tú mismo, con tus metadatos, eres parte de los datos de internet.
Poco a poco hemos ido viendo que cuanto mas grande es internet y más grandes sean las empresas que operan en él, más descentralizados se encuentran nuestros datos, esto es positivo en caso de un desastre natural, pero a nivel jurídico puede ser un auténtico quebradero de cabeza ya que la protección de nuestros datos, la privacidad, el derecho a la intimidad, derecho al olvido en internet, libertad de expresión y muchos de estos conceptos modernos y contemporáneos no son tratados por igual en todos los países.
¿Ya sabes dónde se alojan tus datos? ¿ya sabes a manos de quién están? ¿ya sabes para qué se usan tus datos? ¿ya sabes como tus datos te influyen?