Hokum

Pasajes de un excéntrico inadaptado

¿Por qué el futuro del almacenamiento de datos es (todavía) la cinta magnética?

Posted at — Feb 7, 2019

Esta es mi propia interpretación del artículo Why the future of Data Storage is (Still) Magnetic Tape escrito por Mark Lantz.[1]

Los discos están llegando a su límite, pero las cintas magnéticas siguen mejorando.

No debería ser sorpresa que los avances recientes en análisis de big-data y en inteligencia artificial han creado fuertes incentivos para las empresas para amasar información sobre cualquier aspecto medible de sus negocios. Y ahora las regulaciones financieras solicitan que las organizaciones tengan registros por periodos más largos que los que se tenían en el pasado. Entonces las compañías e instituciones de todos los rubros se están aferrando más y más.

Los estudios muestran que la cantidad de datos almacenados se incrementa del 30% al 40% al año. Al mismo tiempo, la capacidad de los discos modernos, los cuales son usados para almacenar la mayoría de estos datos, aumenta menos de la midad de este ritmo. Afortunadamente, mucha de esta información no necesita estar accesible instantáneamente. Y para estas cosas, la cinta magnética es la solución perfecta.

¿De verdad? ¿La cinta? La simple idea puede evocar imágenes de carretes rotando al compás junto a un voluminoso mainframe en una vieja película como Desk Set o Dr. Strangelove. Entonces, les actualizo: ¡Las cintas jamás se han ido!

En efecto, muchos de los datos en el mundo se siguen manteniendo en cinta, incluyendo datos científicos, como en la física de partículas y la radio astronomía, la herencia humana y archivos nacionales, grandes películas, Hay incluso un grupo de personas, con estudios en ciencia de materiales, ingeniería o física, cuyo trabajo es seguir mejorando el almacenamiento en cinta.

La cinta ha estado disponible desde mucho tiempo, si, pero la tecnología alrededor de esta no se ha congelado. Todo lo contrario. Como el disco y el transistor, la cinta magnética ha avanzado enormemente durante décadas.

El primer sistema de almacenamiento digital en cinta comercial, el IBM Modelo 726, podía almacenar hasta 1.1 megabytes en un carrete de cinta. Hoy, los cartuchos de cinta modernos pueden almacenar hasta 15 terabytes. Una sola biblioteca robótica de cintas puede contener hasta 278 petabytes de datos. Almacenar esa cantidad de datos en discos compactos podría requerir más de 397 millones de unidades, que apilados pueden formar una torre de más de 726 kilómetros de altura.

Es verdad que la cinta no ofrece velocidades de acceso rápido como los discos o memorias de semiconductor. Sin embargo, las ventajas del medio son muchas. Para empezar, el almacenamiento en cinta es más eficiente en consumo de energía: Una vez que todos los datos se han guardado, un cartucho de cinta simplemente se guarda en un espacio dentro de la biblioteca robótica y no consume energía. La cinta también es excesivamente confiable, cuyos margenes de error son de cuatro a cinco veces más bajos que en los discos. Y la cinta también es muy segura, con cifrado en línea nativo y la seguridad adicional provista por la naturaleza del medio en si. Después de todo, si un cartucho no es montado en el dispositivo, los datos no pueden accederse ni modificarse. Este "espacio de aire" es particularmente atractivo a la luz del creciente ritmo de robo de datos a través de ciberataques.

La naturaleza fuera de línea de la cinta también proporciona una linea de defensa adicional contra software defectuoso. Por ejemplo, en el 2011, una falla en una actualización de software causó que Google borrara accidentalmente los mensajes de correo electrónico guardados de alrededor de 40,000 cuentas de su servicio de correo electrónico. Esa pérdida ocurrió a pesar que de hubo varias copias de los datos almacenadas en discos en múltiples centros de datos. Afortunadamente, los datos también se encontraban en cinta, por lo que Google pudo eventualmente restaurar todos los datos perdidos desde ese respaldo.

El incidente de Gmail del 2011 fue una de las primeras revelaciones que un proveedor de servicios de nube estaba usando cintas para sus operaciones. Recientemente, Microsoft dejó saber que su servicio de Azure Archive Storage usa equipo de almacenamiento en cinta de IBM.

A pesar de todas estas ventajas, la principal razón por la que las compañías usan cinta es usualmente economía simple. Los costos del almacenamiento en cinta es una sexta parte de lo que se paga por mantener la misma cantidad de datos en discos, y es por eso que se pueden encontrar sistemas de cintas en casi cualquier lugar donde cantidades masivas de datos son almacenados. Pero porque la cinta ha desaparecido completamente de los productos para consumo, la mayoría de las personas no tiene conocimiento de su existencia, y mucho menos de las ventajas tremendas que la tecnología de almacenamiento en cinta ha hecho en años recientes y que continuará haciendo en el futuro previsible.

Todo esto es para decir que la cinta ha estado con nosotros por décadas y que estará aquí por otras décadas siguientes.

La cinta ha sobrevivido todo este tiempo por una razón fundamental: Es barata. Y se sigue abaratando todo el tiempo. Pero, ¿siempre será así?

Puedes esperar que la habilidad de abarrotar más datos en discos magnéticos está disminuyendo, entonces deberá ser lo mismo para la cinta, que usa la misma tecnología básica pero más vieja. La sorprendente realidad es que para la cinta, el escalamiento en capacidad no muestra signos de lentitud. En efecto, deberá continuar por muchos años más a un ritmo histórico de 33% por año, y significa que puedes esperar un doble de capacidad cada dos o tres años. Es como la Ley de Moore de las cintas magnéticas.

Esas son buenas noticias para cualquiera que tenga que lidiar con la explosión en datos con un presupuesto de almacenamiento fijo. Para comprender por qué la cinta aún tiene mucho potencial en relación a los discos, considere la manera en que la cinta y los discos evolucionaron.

Ambos se basan en los mismos mecanismos físicos y básicos para almacenar datos digitales. Lo hacen en forma de pistas estrechas en una capa delgada de material magnético en donde imanes cambian entre dos estados de polaridad. La información está codificada en series de bits, representados por la presencia o ausencia de una transición de polaridad magnética en puntos específicos a lo largo de la pista. Desde la introducción de la cinta y los discos en la década de 1950, los fabricantes de ambos se dirigen a través del mantra "más denso, más rápido, más barato". Como resultado, el costo de ambos, en términos de dólares por gigabyte de capacidad, ha caído exponencialmente.

Estas reducciones de costo son el resultado de incrementos exponenciales en la densidad de información que puede ser guardada por cada milimetro cuadrado del sustrato magnético. La densidad superficial es el producto de la densidad de registros a través de las pistas de datos y la densidad de esas pistas en una dirección perpendicular.

Al principio, las densidades superficiales en cintas y discos eran similares. Pero el tamaño de mercado más grande y las ganancias por las ventas de los discos proporcionó financiamiento para mayor esfuerzo en Investigación y Desarrollo, que permitió a los fabricantes escalar de manera más agresiva. Como resultado, la densidad superficial de los discos de gran capacidad es 100 veces mayor que la de las cintas actuales.

Sin embargo, debido a que tienen mayor superficie disponible para grabar, los sistemas de cintas proporcionan cartuchos con capacidad de hasta 15 TB, que es mayor que los discos de alta capacidad disponibles en el mercado. Ambos tipos de equipo ocupan la misma cantidad de espacio físico.

Con la excepción de la capacidad, las características de rendimiento de la cinta y el disco son muy diferentes. La longitud de la cinta dentro de su cartucho, normalmente de cientos de metros, resulta en un tiempo de acceso a datos promedio de 50 a 60 segundos comparado con los 5 o 10 milisegundos de los discos. Pero el ritmo al cual los datos pueden ser escritos en cinta, es el doble que la escritura en disco.

En los últimos años, el escalado de densidad superficial de datos en los discos se ha alentado desde su promedio histórico de alrededor de 40% al año a solo el 10% o 15%. La razón tiene que ver con física fundamental: Para guardar más datos en un área específica, necesitas asignar una región más pequeña para cada bit. Esto reduce la señal que puedes obtener cuando se leen los datos. Y si se reduce la señal mucho, se pierde en el ruido que se produce en la naturaleza granular de los granos magnéticos que cubren el disco.

Es posible reducir el ruido de fondo al hacer esos granos más pequeños. Pero es difícil reducir los granos magnéticos a determinado tamaño sin comprometer su habilidad de mantener un estado magnético de manera estable. El tamaño más pequeño que es práctico para su uso de registro magnético es conocido en este negocio como el límite superparamagnético. Y los fabricantes de discos ya llegaron a este.

Recientemente, esta ralentización no era obvia a los consumidores, porque los fabricantes de discos lo compensaron al agregar más cabezas y platillos a cada unidad, permitiendo una mayor capacidad en el mismo tamaño físico. Pero el espacio disponible y el costo de agregar más cabezas y platillos están limitando las ganancias que los fabricantes de discos pueden obtener y el efecto meseta se está volviendo aparente.

Hay algunas tecnologías en desarrollo que pueden permitir un escalamiento en el disco más allá del límite superparamagnético actual. Estas incluyen la grabación magnética asistida por calor (HAMR) y grabación magnética asistida por micro-ondas (MAMR), que permiten el uso de granos más pequeños y por lo tanto regiones más pequeñas del disco que pueden ser magnetizadas. Pero estas aproximaciones agregan un costo de introducir molestos retos de ingeniería. Incluso si son exitosos, el escalamiento que proporcionan es, de acuerdo a los fabricantes, todavía limitado. Western Digital Corp, por ejemplo, que anunció recientemente que probablemente lance discos MAMR en el 2019, esperando que esta tecnología proporcione mayor escalamiento de densidad superficial por solo el 15% al año.

En contraste, el equipo de almacenamiento en cinta opera actualmente en densidades superficiales muy por abajo del límite superparamagnético. La Ley de Moore con respecto a las cintas, puede seguir vigente por una década o más sin correr en tantas barricadas de la física fundamental.

De todas maneras, la cinta es una tenología engorrosa. Su naturaleza removible, el uso de un sustrato de polímero delgado en lugar de un disco rígido, y las grabaciones simultáneas de hasta 32 pistas en paralelo crea obstáculos significativos para los diseñadores. Es por eso que el equipo de investigación en el laboratorio de investigación de IBM de Zúrich ha trabajado duro para encontrar maneras de proporcionar escalamientos continuos en la cinta, ya sea adaptando tecnologías de los discos o inventando enfoques completamente nuevos.

En el 2015, IBM y FujiFilm Corp demostraron que usando partículas de ferrita de bario ultra pequeñas orientadas de manera perpendicular a la cinta, es posible guardar 12 veces más datos en una densidad accesible con la tecnología comercial actual. Y recientemente, en colaboración con Sony Storage Media Solutions, se demostró la posibilidad de guardar datos en una densidad superficial que es 20 veces mayor que en los dispositivos de cinta más avanzados. Para poner esto en perspectiva, si esta tecnología se comercializara, un estudio de filmación, que actualmente necesita una dozena de cartuchos de cinta para archivar todos los componentes digitales de gran presupuesto, sería capaz de almacenarlo todo en una sola cinta.

Para proporcionar este nivel de escalamiento, se tuvieron que hacer muchos avances técnicos. Primero, se mejoró la habilidad de las cabezas de lectura y escritura de seguir pistas más delgadas en la cinta, hasta hacerlas de 100 nanómetros de ancho.

También se redujo el ancho del lector de datos, un sensor magnetorresistivo usado para leer las pistas de datos grabados, de micrometros a menos de 50 nanómetros. Como resultado, la señal que puede tomar con un lector tan pequeño puede estar muy ruidosa. Se compensó al incrementar el radio de señal-ruido inherente en el medio, que es en función al tamaño y orientación de las partículas magnéticas así como su composición en la superficie de la cinta. Para ayudar más, se mejoró el procesamiento de señal y los esquemas de corrección de errores de los equipos empleados.

Para asegurarse que el nuevo prototitpo de medio pueda retener datos grabados por décadas, se cambió la naturaleza de las partículas magnéticas en la capa de grabación, haciendolas más estables. Pero el cambio hizo más difícil grabar datos en primer lugar, en la medida que un transductor de cinta normal no pudiera escribir en el nuevo medio. Entonces se usó una cabeza de escritura especial que produce campos magnéticos más fuertes que una cabeza convencional pueda proporcionar.

Combinando estas tecnologías, se es capaz de leer y escribir datos en el sistema de laboratorio con una densidad lineal de 818,000 bits por pulgada. (Por razones históricas, los ingenieros de cinta alrededor del mundo miden la densidad de datos en pulgadas). En combinación con las 246,200 pistas por pulgada que la nueva tecnología puede manejar, el prototipo consiguió una densidad superficial de 201 gitabits por pulgada cuadrada. Asumiendo que un cartucho puede guardar 1140 metros de cinta, que es una suposición razonable, basandose en el grosor reducido de el nuevo medio de cinta usado, la densidad superficial que corresponde a la capacidad de un cartucho de hasta 330 TB. Eso significa que un simple cartucho de cinta puede almacenar tantos datos como una carretilla llena de discos.

En el 2015, el Consorcio de la Industria del Almacenamiento de Información, una organización que incluye a HP Enterprise, IBM, Oracle y Quantum, al igual que con algunos grupos de investigación académica, anunciaron el llamado "Plan de Almacenamiento en Cinta Magnética Internacional". Donde se predice que la densidad superficial del almacenamiento en cinta podría llegar a los 91 Gb por pulgada cuadrada para el 2025. Extrapolando la tendencia, se sugiere que sobrepasará los 200 Gb por pulgada cuadrada para el 2028.

Los autores del plan tienen un interés en el futuro del almacenamiento en cinta. No hay que preocuparse de que sean muy optimistas. Los experimentos de laboratorio demuestran que 200 Gb por pulgada cuadrada es perfectamente posible. Por lo que la factibilidad de mantener a la cinta en una ruta de crecimiento está por otra década, asegurada.

En efecto, la cinta puede ser una de las últimas tecnologías de información que sigue la Ley de Moore, como el escalamiento, mantenible por la siguiente década, si no es que más allá. Y esa racha solo incrementará la ventaja de los costos de la cinta sobre los discos y otras tecnologías de almacenamiento. Aunque rara vez lo veas fuera de las películas en blanco y negro, la cinta magnética, aunque vieja, tiene todavía años por venir.


1. Mark Lantz es el gerente de Tecnologías Avanzadas de Cinta en IBM Research, ubicado en Zúrich.
comments powered by Disqus