Glusterfs vs. Ceph: ¿Quién gana la guerra del almacenamiento?

Almacenar datos a escala no es como guardar un archivo en su disco duro. Requiere un administrador de software para realizar un seguimiento de todos los bits que componen los archivos de su empresa. Ahí es donde entran en juego los paquetes de administración de almacenamiento distribuido como Ceph y Gluster.

Ceph y Gluster son sistemas que se utilizan para gestionar el almacenamiento distribuido. Ambos se consideran almacenamiento definido por software, lo que significa que son en gran medida independientes del hardware. Organizan los bits que componen sus datos utilizando su propia infraestructura subyacente, que es lo que define esta elección: ¿qué marco subyacente desea que respalde sus datos?

Esa es una decisión que desea tomar en función del tipo de datos que está almacenando, cómo se accede a esos datos y dónde se encuentran esos datos. Ceph y GlusterFS son buenas opciones, pero sus aplicaciones ideales son sutilmente diferentes.

Almacenamiento basado en objetos para datos no estructurados: Ceph

Clúster de almacenamiento de soluciones Gluster Vs Ceph Ceph

Ceph es un sistema basado en objetos, lo que significa que administra los datos almacenados como objetos en lugar de como una jerarquía de archivos, distribuyendo datos binarios a través del clúster. Facebook utiliza métodos de almacenamiento de objetos similares para almacenar imágenes y Dropbox para almacenar archivos de clientes. En general, el almacenamiento de objetos admite datos masivos no estructurados, por lo que es perfecto para el almacenamiento de datos a gran escala. El sistema es mantenido por una red de demonios en forma de monitores de clúster, servidores de metadatos y almacenamiento registrado. Estos se combinan para hacer que Ceph sea capaz pero más complejo que la competencia.

El almacenamiento basado en bloques y objetos poco común significa que Ceph utiliza sus propias herramientas para administrar el almacenamiento. Esto requiere que los administradores del sistema se familiaricen con las herramientas de Ceph. El verdadero funcionamiento interno de Ceph puede ser difícil de comprender a primera vista. Básicamente, debe estar dispuesto a aprender cómo funciona para obtener los beneficios. El sistema autoadministrado y de recuperación automática puede reducir los gastos operativos continuos con el tiempo, y Ceph puede ejecutarse en hardware de servidor estándar de la industria.

El sistema también puede crear almacenamiento en bloque, proporcionando acceso a imágenes de dispositivos de bloque que se pueden eliminar y replicar en todo el clúster. Las aplicaciones pueden acceder a Ceph Object Storage a través de una interfaz RESTful que admite las API de Amazon S3 y Openstack Swift. El objetivo es alto rendimiento, almacenamiento masivo y compatibilidad con código heredado.

Almacenamiento de bloques en árboles jerárquicos: GlusterFS

Glusterfs Gluster Fsintroducción 11638

GlusterFS, más conocido como Gluster, es un almacén de archivos más tradicional. Es fácil de configurar y una compilación compilada correctamente se puede usar en cualquier sistema que tenga una carpeta. La flexibilidad y facilidad de uso es una gran ventaja del sistema. Si bien puede escalar a capacidades enormes, el rendimiento tiende a degradarse rápidamente. Es más adecuado para archivos de tamaño medio grande (superiores a 4 MB) y acceso secuencial. Un clúster puede extenderse por servidores físicos, virtuales y en la nube, lo que permite una virtualización de almacenamiento flexible.

Gluster utiliza almacenamiento en bloque, lo que significa que los fragmentos de datos se almacenan en espacios abiertos en dispositivos de clúster conectados. El almacenamiento basado en archivos y bloques utiliza un sistema de archivos que organiza los archivos en árboles jerárquicos. Agrega servidores geográficamente distintos a través de Ethernet para crear un sistema de archivos de red paralelo escalable. Gluster es esencialmente una versión basada en clústeres de FUSE y NFS, que proporciona una arquitectura familiar para la mayoría de los administradores de sistemas. Está destinado a ser simple, fácil de mantener y ampliamente utilizable, pero no tiene la velocidad de acceso que Ceph puede ofrecer en las circunstancias adecuadas.

Conclusión

Ceph se adapta mejor al acceso rápido a datos no estructurados, que constituyen la gran mayoría de archivos del mundo. Gluster es mejor para el acceso secuencial de datos, como la transmisión de video, o para aplicaciones donde la velocidad no es tan importante, como la copia de seguridad.

¿Qué sistema de almacenamiento de archivos estás usando?

¿Es útil este artículo?

¡Ayúdanos a correr la voz!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *