Cómo instalar Apache Cassandra en Ubuntu 22.04

Cassandra es un sistema de gestión de bases de datos NoSQL, gratuito y de código abierto, diseñado para manejar grandes cantidades de datos. Cassandra utiliza réplicas de estilo dinámico. Estas réplicas se almacenan en varios nodos, proporcionando así alta disponibilidad y cero puntos de fallo. Cassandra es ideal en IoT y otras aplicaciones, como análisis de redes sociales, servicios de mensajería y aplicaciones minoristas en las que se recopilan datos masivos. Muchas grandes organizaciones, como Netflix, Facebook, Cisco, Hulu, Twitter y otras, utilizan Apache Cassandra.

Este tutorial explicará cómo instalar Apache Cassandra en Ubuntu 22.04.

Requisitos previos

  • Un servidor que ejecute Ubuntu 22.04.
  • Una contraseña de root configurada en el servidor.

Instalar Java 8

Apache Cassandra sólo es compatible con la versión 8 de Java. Así que tendrás que instalarla en tu servidor. Puedes instalarlo ejecutando el siguiente comando:

apt-get install openjdk-8-jdk -y

Una vez instalado Java, verifica la instalación de Java mediante el siguiente comando:

java -version

Obtendrás la siguiente salida:

openjdk version "1.8.0_312"
OpenJDK Runtime Environment (build 1.8.0_312-8u312-b07-0ubuntu1-b07)
OpenJDK 64-Bit Server VM (build 25.312-b07, mixed mode)

Una vez que hayas terminado, puedes pasar al siguiente paso.

Añadir el repositorio de Apache Cassandra

Por defecto, el paquete Apache Cassandra no está incluido en el repositorio por defecto de Ubuntu 22.04. Así que tendrás que añadir el repositorio oficial de Cassandra a APT.

En primer lugar, instala las dependencias necesarias utilizando el siguiente comando:

apt-get install apt-transport-https gnupg2 -y

Una vez instaladas todas las dependencias, importa la clave GPG de Cassandra con el siguiente comando:

wget -q -O - https://www.apache.org/dist/cassandra/KEYS | apt-key add -

A continuación, añade el repositorio de Cassandra a APT utilizando el siguiente comando:

sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 311x main" > /etc/apt/sources.list.d/cassandra.list'

A continuación, actualiza la caché del repositorio utilizando el siguiente comando:

apt-get update -y

Una vez actualizado el repositorio del sistema, puedes pasar al siguiente paso.

Instalar Cassandra en Ubuntu 22.04

Ya puedes instalar Apache Cassandra ejecutando el siguiente comando:

apt-get install cassandra -y

Una vez instalado Apache Cassandra, puedes comprobar el estado de ejecución de Cassandra mediante el siguiente comando:

systemctl status cassandra

Obtendrás la siguiente salida:

? cassandra.service - LSB: distributed storage system for structured data
     Loaded: loaded (/etc/init.d/cassandra; generated)
     Active: active (running) since Thu 2022-05-05 11:57:22 UTC; 40s ago
       Docs: man:systemd-sysv-generator(8)
    Process: 24707 ExecStart=/etc/init.d/cassandra start (code=exited, status=0/SUCCESS)
      Tasks: 57 (limit: 4630)
     Memory: 1.2G
        CPU: 15.952s
     CGroup: /system.slice/cassandra.service
             ??24800 /usr/bin/java -Xloggc:/var/log/cassandra/gc.log -ea -XX:+UseThreadPriorities -XX:ThreadPriorityPolicy=42 -XX:+HeapDumpOn>

May 05 11:57:22 ubuntu2204 systemd[1]: Starting LSB: distributed storage system for structured data...
May 05 11:57:22 ubuntu2204 systemd[1]: Started LSB: distributed storage system for structured data.

También puedes verificar el puerto de escucha de Cassandra utilizando el siguiente comando:

ss -antpl | grep java

Obtendrás el siguiente resultado:

LISTEN 0      500        127.0.0.1:7000       0.0.0.0:*    users:(("java",pid=24800,fd=86))                                                  
LISTEN 0      50         127.0.0.1:45049      0.0.0.0:*    users:(("java",pid=24800,fd=83))                                                  
LISTEN 0      50         127.0.0.1:7199       0.0.0.0:*    users:(("java",pid=24800,fd=82))                                                  
LISTEN 0      4096       127.0.0.1:9042       0.0.0.0:*    users:(("java",pid=24800,fd=100)) 

Cómo conectar Apache Cassandra

En primer lugar, tendrás que comprobar el estado de Apache Cassandra, puedes comprobarlo utilizando el siguiente comando:

nodetool status

Obtendrás la siguiente salida:

Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address    Load       Tokens       Owns (effective)  Host ID                               Rack
UN  127.0.0.1  70.93 KiB  256          100.0%            eaa94d10-69c6-405d-b7bd-4b3dcbd380be  rack1

Ahora puedes utilizar la utilidad cqlsh para conectarte al shell de Cassandra:

cqlsh

Una vez conectado, obtendrás la siguiente salida:

Connected to Test Cluster at 127.0.0.1:9042.
[cqlsh 5.0.1 | Cassandra 3.11.12 | CQL spec 3.4.4 | Native protocol v4]
Use HELP for help.
cqlsh> 

Ahora, sal del shell de Cassandra utilizando el siguiente comando:

cqlsh> exit

Cambiar el nombre del clúster Cassandra

Por defecto, el nombre de clúster de Cassandra es Clúster de Prueba. Se recomienda cambiarlo por un nombre significativo.

Para ello, conéctate a Cassandra con el siguiente comando:

cqlsh

Una vez conectado, cambia el nombre del clúster a «Clúster Cassandra», como se muestra a continuación:

cqlsh> UPDATE system.local SET cluster_name = 'Cassandra Cluster' WHERE KEY = 'local';

A continuación, sal del Cassandra con el siguiente comando:

cqlsh> exit

A continuación, también tendrás que editar el archivo de configuración de Cassandra y cambiar el nombre de tu cluster. Puedes editarlo con el siguiente comando

nano /etc/cassandra/cassandra.yaml

Cambia la siguiente línea:

cluster_name: 'Cassandra Cluster'

Guarda y cierra el archivo cuando hayas terminado y, a continuación, vacía la caché del sistema con el siguiente comando:

nodetool flush system

A continuación, reinicia el servicio Cassandra para aplicar los cambios:

systemctl restart cassandra

Ahora puedes verificar el nombre del clúster Cassandra utilizando el siguiente comando:

cqlsh

Si todo va bien, obtendrás un nuevo nombre de clúster en la siguiente salida:

Connected to Cassandra Cluster at 127.0.0.1:9042.
[cqlsh 5.0.1 | Cassandra 3.11.12 | CQL spec 3.4.4 | Native protocol v4]
Use HELP for help.
cqlsh> 

Conclusión

Enhorabuena! has instalado correctamente Apache Cassandra en Ubuntu 22.04. Ahora puedes utilizar Cassandra en un entorno de clúster para manejar una gran cantidad de datos. No dudes en preguntarme si tienes alguna duda.

También te podría gustar...