Cómo instalar Apache Cassandra en Ubuntu 22.04
Cassandra es un sistema de gestión de bases de datos NoSQL, gratuito y de código abierto, diseñado para manejar grandes cantidades de datos. Cassandra utiliza réplicas de estilo dinámico. Estas réplicas se almacenan en varios nodos, proporcionando así alta disponibilidad y cero puntos de fallo. Cassandra es ideal en IoT y otras aplicaciones, como análisis de redes sociales, servicios de mensajería y aplicaciones minoristas en las que se recopilan datos masivos. Muchas grandes organizaciones, como Netflix, Facebook, Cisco, Hulu, Twitter y otras, utilizan Apache Cassandra.
Este tutorial explicará cómo instalar Apache Cassandra en Ubuntu 22.04.
Requisitos previos
- Un servidor que ejecute Ubuntu 22.04.
- Una contraseña de root configurada en el servidor.
Instalar Java 8
Apache Cassandra sólo es compatible con la versión 8 de Java. Así que tendrás que instalarla en tu servidor. Puedes instalarlo ejecutando el siguiente comando:
apt-get install openjdk-8-jdk -y
Una vez instalado Java, verifica la instalación de Java mediante el siguiente comando:
java -version
Obtendrás la siguiente salida:
openjdk version "1.8.0_312" OpenJDK Runtime Environment (build 1.8.0_312-8u312-b07-0ubuntu1-b07) OpenJDK 64-Bit Server VM (build 25.312-b07, mixed mode)
Una vez que hayas terminado, puedes pasar al siguiente paso.
Añadir el repositorio de Apache Cassandra
Por defecto, el paquete Apache Cassandra no está incluido en el repositorio por defecto de Ubuntu 22.04. Así que tendrás que añadir el repositorio oficial de Cassandra a APT.
En primer lugar, instala las dependencias necesarias utilizando el siguiente comando:
apt-get install apt-transport-https gnupg2 -y
Una vez instaladas todas las dependencias, importa la clave GPG de Cassandra con el siguiente comando:
wget -q -O - https://www.apache.org/dist/cassandra/KEYS | apt-key add -
A continuación, añade el repositorio de Cassandra a APT utilizando el siguiente comando:
sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 311x main" > /etc/apt/sources.list.d/cassandra.list'
A continuación, actualiza la caché del repositorio utilizando el siguiente comando:
apt-get update -y
Una vez actualizado el repositorio del sistema, puedes pasar al siguiente paso.
Instalar Cassandra en Ubuntu 22.04
Ya puedes instalar Apache Cassandra ejecutando el siguiente comando:
apt-get install cassandra -y
Una vez instalado Apache Cassandra, puedes comprobar el estado de ejecución de Cassandra mediante el siguiente comando:
systemctl status cassandra
Obtendrás la siguiente salida:
? cassandra.service - LSB: distributed storage system for structured data Loaded: loaded (/etc/init.d/cassandra; generated) Active: active (running) since Thu 2022-05-05 11:57:22 UTC; 40s ago Docs: man:systemd-sysv-generator(8) Process: 24707 ExecStart=/etc/init.d/cassandra start (code=exited, status=0/SUCCESS) Tasks: 57 (limit: 4630) Memory: 1.2G CPU: 15.952s CGroup: /system.slice/cassandra.service ??24800 /usr/bin/java -Xloggc:/var/log/cassandra/gc.log -ea -XX:+UseThreadPriorities -XX:ThreadPriorityPolicy=42 -XX:+HeapDumpOn> May 05 11:57:22 ubuntu2204 systemd[1]: Starting LSB: distributed storage system for structured data... May 05 11:57:22 ubuntu2204 systemd[1]: Started LSB: distributed storage system for structured data.
También puedes verificar el puerto de escucha de Cassandra utilizando el siguiente comando:
ss -antpl | grep java
Obtendrás el siguiente resultado:
LISTEN 0 500 127.0.0.1:7000 0.0.0.0:* users:(("java",pid=24800,fd=86)) LISTEN 0 50 127.0.0.1:45049 0.0.0.0:* users:(("java",pid=24800,fd=83)) LISTEN 0 50 127.0.0.1:7199 0.0.0.0:* users:(("java",pid=24800,fd=82)) LISTEN 0 4096 127.0.0.1:9042 0.0.0.0:* users:(("java",pid=24800,fd=100))
Cómo conectar Apache Cassandra
En primer lugar, tendrás que comprobar el estado de Apache Cassandra, puedes comprobarlo utilizando el siguiente comando:
nodetool status
Obtendrás la siguiente salida:
Datacenter: datacenter1 ======================= Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 127.0.0.1 70.93 KiB 256 100.0% eaa94d10-69c6-405d-b7bd-4b3dcbd380be rack1
Ahora puedes utilizar la utilidad cqlsh para conectarte al shell de Cassandra:
cqlsh
Una vez conectado, obtendrás la siguiente salida:
Connected to Test Cluster at 127.0.0.1:9042. [cqlsh 5.0.1 | Cassandra 3.11.12 | CQL spec 3.4.4 | Native protocol v4] Use HELP for help. cqlsh>
Ahora, sal del shell de Cassandra utilizando el siguiente comando:
cqlsh> exit
Cambiar el nombre del clúster Cassandra
Por defecto, el nombre de clúster de Cassandra es Clúster de Prueba. Se recomienda cambiarlo por un nombre significativo.
Para ello, conéctate a Cassandra con el siguiente comando:
cqlsh
Una vez conectado, cambia el nombre del clúster a «Clúster Cassandra», como se muestra a continuación:
cqlsh> UPDATE system.local SET cluster_name = 'Cassandra Cluster' WHERE KEY = 'local';
A continuación, sal del Cassandra con el siguiente comando:
cqlsh> exit
A continuación, también tendrás que editar el archivo de configuración de Cassandra y cambiar el nombre de tu cluster. Puedes editarlo con el siguiente comando
nano /etc/cassandra/cassandra.yaml
Cambia la siguiente línea:
cluster_name: 'Cassandra Cluster'
Guarda y cierra el archivo cuando hayas terminado y, a continuación, vacía la caché del sistema con el siguiente comando:
nodetool flush system
A continuación, reinicia el servicio Cassandra para aplicar los cambios:
systemctl restart cassandra
Ahora puedes verificar el nombre del clúster Cassandra utilizando el siguiente comando:
cqlsh
Si todo va bien, obtendrás un nuevo nombre de clúster en la siguiente salida:
Connected to Cassandra Cluster at 127.0.0.1:9042. [cqlsh 5.0.1 | Cassandra 3.11.12 | CQL spec 3.4.4 | Native protocol v4] Use HELP for help. cqlsh>
Conclusión
Enhorabuena! has instalado correctamente Apache Cassandra en Ubuntu 22.04. Ahora puedes utilizar Cassandra en un entorno de clúster para manejar una gran cantidad de datos. No dudes en preguntarme si tienes alguna duda.