Este documento ha sido traducido utilizando tecnología de traducción automática. Si bien nos esforzamos por proporcionar traducciones precisas, no ofrecemos garantías sobre la integridad, precisión o confiabilidad del contenido traducido. En caso de discrepancia, la versión original en inglés prevalecerá y constituirá el texto autorizado.

Restaurar un clúster desde una copia de seguridad

La copia de seguridad y recuperación de etcd para clústeres de Kubernetes lanzados por Rancher se puede realizar fácilmente. Las instantáneas de la base de datos etcd se toman y se guardan ya sea localmente en los nodos etcd o en un destino compatible con S3. Las ventajas de configurar S3 son que si se pierden todos los nodos etcd, tu instantánea se guarda de forma remota y se puede utilizar para restaurar el clúster.

Rancher recomienda habilitar la capacidad de configurar instantáneas recursivas de etcd, pero instantáneas de un solo uso también se pueden tomar fácilmente. Rancher permite restaurar desde instantáneas guardadas.

Los clústeres también se pueden restaurar a una versión anterior de Kubernetes y a una configuración de clúster anterior.

Visualizando instantáneas disponibles

La lista de todas las instantáneas disponibles para el clúster está disponible.

  1. En la esquina superior izquierda, haz clic en ☰ > Gestión de Clústeres.

  2. En la página de Clústeres, ve al clúster donde deseas ver las instantáneas y haz clic en el nombre del clúster.

  3. Haz clic en la pestaña Instantáneas. Las instantáneas listadas incluyen una marca de tiempo de cuándo fueron creadas.

Restaurar un clúster desde una instantánea

Si tu clúster de Kubernetes presenta fallos, puedes restaurar el clúster desde una instantánea.

Las instantáneas están compuestas por los datos del clúster en etcd, la versión de Kubernetes y la configuración del clúster en el cluster.yml. Estos componentes te permiten seleccionar entre las siguientes opciones al restaurar un clúster desde una instantánea:

  • Restaurar solo el contenido de etcd: Esta restauración es similar a restaurar a instantáneas en Rancher antes de la v2.4.0.

  • Restaurar etcd y la versión de Kubernetes: Esta opción debe utilizarse si una actualización de Kubernetes es la razón por la que tu clúster está fallando, y no has realizado ningún cambio en la configuración del clúster.

  • Restaurar etcd, versiones de Kubernetes y configuración del clúster: Esta opción debe utilizarse si cambiaste tanto la versión de Kubernetes como la configuración del clúster al actualizar.

Al retroceder a una versión anterior de Kubernetes, se ignoran las opciones de estrategia de actualización. Los nodos de trabajo no se aíslan ni se drenan antes de ser revertidos a la versión anterior de Kubernetes, para que un clúster no saludable pueda ser restaurado más rápidamente a un estado saludable.

Requisito previo:

Para restaurar instantáneas desde S3, el clúster debe estar configurado para tomar instantáneas recursivas en S3.

  1. En la esquina superior izquierda, haz clic en ☰ > Gestión de Clústeres.

  2. En la página de Clústeres, ve al clúster donde deseas ver las instantáneas y haz clic en el nombre del clúster.

  3. Haz clic en la pestaña Instantáneas para ver la lista de instantáneas guardadas.

  4. Ve a la instantánea que deseas restaurar y haz clic en ⋮ > Restaurar.

  5. Selecciona un Tipo de restauración.

  6. Haz clic en Restaurar.

Resultado: El clúster pasará a un estado updating y comenzará el proceso de restauración de los nodos etcd desde la instantánea. El clúster se restaura cuando vuelve a un estado active.

Restaurando un clúster desde una instantánea cuando el controlplane/etcd están totalmente indisponibles.

En un escenario de recuperación ante desastres, el plano de control y los nodos etcd gestionados por Rancher en un clúster descendente pueden no estar disponibles o funcionando. El clúster puede ser reconstruido añadiendo nuevamente nodos de control y etcd, seguido de la restauración desde una instantánea disponible.

Si tienes una falla completa del clúster, debes eliminar todos los nodos/máquinas etcd de tu clúster antes de poder añadir un nodo etcd "nuevo" para la restauración.

Si estás utilizando instantáneas locales, es MUY importante que asegures que respaldas la instantánea correspondiente de la que deseas restaurar desde la carpeta /var/lib/rancher/<k3s/rke2>/server/db/snapshots/ en el nodo etcd que vas a eliminar. Puedes copiar la instantánea en tu nuevo nodo en la carpeta /var/lib/rancher/<k3s/rke2>/server/db/snapshots/. Además, si utilizas instantáneas locales y restauras en un nuevo nodo, la restauración no se puede realizar a través de la interfaz de usuario por ahora.

  1. Elimina todos los nodos etcd de tu clúster.

    1. En la esquina superior izquierda, haz clic en ☰ > Gestión de Clústeres.

    2. En la página Clústeres, ve al clúster del que deseas eliminar nodos.

    3. En la pestaña Máquinas, haz clic en ⋮ > Eliminar en cada nodo que deseas eliminar. Inicialmente, verás que los nodos quedan en un estado deleting, pero una vez que todos los nodos etcd se estén eliminando, serán eliminados juntos. Esto se debe a que Rancher detecta que todos los nodos etcd se están eliminando y procede a omitir la lógica de eliminación segura de etcd.

  2. Después de que todos los nodos etcd sean eliminados, añade el nuevo nodo etcd del que planeas restaurar. Asigna al nuevo nodo el rol de all (etcd, controlplane y trabajador).

    • Si el nodo estaba previamente en un clúster, límpialo primero.

    • Para clústeres personalizados, ve a la pestaña Registro y marca la casilla para etcd, controlplane, and worker. Luego copia y ejecuta el comando de registro en tu nodo.

    • Para clústeres de controlador de nodos, un nuevo nodo se aprovisiona automáticamente.

      En este punto, Rancher indicará que se requiere la restauración desde una instantánea de etcd.

  3. Restaura desde una instantánea de etcd.

    Como el nodo etcd es un nodo limpio, es posible que necesites crear manualmente la vía /var/lib/rancher/<k3s/rke2>/server/db/snapshots/.

    • Para las instantáneas de S3, restaura utilizando la interfaz de usuario.

      1. Haz clic en la pestaña Instantáneas para ver la lista de instantáneas guardadas.

      2. Ve a la instantánea que deseas restaurar y haz clic en ⋮ > Restaurar.

      3. Selecciona un Tipo de restauración.

      4. Haz clic en Restaurar.

    • Para las instantáneas locales, la restauración utilizando la interfaz de usuario no está disponible.

      1. En la esquina superior derecha, haz clic en ⋮ > Editar YAML.

      2. El ejemplo de YAML a continuación se puede añadir bajo tu rkeConfig para configurar la restauración de etcd:

          ...
          rkeConfig:
            etcdSnapshotRestore:
              name: <string> # This field is required. Refers to the filename of the associated etcdsnapshot object.
          ...
  4. Después de que la restauración sea exitosa, puedes escalar tus nodos etcd de nuevo a la redundancia deseada.