Pular para o conteúdo principal
Version: 3.25

Ativar cluster (HA/DR)

Usando Orbit Config Manager ➔ Panel ➔ wizard ou Orbit Config Manager ➔ Replication ➔ settings, é possível criar um novo cluster ou adicionar a instância a um cluster existente.

Você sempre pode verificar a integridade do cluster no Orbit Config Manager ➔ Replication ➔ status.

A arquitetura do senhasegura opera com duas bases de informações: uma, onde são armazenadas as configurações, e outra contendo os logs e vídeos gerados.

Configurando a Alta Disponibilidade

Para configurar um cluster de Alta Disponibilidade é necessário que todas instâncias do senhasegura estejam configuradas com as seguintes premissas:

  1. A licença de ativação deve estar aplicada a todas instâncias;

  2. Todas instâncias devem estar visíveis uma a outra através da rede;

  3. As portas TCP 22, 443, 3306, 4444, 4567, 4568, 9300 e UDP 4567 devem estar liberadas entre todas instâncias;

  4. A unidade de backup deve estar visível a todas instâncias;

  5. Apenas uma unidade deve estar ativa e com os serviços assíncronos ativos;

  6. Uma instância será escolhida como Primária após o processo de criação do cluster;

  7. Realize o backup dos dados e tenha um snapshot da instância como garantia de volta;

Tendo as premissas resolvidas. Todo restante da operação pode ser executado pela interface Orbit Web.

Configuração

caution

Durante o processo de configuração de cada instância, ela terá seu banco de dados reiniciado. É extremamente importante que você aguarde o restabelecimento da instância antes de iniciar a configuração do próximo membro de cluster. Não respeitar este tempo pode levar o cluster a um cenário de split-brain, onde ele não terá certeza de quais informações estão mais atualizadas dentre as instância. Este cenário, apesar de reversível, irá elevar o tempo de manutenção.

Para realizar a configuração, vá ao menu Orbit Config Manager ➔ Replicação ➔ Configuração. Nesta tela você irá executar os seguintes passos:

  1. Alterar o Modo de operação de Standalone para Cluster;

  2. Ativar a flag Ativar replicação

  3. Adicionar o IP de rede do primeiro membro do cluster no campo Membro primário;

  4. Adicionar o IP de rede demais membros nos campos seguintes;

  5. Atenção! A ordem de IPs registrados como primário e demais membros deve ser replicada em todas outras instâncias!

  6. Caso os membros estejam em diferentes datacenters, ative a flag Membros estão em diferentes datacenters;

  7. Neste caso, altere também a configuração de latência no campo Latência entre os membros e o seu identificador numérico único no campo Segmento de rede;

  8. Adicione no campo Mensagem de exibição da tela de recovery uma mensagem que será exibida a todos usuários em caso de falha do cluster;

  9. Ative a sincronização de arquivos com a flag Arquivos caso você deseje que os arquivos gerados por uma instância sejam encaminhados as demais instâncias utilizando rsync;

  10. Clique em salvar para finalizar a operação;


Visualize o status da replicação

Nesta tela você vai visualizar através dos logs gerados o status e funcionamento das instâncias e caso ocorram erros:

Em Orbit Config Manager ➔ Replicação ➔ Status onde podemos visuzalizar a situação da instância e com seguintes informações:

Servidor local

Estado da replicação: Desativada/Ativada

Tipo de instância: Primária/Segundária

Modo de operação: Ativa/inativa

Última sincronização: 18/12/2015 16:00:01

Token de autenticação: 85d4d3f2b2e3840179fa8327551690b6

Caso tenha um servidor remoto terá informações dele também.

Visualizar status do cluster do elasticsearch

Esta tela mostra o status do serviço de cluster do elasticsearch, fica no módulo Orbit Config Manager ➔ Replicação ➔ Elasticsearch:

Data search cluster

Status: trás informações sobre o funcionamento da instância.

Uuid: é um identificador universalmente exclusivo da instância.

Size: é quantidade de instâncias.

Master: é um identificador da instância master no cluster.

Versão: mostra em qual versão esta instância se encontra.

Shards: é a quantidade de subconjunto de dados fragmentados ou partes para um cluster fragmentado. Que formam juntos todos os dados do cluster.

State Uuid: é um identificador do estado da instância no cluster.

Timed out: informa se ocorreu algum erro durante o tempo e se instância demorou para ter uma resposta do cluster.

Membros do cluster

Index: é um identificador único do index da instância do cluster.

Nome: é o nome da aplicação do cluster.

Ephemeral: é um identificador efêmero da instância do cluster.

Address: mostra o IP e a Porta da instância.

Indexes

Nome: trás os nomes dos logs que foram gerados pela instância.

Uuid Total: é um identificador único referente aquele log gerado.

Size: é o tamanho do log que foi gerado pelo sistema.

Health: mostra se o log está funcionando corretamente.

Status: trás informações sobre o funcionamento da instância.


Chaveamento automático de instâncias

As instâncias do senhasegura podem ser remotamente ativadas e inativadas através de requisições HTTP que podem ser realizadas a partir de seu load balancer. Este controle permite uma instância que esteja em manutenção, que esteja indisponível por algum motivo, não seja considerado no redirecionamento de cargas.

Para configurar IPs permitidos a realizar tal consulta e operação, você deve cadastrar a relação de IPs no campo Ativação remota do sistema do menu Orbit Config Manager ➔ Configurações ➔ Recovery.

  1. Nessa tela, ative o indicador Permitir ativação remota do sistema

  2. Adicione a relação de IPs permitidos a realizar a requisição no campo IPs de origem permitidos para ativação remota do sistema

  3. Salve a operação com o botão Salvar

caution

Realize essa operação em todos membros do cluster.

A partir deste momento, os IPs cadastrados poderão acessar a URL de monitoramento GET /flow/orbit/mntr. Ex: https://mysenhasegura/flow/orbit/mntr.

Essa URL irá responder o atual estado da instância. Podendo variar entre:

  • HTTP 200: Aplicação ativa e disponível para uso dos usuários
  • HTTP 403: Aplicação ativa mas indisponível para uso dos usuários
  • HTTP 451: Licença de ativação expirada
  • HTTP 503: Aplicação indisponível

Desta forma, em um caso prático, caso o administrador inative a aplicação de uma instância, esta passa a responder HTTP 403 para o load balancer, que por sua vez não irá mais encaminhar tráfego para essa instância. Assim como se alguma instância perder comunicação entre outros membros do cluster, e por conta disso, indisponibilizar o banco de dados, essa instância irá responder HTTP 503 ao load balancer, que não irá mais encaminhar tráfego para essa instância.


Ativação e inativação automática de instâncias

Outro controle interessante é permitir que um sistema externo controle quais instâncias devem ser ativadas e inativadas automaticamente. Imagine um cenário onde a carga de uma rede inteira deve ser redirecionada para um datacenter de contingência. É interessante que a instância deste datacenter alvo esteja ativo e pronto para receber a carga de requisições, e que a antiga instância de produção perca seu papel de principal.

Desta forma, é possível você realizar o chaveamento entre os papéis das instâncias através da URL de ativação/inativação.

Activate

GET /flow/orbit/mntr/activate

Realiza a ativação da instância para uso dos usuários desde que a licença de ativação esteja válida. Se executado com sucesso, a instância que antes executava o papel de Primária no cluster, perde sua relevância e esta nova instância recebe o título de Primária. As demais instâncias não serão inativadas automaticamente.

Exemplo: https://mysenhasegura/flow/orbit/mntr/activate.

Deactivate

GET /flow/orbit/mntr/deactivate

Realiza a inativação da instância para uso dos usuários. Caso essa instância seja a Primária, ela será inativada sem eleger nenhum outro membro do cluster como o novo Primário. Essa ação também não irá ativar as demais instâncias caso elas estejam inativas.

Exemplo: https://mysenhasegura/flow/orbit/mntr/deactivate.

caution

Tenha sempre o controle de quais instâncias estão ativas e inativas no cluster. Não corra o risco de inativar todas instâncias acidentalmente, ocasionando uma interrupção nas operações dos usuários.