Gestão de Incidentes

Olá Pessoal, depois de merecidas férias, estou novamente na área!!

suporte

Dando prosseguimento aos nossos 10 processos e 1 função do ITIL, irei comentar hoje sobre um dos seus principais processos da central de serviços, que geralmente é o primeiro implementado: a Gestão de Incidentes, que irei me referir simplesmente como GI.

Um incidente é qualquer evento que indisponibilize total ou parcialmente um serviço: Um banco de dados parado, um sistema fora do ar, lentidão na rede e outros. O processo de GI é responsável por restaurar o mais rápido possível um serviço/incidente com o mínimo de impacto para o negócio. Vou dar um exemplo: Há um servidor rodando um banco de dados que é à base do ERP da empresa XYZ, e de repente o banco de dados pára por falta de espaço em disco. A gestão de incidentes neste caso seria responsável pela liberação de espaço em disco, de forma que o banco de dados pudesse voltar a operar.

Aí vocês poderiam me perguntar: mas como garantir que isto não irá ocorrer novamente? Como dito, a missão da gestão de incidentes é restaurar o serviço o mais rápido possível. Investigar a causa do evento e tomar medidas para que isto não volte a ocorrer são responsabilidades da Gestão de Problemas e Gestão de Capacidade, portanto neste caso a equipe da GI iria informar a gestão de problemas e capacidade sobre o ocorrido. O importante se é ter em mente que a GI se preocupa em restaurar serviços o mais rápido possível. É missão da GI as atividades descritas no post sobre central de serviços. A GI é o processo da central de serviços mais visível para os usuários pois, é geralmente o primeiro ponto de contato entre usuários e equipe de TI.

Um item importante no registro de incidentes é sua classificação. Você pode criar níveis de criticidade para os incidentes, com base no impacto (quantas pessoas/sistemas estão sendo afetados) e na urgência (o quão rápido precisa ser restabelecido) do evento. Com base nisto, fica mais claro saber o que precisa ser atendido primeiro. Atenção na questão de impacto e urgência: um incidente que impacte o trabalho de uma pessoa pode ser mais crítico do que uma incidente que impacte 10! Um exemplo: a execução do faturamento do mês está com problemas, e uma pessoa apenas é responsável por esta tarefa, isto pode ser considerado mais urgente do que 10 pessoas que não conseguem acessar uma pasta pública no seu file Server.

Caso sua área de TI trabalhe com algum tipo de SLA (service level agreement) ou simplesmente Acordo de Nível de Serviço, a GI é responsável em avisar seus superiores (escala hierárquica) e/ou equipe de Gestão de Níveis se Serviço que certo incidente não será resolvido dentro do tempo X, ou do tempo contratado, para que o mesmo tome as providências necessárias para que a TI não seja penalizada pelo tempo de atendimento acima do previamente acordado.

É interessante que, juntamente com a implementação da GI um sistema de BDCG seja criado. Um BDCG (Banco de Dados de Configuração) é um “mapa” que contém os ativos de TI e seus relacionamentos, quase como um inventário dos ativos da empresa, isto é importante pois:

  • Faz com que a determinação de impacto e urgência de um incidente seja mais rápida;
  • Facilita saber onde pode estar a falha no serviço;
  • Ajuda a avaliar o impacto de uma atualização de software e/ou hardware.

Para que o BDGC se mantenha atualizado, é importante a implementação da gestão de Mudanças, ou pelo menos um controle onde qualquer alteração na estrutura seja informada a pessoa responsável em atualizar o BDGC. O BDGC pode ser desde um software próprio para este fim ou mesmo uma planilha do Excel. Pois imaginem que analisar um incidente sobre um item de configuração (hub, switch, hardwares) que não existe mais na estrutura, atrapalha e atrasa a resolução do incidente!

Junto com o BDCG é importante para se ter uma Gestão de Incidentes eficiente uma base de conhecimento, ela é importante pois:

  • Irá armazenar Erros Conhecidos, soluções de contorno e resoluções.
  • Irá ajudar a resolver os incidentes de forma mais rápida pois, a solução de muitos incidentes podem já estar registradas.

Adiante, uma matéria da computerworld muito interessante sobre os benefícios do BDGC (http://computerworld.uol.com.br/governanca/2008/02/19/aprenda-a-tornar-o-itil-real/).

O mais importante de tudo: Registrem tudo!!!

Um grande abraço e ótimo 2009!!!

Emerson Dorow

Mais artigos deste autor »

Certificado em ITILv2 Foundation, Cobit v4.1 Foundation, Linux Professional Institute (LPI) Nível 1 e IBM Tivoli Monitoring Deployment V6.2 Professional. É graduado em Sistemas de Informação pela Uniasselvi Blumenau e pós-graduando em Governança de TI pelo Senac Florianópolis, e atua como Administrador de Sistemas Tivoli e suporte Linux/UNIX na Senior Sistemas na área de Infra-Estrutura. Estudioso de assuntos referentes Gestão de Serviços de TI e Governança de TI e tecnologia em geral.


6 Comentários

Gustavo Oliveira
1

Grande post Emerson,
Como iniciante na implantação de ITIL é sempre bom relembrar conceitos ainda mais sendo certificado porém não trabalhando diretamente com isso.

t+

Deixe seu comentário

Seu endereço de e-mail não será publicado. Campos com * são obrigatórios!


× 5 = cinco

Você pode usar estas tags e atributos de HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>