Follow Techotopia on Twitter

On-line Guides
All Guides
eBook Store
iOS / Android
Linux for Beginners
Office Productivity
Linux Installation
Linux Security
Linux Utilities
Linux Virtualization
Linux Kernel
System/Network Admin
Programming
Scripting Languages
Development Tools
Web Development
GUI Toolkits/Desktop
Databases
Mail Systems
openSolaris
Eclipse Documentation
Techotopia.com
Virtuatopia.com

How To Guides
Virtualization
General System Admin
Linux Security
Linux Filesystems
Web Servers
Graphics & Desktop
PC Hardware
Windows
Problem Solutions

  




 

 

NOTE: CentOS Enterprise Linux is built from the Red Hat Enterprise Linux source code. Other than logo and name changes CentOS Enterprise Linux is compatible with the equivalent Red Hat version. This document applies equally to both Red Hat and CentOS Enterprise Linux.
Linuxtopia - CentOS Enterprise Linux Introduction a l'administration systeme - Pr�paration � un sinistre

Chapitre 8. Pr�paration � un sinistre

Il est relativement facile pour un administrateur syst�me d'oublier de se pr�parer � un �ventuel un sinistre — ce n'est en effet pas une t�che plaisante et il semble toujours y avoir quelque chose de plus urgent � faire. N�anmoins, la n�gligence en mati�re de pr�paration � un sinistre est une des pires choses qu'un administrateur syst�me puisse faire.

Bien que les terribles sinistres soient souvent ceux qui viennent � l'esprit en premier (tels que les incendies, les inondations ou les orages), les probl�mes les plus banals (tels que la coupure accidentelle de c�bles par des ouvriers du b�timent ou m�me le d�bordement d'un �vier) peuvent s'av�rer tout aussi perturbateurs. Dans de telles circonstances, la d�finition du concept de sinistre qu'un administrateur syst�me doit garder � l'esprit est la suivante�: tout �v�nement impr�vu pouvant perturber le fonctionnement normal de l'entreprise.

Alors qu'il est absolument impossible de dresser la liste de tous les diff�rents types de sinistres pouvant se produire, cette section examine les facteurs principaux faisant partie de chaque type de sinistre afin que toute confrontation possible � un sinistre puisse �tre analys�e, non pas en termes de probabilit� de la situation, mais en termes des facteurs r�els qui pourraient entra�ner un sinistre.

8.1. Types de sinistres

En g�n�ral, quatre facteurs diff�rents pouvent engendrer un sinistre, � savoir�:

  • des pannes mat�rielles

  • des pannes logicielles

  • des pannes environnementales

  • des erreurs d'origine humaine

8.1.1. Pannes mat�rielles

Les pannes mat�rielles elles-m�mes sont faciles � comprendre — le mat�riel tombe en panne et arr�te toute activit�. Les aspects les plus difficiles � comprendre sont la nature des pannes et la mani�re de minimiser votre contact avec ces pannes. Ci-apr�s figurent certaines des approches que vous pouvez utiliser pour limiter l'impact d'un �ventuel sinistre.

8.1.1.1. Stockage de mat�riel de rechange

Dans le cas le plus simple, une exposition due � des probl�mes mat�rielles peut �tre r�duite en gardant du mat�riel de rechange. �videmment, cette approche suppose deux choses�:

  • D'une part, qu'une personne sur place dispose des comp�tences n�cessaires pour diagnostiquer le probl�me, identifier le mat�riel d�faillant et le remplacer.

  • D'autre part, que du mat�riel de rechange soit disponible pour le mat�riel d�faillant.

Ces aspects sont abord�s de mani�re plus d�taill�e dans les sections suivantes.

8.1.1.1.1. Comp�tences ad�quates

Selon votre exp�rience pass�e et le mat�riel utilis�, le fait de disposer des connaissances n�cessaires ne sera peut-�tre pas un probl�me. Toutefois, si vous n'avez pas travaill� avec du mat�riel dans le pass�, vous souhaiterez peut-�tre consulter des institutions d'enseignement de votre communaut� locale pour explorer l'�ventail des cours d'introduction consacr�s � la r�paration de PC. Bien qu'un tel cours ne soit pas en soi et par lui-m�me suffisant pour vous pr�parer � affronter des probl�mes avec des serveurs de niveau entreprise, il repr�sente n�anmoins une excellente mani�re d'acqu�rir des connaissances de base en la mati�re (telles que la bonne manipulation des outils et composants, proc�dures �l�mentaires de diagnostic, etc.).

TuyauAstuce
 

Avant d'adopter une approche consistant � effectuer d'abord les r�parations vous-m�me, assurez-vous que le mat�riel en question�:

  • n'est plus sous garantie

  • n'est couvert par aucun contrat d'assistance/maintenance

Si vous tentez d'effectuer des r�parations sur du mat�riel couvert par une garantie et/ou un contrat d'assistance, vous serez probablement en infraction avec les conditions de ces accords et risquerez par l�-m�me de compromettre la couverture continue de votre mat�riel.

Toutefois, m�me en disposant d'un minimum de comp�tences, il sera peut-�tre possible de bien diagnostiquer et remplacer le mat�riel d�faillant — � condition que vous choisissiez correctement votre stock de rechange

8.1.1.1.2. Que stocker�?

Cette question illustre la nature � facettes multiples de toute t�che en relation avec la r�cup�ration apr�s un sinistre. Lorsque vous consid�rez le mat�riel � stocker, gardez � l'esprit les �l�ments suivants�:

  • La dur�e maximum du temps d'indisponibilit� possible

  • Les comp�tences n�cessaires pour effectuer la r�paration

  • Le budget disponible pour des pi�ces de rechange

  • L'espace n�cessaire pour le stockage des pi�ces de rechange

  • Tout autre mat�riel qui pourrait utiliser les m�mes pi�ces de rechange

Chacun de ces aspects a une influence sur les diff�rents types de pi�ces de rechange qui devraient �tre stock�s. Par exemple, le stockage de syst�mes complets pourrait minimiser le temps d'indisponibilit� et leur installation ne n�cessite que des comp�tences minimales, mais une telle strat�gie serait beaucoup plus co�teuse que le stockage d'un module CPU et RAM de rechange sur une �tag�re. Cette d�pense est n�anmoins peut-�tre justifiable si votre entreprise dispose de plusieurs dizaines de serveurs identiques qui pourraient profiter d'un seul syst�me de rechange.

Ind�pendamment de la d�cision finale, la question suivante, abord�e ci-apr�s, est in�vitable.

8.1.1.1.2.1. Quelle quantit� de mat�riel doit �tre stock�e�?

Cette question des niveaux de stock pour le mat�riel de rechange a �galement de multiples facettes. Toutefois, les principaux aspects sont les suivants�:

  • La dur�e maximum du temps d'indisponibilit� possible

  • L'estimation du taux de panne

  • L'estimation de la dur�e n�cessaire au r�approvisionnement du stock

  • Le budget disponible pour des pi�ces de rechange

  • L'espace n�cessaire pour le stockage des pi�ces de rechange

  • Tout autre mat�riel qui pourrait utiliser les m�mes pi�ces de rechange

Dans le cas extr�me o� un syst�me peut �tre indisponible pour un maximum de deux jours et o� une pi�ce de rechange ne serait probablement utilis�e qu'une fois par an avec la possibilit� de r�approvisionner le stock en un jour, il semblerait raisonnable de ne disposer que d'une pi�ce de rechange (voire aucune, dans le cas o� vous auriez la certitude de pouvoir obtenir une pi�ce de rechange en 24 heures).

Dans le cas extr�me inverse, si un syst�me ne peut pas se permettre d'�tre indisponible pendant plus de quelques minutes et si une pi�ce de rechange sera peut-�tre utilis�e une fois par mois (et qu'une nouvelle acquisition pourrait prendre plusieurs semaines), il serait judicieux de conserver sur les �tag�res une demi-douzaine de pi�ces de rechange (voire plus).

8.1.1.1.3. Pi�ces de rechange qui ne sont pas vraiment des pi�ces de rechange

Dans quel cas une pi�ce de rechange n'est pas vraiment une pi�ce de rechange�? Dans le cas de mat�riel qui est utilis� tous les jours mais sert �galement de pi�ce de rechange pour un syst�me ayant une priorit� sup�rieure, le cas �ch�ant. Cette approche pr�sente un certain nombre d'avantages, � savoir�:

  • Un budget moindre est allou� � des pi�ces de rechange "non-productives"

  • Le mat�riel est consid�r� comme op�rationnel

Il existe n�anmoins certains inconv�nient associ�s � cette approche, � savoir�:

  • Le d�roulement normal de la t�che ayant la priorit� la plus basse est interrompu

  • Un risque de sinistre existe en cas de panne du mat�riel ayant la propri�t� la plus basse (et dans ce cas, le mat�riel dot� de la propri�t� la plus haute est d�pourvu de pi�ce de rechange)

Dans de telles conditions, il se peut que l'utilisation d'un autre syst�me de production comme rechange soit possible, mais le succ�s de cette approche d�pend d'une part de la charge de travail sp�cifique du syst�me et d'autre part, de l'impact que l'absence du syst�me a sur les op�rations g�n�rales du centre de donn�es.

8.1.1.2. Contracts d'assistance

Gr�ce aux contracts d'assistance, le probl�me des pannes mat�rielles est du ressort d'une autre personne. La seule chose � faire dans ce cas est de confirmer qu'une panne s'est bien produite et qu'elle ne semble pas �tre d'origine logicielle. Il vous suffit alors de passer un coup de fil et quelqu'un se rendra sur place pour r�soudre le probl�me.

Cette situation semble tellement simple. Mais comme c'est le cas avec la plupart des choses dans la vie, ce n'est qu'un aspect de la situation. Ci-apr�s figurent certaines des choses que vous devez prendre en consid�ration lors de l'examen d'un contrat d'assistance�:

  • Heures de couverture

  • Temps de r�ponse

  • Disponibilit� des pi�ces

  • Budget disponible

  • Mat�riel � couvrir

Chacun de ces points sera examin� de mani�re plus d�taill�e dans les sections suivantes.

8.1.1.2.1. Heures de couverture

Il existe diff�rents contrats d'assistance r�pondant � diff�rents besoins�; en la mati�re, les heures de couverture constituent un point essentiel sur lequel les diff�rents contrats varient. � moins que vous ne soyez pr�t � payer un suppl�ment pour le privil�ge, vous ne pouvez pas prendre le t�l�phone � tout moment et esp�rer voir le technicien arriver dans votre entreprise aussit�t apr�s.

En fait, selon votre contrat, vous ne pourrez peut-�tre m�me pas t�l�phoner � la soci�t� d'assistance avant un jour ou une heure sp�cifiques, ou si vous pouvez appeler la soci�t�, vous ne recevrez pas la visite du technicien avant le jour ou l'heure figurant dans votre contrat.

Dans la plupart des contrats, les heures de couverture sont d�finies en termes d'heures et de jours pendant lesquels un technicien peut �tre envoy� sur place. Les heures de couverture les plus courantes sont les suivantes�:

  • Du lundi au vendredi, de 09:00 � 17:00

  • Du lundi au vendredi, tous les jours pendant 12/18/24 heures (avec une heure de commencement et de fin de couverture �tablie d'un commun accord)

  • Du lundi au samedi (ou du lundi au dimanche), m�mes heures que ci-dessus

Comme vous vous en doutez, le co�t d'un contrat augmente en fonction des heures de couverture. D'une mani�re g�n�rale, l'allongement des heures de couverture du lundi au vendredi co�te moins cher que l'inclusion du samedi et dimanche.

� ce niveau cependant, il est possible de r�duire les co�ts si vous �tes pr�t � effectuer certaines t�ches.

8.1.1.2.1.1. Assistance en atelier

Si dans votre situation vous ne n�cessitez que la disponibilit� d'un technicien pendant les heures de bureau normales et que vous avez suffisamment d'exp�rience pour pouvoir d�terminer ce qui ne fonctionne pas, vous voudrez peut-�tre consid�rer l'assistance en atelier. Ce type d'assistance est connu sous de nombreux noms y compris assistance walk-in (assistance fournie lorsque la personne se d�place) et assistance drop-off (assistance fournie lorsque l'�l�ment posant probl�me est amen� � l'atelier) et le fabricant dispose peut-�tre d'ateliers d'assistance o� les techniciens travaillent sur du mat�riel apport� par les clients.

L'assistance en atelier a l'avantage d'�tre aussi rapide que le temps qu'il vous faut pour vous rendre � l'atelier. Vous n'avez pas � attendre qu'un technicien soit disponible et se pr�sente dans votre entreprise. �tant donn� que les techniciens de l'atelier n'interviennent pas en dehors de l'atelier en r�ponse � l'appel d'un client, l'un d'eux sera toujours disponible pour travailler sur votre mat�riel et ce, d�s que vous pourrez le d�poser � l'atelier.

�tant donn� que l'assistance en atelier est fournie en un seul endroit, il y a de grandes chances pour que toute pi�ce dont vous auriez besoin y soit disponible. Ainsi, il ne sera pas n�cessaire d'envoyer cette pi�ce du jour au lendemain dans un autre atelier ou d'attendre que la pi�ce en question soit achemin�e depuis un autre atelier qui l'a justement en stock et qui se trouve � plusieurs centaines de kilom�tres de votre entreprise.

Ceci �tant, il existe un certain nombre de contraintes. La plus �vidente est que vous ne pouvez pas choisir les heures d'assistance — vous pouvez obtenir une assistance lorsque l'atelier est ouvert. De plus, les techniciens ne travaillant pas au-del� de leurs heures normales, si votre syst�me tombe en panne � 16.30 heures un vendredi et que vous arrivez � l'apporter � l'atelier juste avant 17.00 heures, les techniciens ne s'en occuperont pas avant de reprendre le travail le lundi suivant.

Une autre contrainte est que l'assistance en atelier d�pend de l'existence d'un atelier � proximit�. Si votre entreprise se trouve dans une zone m�tropolitaine, ce ne sera probablement pas un probl�me, En revanche, pour des entreprises se trouvant dans des zones plus rurales, l'atelier se trouvera peut-�tre � des centaines de kilom�tres.

TuyauAstuce
 

Si vous envisagez d'utiliser une assistance en atelier, consid�rez bien la chose et prenez en consid�ration les �l�ments logistiques associ�s � l'acheminement du mat�riel vers l'atelier. Utiliserez-vous une voiture de la soci�t� ou votre voiture personnelle�? Dans le cas o� vous utiliseriez votre voiture, cette derni�re est-elle suffisamment grande et peut-elle supporter le poids du syst�me�? Quelles sont les implications au niveau de l'assurance�? Faudra-t-il plusieurs personnes pour charger et d�charger le mat�riel�?

Bien que ces pr�occupations soient quelque peu banales, elles devraient �tre consid�r�es avant de prendre la d�cision de recourir � une assistance en atelier.

8.1.1.2.2. Temps de r�ponse

Outre les heures de couverture, de nombreux accords d'assistance stipulent un certain niveau de r�ponse. En d'autres termes, combien de temps s'�coulera-t-il entre le moment o� vous t�l�phonez et l'arriv�e du technicien�? Comme vous pouvez facilement vous en douter, plus le temps de r�ponse est court, plus l'accord d'assistance est cher.

Il y a des limites aux temps de r�ponse disponibles. Par exemple, le temps de transport pour aller des bureaux du fabricant � votre entreprise influence �norm�ment l'�ventail de temps de r�ponse possibles[1]. Des temps de r�ponse se situant dans une fourchette de z�ro � quatre heures sont g�n�ralement per�us comme faisant partie des offres les plus rapides. Des temps de r�ponse plus longs peuvent s'�chelonner entre huit heures (qui en fait devient une assistance "le jour suivant" dans le cas d'un accord bas� sur des heures de bureau normales) et 24 heures. Comme pour tous les autres aspects d'un accord d'assistance, m�me ces temps de r�ponse sont n�gociables — moyennant paiement cela va de soi.

NoteRemarque
 

Bien qu'il ne s'agisse pas d'une situation fr�quente, il est important de savoir que des accords d'assistance incluant des closes relatives au temps de r�ponse peuvent parfois engager la soci�t� d'assistance au-del� de sa capacit� � r�pondre. Il n'est pas rare qu'une soci�t� d'assistance tr�s demand�e envoie quelqu'un — n'importe qui — lors d'un appel soumis � un temps de r�ponse court, rien que pour honorer son engagement quant au temps de r�ponse. Cette personne disgnostique apparemment le probl�me en t�l�phonant soi-disant "au bureau" afin que quelqu'un apporte la "pi�ce n�cessaire."

En fait, la personne attend simplement qu'une personne vraiment capable de r�soudre le probl�me arrive sur place.

Alors qu'il est tout � fait compr�hensible que cette situation se produise dans des circonstances extraordinaires (telles que lors de probl�mes d'alimentation qui ont endommag�s les syst�mes dans tout le service d'assistance de la soci�t�), si cette situation correspond au service que vous recevez syst�matiquement, vous devriez contacter le directeur de l'assistance et exiger des explications.

Si vos temps de r�ponse sont peu flexibles (et que vous disposez en cons�quence d'un gros budget), une certaine approche peut vous permettre de r�duire consid�rablement votre temps de r�ponse— en fait, � z�ro.

8.1.1.2.2.1. Temps de r�ponse nul — Disponibilit� de techniciens sur place

En supposant que vous vous trouviez dans la situation appropri�e (vous �tes un des plus grands clients de la r�gion), que vos besoins soient tr�s exigeants (un temps d'indisponibilit� de tout ordre �tant inacceptable) et que vos ressources financi�res soient ad�quates (s'il est n�cessaire de demander le prix, vous ne pouvez probablement pas vous le permettre), il se peut que la disponibilit� d'un technicien sur place � plein temps soit une option. Les avantages de la pr�sence d'un technicien toujours sur place sont �vidents�:

  • R�ponse imm�diate � tout probl�me

  • Approche plus proactive en mati�re de maintenance de syst�me

Comme vous pouvez vous en douter, cette option peut �tre tr�s co�teuse, particuli�rement si vous avez besoin d'un technicien sur place 24 heures sur 24, 7 jours sur 7. Mais si cette approche est ad�quate pour votre entreprise, vous devriez garder � l'esprit un certain nombre de points importants afin de maximiser les avantages.

Tout d'abord, des techniciens faisant partie de l'entreprise ont besoin d'une grande partie des ressources qu'un employ� normal utilise, tel que de l'espace de travail, un t�l�phone, des cartes d'acc�s appropri�es et/ou des cl�s etc.

Des techniciens travaillant dans l'entreprise ne sont pas tr�s utiles s'ils ne disposent pas des pi�ces requises. Il est donc important de bien r�server un lieu de stockage s�r o� entreposer les pi�ces de rechange des techniciens. De plus, assurez-vous que votre technicien dispose bien d'un stock de pi�ces appropri�es � votre configuration et que ces pi�ces ne sont pas syst�matiquement "pill�es" par d'autres techniciens subvenant aux besoins de leurs propres clients.

8.1.1.2.3. Disponibilit� des pi�ces

Il va de soi que la disponibilit� des pi�ces joue un r�le important dans l'exposition de votre entreprise � des pannes de mat�riel. Dans le cadre d'un accord d'assistance, la disponibilit� des pi�ces prend une autre dimension dans la mesure o� elle ne s'applique pas seulement � votre entreprise mais �galement � tout autre client faisant partie de la r�gion du fabricant ayant aussi besoin de ces m�mes pi�ces. Il se peut qu'une autre entreprise ayant achet� plus de mat�riel que la votre se voie accorder un traitement pr�f�rentiel quant il s'agit d'obtenir des pi�ces (et m�me des techniciens).

Malheureusement, dans de telles circonstances, il n'y a pas grand chose � faire, mis � part r�soudre le probl�me avec le directeur de l'assistance.

8.1.1.2.4. Budget disponible

Comme nous l'avons soulign� pr�c�demment, les contrats d'assistance varient au niveau des prix en fonction de la nature du service fourni. Rappelez-vous que les co�ts associ�s � un contrat d'assistance repr�sentent des d�penses r�currentes�; ainsi, chaque fois que le contrat arrive � �ch�ance, vous devez en ren�gocier un autre et payer � nouveau.

8.1.1.2.5. Mat�riel � couvrir

C'est � ce niveau que vous pourrez peut-�tre r�ussir � r�duire les d�penses au minimum. Imaginez un instant que vous ayez n�goci� un accord d'assistance offrant la pr�sence d'un technicien sur place 24 heures sur 24, 7 jours sur 7 et le stockage de pi�ces de rechange sur place — bref, une assistance haut de gamme. Toute pi�ce de mat�riel achet�e aupr�s de ce revendeur est couverte, y compris le PC que la s�cr�taire de l'entreprise utilise pour effectuer des t�ches dont l'importance n'est pas critique.

Pour ce PC, est-il vraiment n�cessaire d'avoir un technicien sur place 24 heures sur 24, 7 jours sur 7�? M�me dans le cas o� ce PC serait d'une importance absolument vital pour le travail de la r�ceptionniste, elle ne travaille que de 09:00 heures � 17:00 heures�; il est donc tr�s peu probable que�:

  • Le PC sera utilis� entre 17:00 heures et 09:00 heures le lendemain matin (sans parler des week-ends)

  • Une panne de ce PC fera une diff�rence quelconque, sauf entre 09:00 heures et 17:00 heures

Dans de telles circonstances, d�penser de l'argent en pensant � l'�ventualit� que ce PC puisse n�cessiter une assistance au milieu de la nuit un samedi soir est en fait un v�ritable gaspillage d'argent.

La meilleure solution dans ce cas consiste � s�parer l'accord d'assistance de mani�re � ce que le mat�riel qui n'a pas une importance critique soit regroup� s�par�ment du mat�riel � fonction vitale. De cette mani�re, les co�ts peuvent �tre r�duits au minimum.

NoteRemarque
 

Si vous avez vingt serveurs configur�s de mani�re identique remplissant une fonction critique pour votre entreprise, vous serez peut-�tre tent� d'�tablir un accord offrant une assistance �lev�e seulement pour un ou deux serveurs, alors que les autres seront couverts par un accord beaucoup moins cher. L'id�e �tant ensuite de dire que le serveur d�faillant pendant un week-end, quel qu'il soit, est en fait le serveur couvert par le contrat d'assistance �lev�e.

N'adoptez surtout pas cette approche. Elle est d'une part malhonn�te et d'autre part, la plupart des fabricants utilisent les num�ros de s�rie pour identifier les �l�ments couverts par le contrat. M�me si vous arrivez � contourner ces �l�ments de v�rification, une fois votre malhonn�tet� d�couverte, cette approche finira par co�ter beaucoup plus cher que si vous aviez �t� honn�te d�s le d�part et aviez pay� le montant requis pour le type d'assistance dont vous avez besoin.

8.1.2. Pannes logicielles

Les pannes logicielles peuvent entra�ner des temps d'indisponibilit� plus longs. Par exemple, les propri�taires de syst�mes informatiques d'une certaine marque, pourtant bien connue pour ses caract�ristiques en mati�re de haute disponibilit�, ont fait l'exp�rience d'une telle situation. En effet, un bogue dans le code de traitement du temps du syst�me d'exploitation de l'ordinateur a entra�n� un plantage des syst�mes des clients � une certaine heure, un certain jour. Alors que cette situation pr�cise corresponde plus � un exemple concret de l'impact consid�rable d'une panne logicielle, d'autres pannes d'origine logicielle peuvent avoir des cons�quences certes moins dramatiques, mais n�anmoins d�vastatrices.

Les pannes logicielles peuvent se produire � l'un des deux niveaux suivants�:

  • Syst�me d'exploitation

  • Applications

Chacun des deux types de pannes entra�ne des cons�quences sp�cifiques qui sont abord�es en d�tails dans les sections suivantes.

8.1.2.1. Pannes du syst�me d'exploitation

Dans ce type de panne, le syst�me d'exploitation est � l'origine de l'interruption du service. Des pannes de syst�me d'exploitation ont deux origines�:

  • Plantage du syst�me (ou crash)

  • Suspension du syst�me (ou hang)

Le point essentiel � garder � l'esprit est que les pannes du syst�me d'exploitation interrompent toutes les t�ches que l'ordinateur effectuait au moment de la panne. Les pannes peuvent donc avoir des cons�quences d�vastatrices pour la production.

8.1.2.1.1. Plantage du syst�me (ou crash)

Les plantages (ou crashes) se produisent lorsque le syst�me d'exploitation doit faire face � un nombre d'erreurs tellement important qu'il ne peut faire face � la situation. Les causes des plantages peuvent aller d'une incapacit� � r�soudre les probl�mes mat�riels sous-jacents, � un bogue dans le code au niveau du noyau qui compromet le syst�me d'exploitation. Lors du plantage d'un syst�me d'exploitation, il est n�cessaire de le red�marrer afin de pouvoir poursuivre la production.

8.1.2.1.2. Suspension du syst�me (ou hang)

Lorsque le syst�me d'exploitation s'arr�te de traiter les �v�nements du syst�me, le syst�me est mis � l'arr�t. Cette situation est connue sous le terme de hang ou syst�me suspendu. Ces situations peuvent se produire par des interblocages de type deadlocks (deux consommateurs de ressources essayant d'utiliser la ressource de l'autre) et livelocks (deux ou plusieurs processus r�pondant � leurs activit�s mutuelles, mais n'effectuant en fait aucun travail utile) produisant le m�me r�sultat final — un manque total de productivit�.

8.1.2.2. Pannes des applications

Contrairement aux pannes du syst�me d'exploitation, les d�faillances d'applications peuvent avoir des cons�quences plus limit�es au niveau des d�g�ts caus�s. Selon la nature sp�cifique de l'application, sa d�faillance n'affectera peut-�tre qu'une personne. En revanche, s'il s'agit d'une application serveur r�pondant aux besoins d'un vaste groupe d'applications clientes, les cons�quences d'une panne seront beaucoup plus �tendues.

Les pannes d'applications, comme les d�faillances de syst�mes d'exploitation, peuvent �tre caus�es par des plantages (ou crashes) ou des suspensions d'activit� (hangs), la seule diff�rence r�sidant dans le fait que cette fois-ci, c'est l'application et pas le syst�me qui plante ou suspend son activit�.

8.1.2.3. Obtention d'assistance — Assistance logicielle

De la m�me mani�re que les revendeurs de mat�riel offrent une assistance pour leurs produits, de nombreux revendeurs de logiciels mettent � la disposition de leurs clients des paquetages d'assistance. Hormis les diff�rences �videntes (aucun mat�riel de rechange n'est requis et la plupart du travail n�cessaire peut �tre effectu� par t�l�phone par du personnel d'assistance) les contrats d'assistance logicielle peuvent �tre assez semblables � ceux d'assistance mat�rielle.

Tous les niveaux d'assistance fournis par un vendeur de logiciels ne sont pas identiques. Ci-apr�s figurent certaines des strat�gies d'assistance les plus couramment utilis�es de nos jours�:

  • Documentation

  • Auto-assistance

  • Assistance Web ou email

  • Assistance t�l�phonique

  • Assistance sur place

Chacun de ces types d'assistance est d�crit de mani�re plus d�taill�e dans les sections suivantes.

8.1.2.3.1. Documentation

Bien qu'�tant un aspect souvent n�glig�, la documentation des logiciels peut servir d'outil d'assistance de premier niveau. Qu'elle soit disponible en ligne ou sous une forme �crite, cette documentation contient souvent les informations n�cessaires � la r�solution de nombreux probl�mes.

8.1.2.3.2. Auto-assistance

L'auto-assistance suppose que le client utilise les ressources disponibles en ligne, afin de r�soudre leurs propres probl�mes d'origine logicielle. Tr�s souvent ces ressources existent sous la forme de FAQ (Forum Aux Questions) ou de bases de connaissances utilisant le Web.

Les FAQ n'ont souvent que peu ou pas de fonctionnalit�s de recherche, demandant ainsi au client de parcourir toutes les questions, une � une, dans l'espoir de trouver celle qui r�pond au probl�me � r�soudre. Les bases de connaissances ont tendance � �tre plus sophistiqu�es et permettent de faire des recherches en fonction d'un terme particulier. Ces derni�res pouvant �galement couvrir des domaines plus vastes, elles constituent d'excellent outils pour r�soudre des probl�mes.

8.1.2.3.3. Assistance Web et email

Bien souvent, un site Web qui ressemble � un site d'auto-assistance inclut �galement des formulaires bas�s sur le Web ou des adresses email auxquelles envoyer des questions � l'intentions du personnel d'assistance. Au premier abord, ce type de site constitue un v�ritable progr�s par rapport � un simple site Web d'auto-assistance, mais en r�alit�, tout d�pend des personnes r�pondant aux emails.

Si le personnel d'assistance est surcharg�, il est difficile d'obtenir de leur part les informations n�cessaires pour r�soudre le probl�me car leur premi�re pr�occupation est de r�pondre rapidement � chaque email afin de pouvoir passer au suivant. Cette situation existe car presque tout personnel d'assistance est �valu� en fonction du nombre de probl�mes qu'il r�sout. L'escalade des probl�mes � du personnel plus qualifi� est �galement une op�ration tr�s difficile car il n'est pas facile de forcer des r�ponses plus opportunes et utiles par le biais d'un email — particuli�rement lorsque la principale pr�occupation de la personne lisant votre email et d'y r�pondre aussi rapidement que possible afin de pouvoir traiter l'email suivant.

Le moyen d'obtenir la meilleure assistance possible consiste � aborder dans votre email, tous les aspects du probl�me dont un technicien d'assistance aurait besoin, tels que�:

  • Description claire et pr�cise de la nature du probl�me

  • R�f�rences � tous les num�ros de versions pertinents

  • Description de ce que vous avez d�j� fait afin d'essayer de r�soudre le probl�me (application des derniers correctifs, red�marrage avec une configuration minimale, etc.).

En fournissant au technicien d'assistance davantage d'informations, vous avez une meilleure chance d'obtenir l'assistance dont vous avez besoin.

8.1.2.3.4. Assistance t�l�phonique

Comme son nom l'indique, l'assistance t�l�phonique est offerte en t�l�phonant � un technicien d'assistance. Ce type d'assistance est tr�s semblable � l'assistance mat�rielle dans le sens o� diff�rents niveaux d'assistance peuvent �tre disponibles (avec diff�rentes heures de couverture, diff�rents temps de r�ponse, etc.).

8.1.2.3.5. Assistance sur place

Aussi connue sous le terme de service conseils sur place, l'assistance logicielle sur place est normalement r�serv�e � la r�solution de probl�mes sp�cifiques ou � l'apport de modifications critiques telles que l'installation et la configuration initiales de logiciels, des mises � niveau essentielles etc. Comme on pourrait s'y attendre, ce type d'assistance est l'option la plus co�teuse en mati�re d'assistance logicielle disponible .

Toutefois, il existe un certain nombre de situations dans lesquelles une assistance sur place est l'option ad�quate. � titre d'exemple, imaginez une petite entreprise employant un seul administrateur syst�me. Cette derni�re est sur le point de d�ployer son premier serveur de bases de donn�es, mais cette op�ration (et l'entreprise) n'est pas d'une envergure suffisante pour justifier l'emploi d'un administrateur de base de donn�es attitr�. Dans une telle situation, il est souvent meilleur march� de faire venir un sp�cialiste travaillant pour le vendeur de bases de donn�es afin qu'il effectue le d�ploiement initial (et de temps � autre dans le futur, selon les besoins), plut�t que de former l'administrateur syst�me pour une comp�tence qu'il n'utilisera que rarement.

8.1.3. Pannes environnementales

Bien que le mat�riel tourne parfaitement, et malgr� une configuration logicielle ad�quate et un fonctionnement normal, des probl�mes peuvent toujours survenir. Les probl�mes les plus courants qui se produisent en dehors du syst�me lui-m�me ont un lien avec l'environnement physique dans lequel le syst�me se trouve.

Les probl�mes environnementaux peuvent �tre regroup�s dans les quatre cat�gories principales suivantes�:

  • Int�grit� du b�timent

  • �lectricit�

  • Climatisation

  • Climat et environnement ext�rieur

8.1.3.1. Int�grit� du b�timent

Pour une structure si simple en apparence, un b�timent remplit de nombreuses fonctions. Il fournit un abri contre les �l�ments ext�rieurs (conditions climatiques). Il fournit le microclimat appropri� pour le contenu qu'il renferme. Il h�berge des m�canismes fournissant de l'�lectricit� et prot�geant contre les incendies, le vol et le vendalisme. Le b�timent remplissant toutes ces fonctions, il n'est pas �tonnant que de nombreux probl�mes puissent survenir. Ci-dessous figurent certaines situations possibles qu'il convient de prendre en consid�ration�:

  • Des fuites peuvent se produire dans le toit, laissant entrer de l'eau dans les centres de donn�es.

  • Dans le b�timent, diff�rents syst�mes (tels que les l'alimentation en eau, l'�puration ou la ventilation) peuvent tomber en panne, rendant les lieux inhabitables.

  • Les planchers n'ont peut-�tre pas une capacit� porteuse suffisante pour supporter l'�quipement que vous voulez mettre dans le centre de donn�es.

Il est important d'�tre imaginatif lors de l'�laboration des diff�rents sc�narios selon lesquels le b�timent pourrait �tre la cause de probl�mes. La liste pr�c�dente n'a pour intention que de lancer la r�flexion sur les bases appropri�es.

8.1.3.2. �lectricit�

�tant donn� que l'�lectricit� repr�sente l'�l�ment vital de tout syst�me informatique, les probl�mes li�s � l'�lectricit� ont une importance essentielle dans l'esprit des administrateurs syst�me, o� qu'ils soient. Les probl�mes li�s � l'�lectricit� prennent bien des aspects diff�rents�; ces derniers sont couverts de mani�re plus d�taill�e dans les sections suivantes.

8.1.3.2.1. S�curit� de votre alimentation �lectrique

Il est tout d'abord n�cessaire de d�terminer le niveau de s�curit� de votre alimentation �lectrique normale. Comme tout autre centre de donn�es, votre �lectricit� est probablement fournie par une soci�t� d'alimentation �lectrique locale au moyen de c�bles �lectriques. Pour cette raison, il existe certaines limitations quant aux mesures que vous pouvez prendre pour assurer que votre source d'alimentation �lectrique primaire soit aussi s�re que possible.

TuyauAstuce
 

Les entreprises se trouvant � la limite de la r�gion d�sservie par une soci�t� d'alimentation �lectrique seront peut-�tre en mesure de n�gocier des connexions � deux r�seaux diff�rents.

  • Celui desservant votre r�gion

  • Celui de la soci�t� d'alimentation �lectrique voisine

Les co�ts associ�s � l'installation de c�bles �lectriques depuis le r�seau voisin �tant relativement �lev�s, cette option n'est vraiment possible que pour les grandes entreprises. Toutefois, ces entreprises estiment qu'� bien des �gards, la redondance ainsi obtenue est bien sup�rieure aux co�ts de l'installation.

Les �l�ments essentiels � v�rifier sont les m�thodes selon lesquelles l'�lectricit� est achemin�e sur la propri�t� de votre entreprise et ensuite dans le b�timent. Les c�bles �lectriques sont-ils souterrains ou non�? Les lignes non souterraines sont susceptibles d'�tre endommag�es de diff�rentes mani�res�:

  • par des conditions climatiques extr�mes (glace, vent, �claires)

  • par des accidents de la circulation qui peuvent caus�s des d�g�ts aux poteaux et/ou transformateurs

  • par des animaux errant l� o� ils ne devraient pas ou raccourcissant les lignes

Ceci �tant, les c�bles �lectriques souterrains ont eux aussi des inconv�nients qui leur sont propres�:

  • Endommagement par des ouvriers du b�timent creusant au mauvais endroit

  • Inondations

  • �claires (bien que de mani�re plus rare que dans le cas des lignes �lectriques mont�es sur des poteaux)

Essayez de rep�rer les lignes �lectriques jusque dans votre b�timent. Est-ce qu'elles vont d'abord dans un transformateur externe�? Existe-t-il une protection contre des accidents caus�s par une voiture reculant dans le transformateur ou par un arbre tombant sur ce dernier�? Tous les interrupteurs de contr�le sont-ils prot�g�s contre une utilisation non autoris�e�?

Une fois ces lignes � l'int�rieur de votre b�timent, pourraient-elles (ou les panneaux auxquels elles sont branch�es) �tre la cause d'autres probl�mes�? Par exemple, un probl�me de plomberie pourrait-il inonder la chambre d'alimentation �lectrique�?

Continuez � suivre les lignes d'alimentation �lectrique jusqu'� l'int�rieur du centre de donn�es�; existe-t-il d'autres facteurs susceptibles d'interrompre votre alimentation en �lectricit�? Par exemple, le centre de donn�es partage-t-il un ou plusieurs circuits avec des charges associ�es � des centres ne fournissant pas de donn�es�? Si tel est le cas, il est fort possible qu'un jour, la charge externe d�clenche le m�canisme de protection contre les surtensions �lectriques faisant partie du circuit et entra�ne par l�-m�me une interruption de l'activit� du centre de donn�es.

8.1.3.2.2. Qualit� de l'�lectricit�

Il n'est pas suffisant de s'assurer que la source d'alimentation �lectrique du centre de donn�es est aussi s�re que possible. Il est �galement n�cessaire d'examiner la qualit� de l'�lectricit� distribu�e au sein du centre de donn�es. � cet �gard, un certain nombre de facteurs doivent �tre pris en consid�ration, y compris�:

Tension

La tension du courant arrivant doit �tre stable, sans aucune baisse (souvent appel�es chutes) ou augmentation (souvent appel�es pointes de courant) de tension.

Forme de l'onde

La forme de l'onde doit avoir l'aspect d'une onde sinuso�dale pure, avec une distortion harmonique totale (ou THD de l'anglaisTotal Harmonic Distortion) minimale.

Fr�quence

La fr�quence doit �tre stable (la plupart des pays utilisent une fr�quence �lectrique de 50Hz ou 60Hz).

Interf�rence

Le courant ne doit contenir aucune interf�rence radio (aussi appel�e RFI, de l'anglais Radio Frequency Interference) et aucune interf�rence �lectromagn�tique (ou EMI, de l'anglais Electro-Magnetic Interference).

Courant

L'�lectricit� doit �tre fournie � une charge �lectrique suffisante pour faire fonctionner le centre de donn�es.

L'�lectricit� fournie directement par la soci�t� d'alimentation �lectrique ne satisfait g�n�ralement pas les normes n�cessaires pour un centre de donn�es. Un certain niveau de traitement de l'�lectricit� est par cons�quent g�n�ralement n�cessaire. � cet �gard, les diff�rentes approches figurant ci-dessous peuvent �tre employ�es�:

Protecteurs de surtension

Les protecteurs de surtension — comme le nom l'indique, ils filtrent les pointes de tension dans l'alimentation �lectrique. La plupart d'entre eux n'ont aucune autre fonction et ne diminuent donc en aucun cas la vuln�rabilit� du mat�riel par rapport � tout autre probl�me d'origine �lectrique.

Conditionneurs �lectriques

Les conditionneurs �lectriques eux ont une fonction plus �tendue�; selon le degr� de sophistication du dispositif, les conditionneurs �lectriques r�pondent � la plupart des types de probl�mes soulign�s ci-dessus.

Groupes �lectrog�nes

Un groupe �lectrog�ne est essentiellement un gros moteur �lectrique aliment� par une source �lectrique normale. Le moteur est reli� � un gros volant qui est lui reli� � un g�n�rateur. Le moteur fait tourner le volant et le g�n�rateur, qui produit alors une quantit� d'�lectricit� suffisante pour faire fonctionner le centre de donn�es. De cette mani�re, l'�lectricit� du centre de donn�es est, d'un point de vue �lectrique, s�par�e de l'�lectricit� venant de l'ext�rieur, �liminant ainsi tout probl�me d'origine �lectrique. Le volant offre �galement la possibilit� de maintenir l'alimentation lors de courtes pannes de courant �tant donn� qu'il faut quelque seconde avant que le volant ne ralentisse au point de ne plus pouvoir produire d'�lectricit�.

Syst�mes UPS

Certains types d'UPS (de l'anglais Uninterruptible Power Supplies) incluent la plupart (sinon toutes) des fonctionnalit�s de protection d'un conditionneur �lectrique [2].

Avec les deux types de technologies mentionn�s ci-dessus, nous avons commenc� � aborder le sujet traversant l'esprit de la plupart des personnes lorsqu'elles pensent � l'alimentation �lectrique — alimentation �lectrique de secours. La section suivante examinera diff�rentes approches utilis�es pour fournir une alimentation �lectrique de secours.

8.1.3.2.3. Alimentation �lectrique de secours

Dans le cadre de l'alimentation �lectrique, tout le monde a d�j� entendu le terme coupure de courant qui fait r�f�rence � une situation dans laquelle l'alimentation �lectrique est compl�tement interrompue pendant une certaine dur�e allant peut-�tre d'une fraction de seconde � plusieurs semaines.

�tant donn� que la dur�e des coupures de courant peut varier �norm�ment, il est n�cessaire d'envisager une alimentation �lectrique de secours en utilisant diff�rentes technologies, afin de r�pondre � des pannes de courant de diff�rentes dur�es.

TuyauAstuce
 

Les pannes de courant les plus fr�quentes durent en g�n�ral moins de quelques secondes�; des coupures plus longues sont moins fr�quentes. Dans de telles circonstances, il est recommand� de vous concentrer d'abord sur la protection contre des pannes de courant de quelques minutes et d'envisager ensuite, une strat�gie pour r�duire l'exposition � des pannes plus longues.

8.1.3.2.3.1. Alimentation en �lectricit� pour les quelques secondes qui suivent

�tant donn� que la majorit� des pannes de courant ne durent que quelques secondes, votre solution pour une alimentation �lectrique de secours doit avoir les deux caract�ristiques principales suivantes�:

  • Courte dur�e de transition vers l'alimentation �lectrique de secours (dur�e de transfert)

  • Temps d'ex�cution (ou runtime c-�-d. la dur�e pendant laquelle l'alimentation �lectrique de secours devra �tre disponible) exprim�e des secondes aux minutes

Il existe deux solutions pour disposer d'une alimentation �lectrique de secours qui r�ponde � ces caract�ristiques�: les groupes �lectrog�nes et les syst�mes UPS. Le volant pr�sent dans le groupe �lectrog�ne permet au g�n�rateur de continuer � produire de l'�lectricit� pendant suffisamment de temps pour que les coupures de courant de quelques secondes ne soient pas remarqu�es. �tant donn� que les groupes �lectrog�nes ont tendance � �tre volumineux et co�teux, ils ne repr�sentent une solution pratique que pour les centres de donn�es de moyenne et grande taille.

Toutefois, une autre technologie — portant le nom de syst�me UPS — repr�sente une excellente alternative dans les situations o� un groupe �lectrog�ne est trop on�reux. De plus, un syst�me UPS peut faire face � des pannes de courant d'une plus longue dur�e.

8.1.3.2.3.2. Alimentation en �lectricit� pour les quelques secondes qui suivent

Il est possible d'acheter des syst�mes UPS de tailles vari�es — suffisamment petits pour alimenter un simple PC de base pendant cinq minutes ou suffisamment grands pour faire fonctionner tout un centre de donn�es pendant une heure, voire plus.

Les syst�mes UPS sont compos�s des �l�ments suivants�:

  • Un commutateur de transfert pour passer de la source d'alimentation primaire � la source d'alimentation de secours

  • Une batterie pour assurer l'alimentation de secours

  • Un invertisseur pour convertir le courant continu de la batterie en courant alternatif utilis� par l'�quipement du centre de donn�es

Sans parler de taille et de la capacit� de la batterie du dispositif, il existe deux types de syst�mes UPS de base�:

  • Le dispositif UPS offline utilise son invertisseur pour la gestion de l'�lectricit� seulement lorsque la source d'alimentation primaire est d�faillante.

  • Le dispositif UPS online utilise son invertisseur pour la gestion de l'�lectricit� en permanence, alimentant l'invertisseur au moyen de sa batterie seulement lorsque la source d'alimentation primaire est d�faillante.

Chaque type de syst�me a ses avantages et ses inconv�nients. Le syst�me UPS offline est g�n�ralement moins on�reux car l'invertisseur ne doit pas �tre construit pour un fonctionnement � plein temps. Toutefois, un probl�me au niveau de l'invertisseur d'un syst�me UPS offline ne se remarquera pas (du moins, jusqu'� la prochaine panne de courant).

Les syst�mes UPS online ont tendance � �tre plus � m�me de fournir une alimentation �lectrique pure � votre centre de donn�es�; apr�s tout, un syst�me UPS online a pour fonction essentielle de fournir de l'�lectricit� � plein temps.

Mais, ind�pendamment du type de syst�me UPS choisi, vous devez d'une part estimer correctement la taille de votre syst�me UPS en fonction de la charge anticip�e (garantissant ainsi que le syst�me UPS dispose d'une capacit� suffisante pour produire de l'�lectricit� � la tension et au courant n�cessaires) et d'autre part, d�terminer la dur�e pendant laquelle vous aimeriez pouvoir alimenter votre centre de donn�es au moyen de la batterie.

Afin de d�terminer ces informations, il est n�cessaire d'identifier auparavant les charges qui devront �tre fournies par le syst�me UPS. Prenez en consid�ration chaque �l�ment de l'�quipement et d�terminez la quantit� d'�lectricit� qu'il consomme (ces informations sont g�n�ralement mentionn�es sur l'�tiquette se trouvant � proximit� du cordon �lectrique de l'appareil). Prenez note de la tension, du nombre de watts et/ou des amp�res. Une fois que vous avez recueilli ces informations pour tous les appareils, vous devez les convertir en VA (Volt-Amp�res). Si la consommation est exprim�e en watts, vous pouvez utiliser le nombre mentionn� comme VA�; si le nombre est donn� en amp�res, multipliez-le par le nombre de volts afin d'obtenir la valeur en VA. En additionnant les chiffres en VA, vous obtiendrez une estimation en VA que vous pourrez alors utiliser pour choisir le type de syst�me UPS n�cessaire.

NoteRemarque
 

D'un point de vue purement scientifique, cette m�thode de calcul d'une valeur en VA n'est pas tout � fait correcte�; toutefois, afin d'obtenir la valeur scientifique en VA, il serait n�cessaire de conna�tre le facteur de puissance de chaque appareil et cette information est rarement, voire jamais, fournie. Dans tous les cas, les valeurs en VA obtenues avec cette m�thode peu scientifique refl�tent les valeurs s'appliquant en fait aux pires situations et permettent par cons�quent de disposer une marge d'erreur telle, que ces valeurs peuvent �tre consid�r�es comme tr�s s�res.

La d�termination de la dur�e pendant laquelle l'alimentation �lectrique de secours devra �tre disponible (aussi appel�e dur�e d'ex�cution ou runtime) est plus une consid�ration d'ordre commerciale que d'ordre technique — contre quels types de pannes de courant souhaitez-vous vous prot�ger et quelle somme d'argent �tes-vous pr�t � d�penser pour ce faire�? La plupart des sites choisissent des dur�es maximales qui sont inf�rieures � une ou deux heures car l'�lectricit� fournie par une batterie devient tr�s on�reuse au-del� de cette dur�e.

8.1.3.2.3.3. Alimentation en �lectricit� pour les quelques heures qui suivent (et au-del�)

Lorsque les pannes de courant s'�tendent sur plusieurs jours, ces choix deviennent encore plus co�teux. Les technologies permettant de faire face � des pannes de courant � long terme se limitent aux g�n�rateurs fonctionnant � l'aide d'un genre de moteur — essentiellement, moteur diesel et turbine � gaz.

NoteRemarque
 

Gardez bien � l'esprit que des g�n�rateurs utilisant un moteur doivent �tre r�approvisionn�s en carburant lorsqu'ils marchent. Il est donc important de conna�tre le taux de "consommation" de votre g�n�rateur lorsqu'il fonctionne � sa charge maximale, afin de pouvoir organiser un ravitaillement en cons�quence.

� ce stade, de tr�s nombreuses options s'offrent � vous si votre entreprise dispose de fonds suffisants. C'est � ce niveau que les experts devraient vous aider � d�terminer la meilleure solution pour votre entreprise. Rares sont les administrateurs syst�me disposant de l'expertise n�cessaire pour planifier l'acquisition et le d�ploiement de tels syst�mes g�n�rateurs d'�lectricit�.

TuyauAstuce
 

Il est possible de louer des g�n�rateurs portables de toute taille, permettant ainsi de b�n�ficier des avantages li�s � la production d'�lectricit� par un g�n�rateur sans devoir pour cela d�penser les fonds n�cessaires � l'achat d'un tel dispositif. Gardez toutefois en m�moire que lors de pannes touchant les alentours de votre r�gion, les g�n�rateurs de location seront tr�s demand�s et par cons�quent tr�s co�teux.

8.1.3.2.4. Planification en vue de pannes de courant prolong�es

Alors qu'une coupure de courant de cinq minutes ne repr�sente qu'un d�sagr�ment mineur pour le personnel devant travaill� dans des bureaux sans lumi�re, qu'en est-il d'une coupure d'une heure�? De cinq heures�? D'un jour�? D'une semaine�?

Ceci �tant, m�me si le centre de donn�es fonctionne normalement, une coupure de courant prolong�e touchera t�t ou tard votre entreprise. Consid�rez donc les �l�ments suivants�:

  • Que se passera-t-il s'il n'y a pas de courant pour maintenir le contr�le de l'environnement du centre de donn�es�?

  • Que se passera-t-il s'il n'y a pas de courant pour maintenir le contr�le de l'environnement dans tout le b�timent�?

  • Que se passera-t-il s'il n'y a pas de courant pour faire fonctionner les postes de travail personnels, le syst�me t�l�phonique, les lumi�res�?

� ce stade, il est important pour votre organisation de d�terminer le niveau au-del� duquel une coupure de courant prolong�e devra malheureusement �tre tol�r�e. Ou, dans le cas o� cette situation ne serait pas une option, votre entreprise devra reconsid�rer sa capacit� � fonctionner de mani�re enti�rement autonome par rapport � l'alimentation �lectrique du b�timent�; ceci implique la n�cessit� de tr�s gros g�n�rateurs pour alimenter tout le b�timent.

�videmment, m�me ce niveau de planification ne peut pas avoir lieu dans le vide. Il est vraisemblable que, quelle que soit la cause de la panne de courant prolong�e, son impact se fera sentir sur le monde ext�rieur � votre entreprise et que ce dernier, � son tour, aura une influence sur la capacit� de votre entreprise � poursuivre son activit�, m�me si elle dispose de moyens illimit�s pour g�n�rer de l'�lectricit�.

8.1.3.3. Chauffage, ventilation et climatisation

Les syst�mes de chauffage, ventilation et climatisation (ou HVAC de l'anglais Heating, Ventilation, Air Conditioning) utilis�s dans les bureaux modernes sont extr�mement sophistiqu�s. Souvent contr�l�s pour des ordinateurs, le syst�me HVAC est vital pour le confort ad�quat d'un bon environnement de travail.

Les centres de donn�es disposent g�n�ralement d'�quipement suppl�mentaire pour la ventilation, essentiellement afin de contrebalancer l'impact sur la temp�rature de la chaleur produite par les nombreux ordinateurs et les �quipements connexes. Des pannes au niveau du syst�me HVAC peuvent avoir des cons�quences d�vastatrices sur le fonctionnement continu d'un centre de donn�es. De plus, en raison de leur complexit� et de leur nature �lectrom�canique, les possibilit�s de pannes sont nombreuses et vari�es. Ci-dessous figurent un certain nombre d'exemples�:

  • Les �l�ments du dispositif de ventilation (principalement de grands ventilateurs propuls�s par de gros moteurs �lectriques) peuvent �tre d�faillants en cas de surtension, de probl�me de roulements, de panne de couroie/poulie, etc.

  • Les �l�ments du dispositif de refroidissement (souvent appel�s refroidisseurs) peuvent perdre du r�frig�rant suite � des fuites ou leurs compresseurs et/ou moteurs peuvent se gripper

Les r�parations et la maintenance du syst�me HVAC font partie d'un domaine sp�cialis�— un domaine que l'administrateur syst�me moyen devrait laisser aux experts. La seule chose qu'un administrateur syst�me devrait faire est de s'assurer d'une part que l'�quipement HVAC utilis� pour les besoins du centre de donn�es est soumis � des v�rifications quotidiennes de bon fonctionnement (voire m�me plus fr�quemment) et d'autre part, qu'il est maintenu conform�ment aux instructions du fabricant.

8.1.3.4. Conditions climatiques et environnement ext�rieur

Certaines conditions climatiques, comme celles mentionn�es ci-dessous, peuvent constituer une source de probl�mes pour un administrateur syst�me�:

  • De fortes tomb�es de neige ou la glace peuvent emp�cher le personnel de se rendre au centre de donn�es et peuvent m�me boucher les condensateurs de la climatisation, entra�nant une hausse des temp�ratures dans le centre de donn�es au moment m�me o� personne ne peut se rendre sur place pour prendre les mesures ad�quates.

  • Des vents forts peuvent interrompre l'alimentation �lectrique et les communications alors que des vents tr�s �lev�s peuvent en fait endommager le b�timent lui-m�me.

D'autres conditions climatiques peuvent �galement �tre source de probl�mes, m�me si elles ne sont pas aussi connues. Par exemple, des temp�ratures excessivement �lev�es peuvent entra�ner une surcharge des syst�mes de refroidissement avec des baisses de tension ou coupures de courant dues � une demande d'alimentation trop importante pour le r�seau local.

Bien que peu de mesures puissent �tre prises quant aux al�as climatiques, une connaissance de la mani�re dont ces derniers peuvent affecter le fonctionnement de votre centre de donn�es peut vous aider � maintenir votre activit�, m�me si les conditions climatiques tournent au mauvais temps.

8.1.4. Erreurs d'origine humaine

On entend souvent dire que les ordinateurs sont parfaits. Le raisonnement derri�re cette d�claration est que si on analyse m�ticuleusement le probl�me, on d�couvre que le catalyseur de chaque probl�me informatique est en fait une erreur d'origine humaine. Cette section examinera les types d'erreur humaines les plus courants et leurs cons�quences.

8.1.4.1. Erreurs de la part de l'utilisateur final

Les utilisateurs d'un ordinateur peuvent commettre des erreurs pouvant avoir de graves cons�quences. Toutefois, �tant donn� que leur environnement d'ex�cution est g�n�ralement d�pourvu de tout privil�ge, les erreurs des utilisateurs ont tendance � avoir une nature locale. Vu que la plupart des utilisateurs interagissent avec un ordinateur exclusivement au moyen d'une ou plusieurs applications, c'est au sein de ces applications que se produisent la plupart des erreurs commises par l'utilisateur.

8.1.4.1.1. Mauvaise utilisation d'applications

La mauvaise utilisation d'applications peut causer les probl�mes suivants�:

  • �crasement de fichiers par erreur

  • Utilisation de mauvaises donn�es comme entr�e d'une application

  • Fichiers nomm�s et organis�s de mani�re obscure

  • Suppression accidentelle de fichiers

Cette liste pourrait certes �tre plus longue, mais les exemples fournis suffiront pour illustrer ce point. �tant donn� que les utilisateurs n'ont pas les privil�ges du super-utilisateur, les erreurs qu'ils sont � m�me de commettre ne se limitent qu'� leurs propres fichiers. Dans de telles circonstances, la meilleure approche consiste � agir sur les deux fronts suivants�:

  • D'une part, �duquer les utilisateurs quant � la bonne utilisation de leurs applications et quant aux bonnes techniques de gestion de fichiers

  • D'autre part, s'assurer que des copies de sauvegarde des fichiers des utilisateurs sont effectu�es r�guli�rement et que le processus de restauration est aussi sobre et rapide que possible.

Outre ces mesures, il n'y a pas grand chose � faire pour limiter les erreurs des utilisateurs � un niveau minimal.

8.1.4.2. Erreurs commises par le personnel d'op�rations

La relation des op�rateurs avec les ordinateurs d'une entreprise est plus engag�e que celle des utilisateurs. Alors que ces derniers ont tendance � utiliser essentiellement les applications et que leurs erreurs par cons�quent se produisent surtout � ce niveau, les op�rateurs eux ont tendance � effectuer un �ventail de t�ches plus vaste. Bien que la nature de ces t�ches ait �t� dict�e par d'autres, certaines d'entre elles peuvent inclure l'utilisation d'utilitaires au niveau du syst�me, des situations dans lesquelles la possibilit� de causer des d�g�ts �tendus suite � des erreurs, est beaucoup plus �lev�e. Par cons�quent, les diff�rents types d'erreurs qu'un op�rateur est � m�me de commettre sont centr�s sur la capacit� de ce dernier � suivre les proc�dures �tablies � son intention.

8.1.4.2.1. Non-respect des proc�dures

Les op�rateurs devraient disposer d'ensembles de proc�dures document�es et disponibles pour presque toutes les actions qu'ils effectuent[3]. Il se peut qu'un op�rateur ne suive pas les proc�dures telles qu'elles sont d�finies. Cette situation peut �tre dues aux raisons suivantes�:

  • � un moment donn� dans le pass�, l'environnement a �t� chang� et les proc�dures n'ont jamais �t� mises � jour. Maintenant, l'environnement change � nouveau, invalidant par l�-m�me les proc�dures m�moris�es par l'op�rateur. � ce stade, m�me si les proc�dures venaient � �tre mises � jour (un cas peu vraisemblable �tant donn� qu'elles ne l'ont pas �t� dans le pass�), l'op�rateur n'en aurait pas conscience.

  • L'environnement a �t� modifi� et il n'existe aucune proc�dure. Le cas pr�sent n'est autre qu'une variation encore plus incontr�lable de la situation pr�c�dente.

  • Les proc�dures existent est sont correctes, mais l'op�rateur ne les suivra pas (ou ne peut pas les suivre).

Selon l'organigramme de votre entreprise, vous ne pourrez peut-�tre rienfaire de plus que de partager vos inqui�tudes avec le responsable appropri�.Dans tous les cas, la meilleure approche consiste � �tre disponible afin de pouvoir prendre toute mesure appropri�e pour r�soudre le probl�me.

8.1.4.2.2. Erreurs commises lors des proc�dures

M�me si l'op�rateur suit les proc�dures et que ces derni�res sont correctes, il est toujours possible que des erreurs soient commises. Si tel est le cas, il se peut que l'op�rateur soit n�gligent (auquel cas le sup�rieur de l'op�rateur en question devrait �tre consult�).

La situation pourrait �tre due � une simple erreur. Dans de tels cas, les meilleurs op�rateurs se rendront compte qu'il y a un probl�me et demanderont de l'aide. Encouragez toujours les op�rateurs avec lesquels vous travaillez � s'adresser imm�diatement aux personnes appropri�es s'il ont l'impression qu'il y a un probl�me. Bien que de nombreux op�rateurs soient hautement qualifi�s et donc capables de r�soudre bien des probl�mes eux-m�mes, le fait est que ce n'est pas leur travail. En outre, un probl�me qui est aggrav� par un op�rateur bien intentionn� a des cons�quences n�fastes non seulement sur la carri�re de cette personne mais �galement sur votre capacit� � r�soudre rapidement une situation qui au d�part, n'�tait qu'un petit probl�me.

8.1.4.3. Erreurs de la part des administrateurs syst�me

Contrairement aux op�rateurs, les administrateurs syst�mes effectuent un vaste �ventail de t�ches en utilisant les ordinateurs de l'entreprise. De m�me, contrairement aux op�rateurs, les t�ches que les administrateurs syst�me effectuent ne sont souvent pas bas�es sur des proc�dures document�es.

Par cons�quent, des administrateurs syst�me effectuent quelquefois des t�ches qui ne sont pas n�cessaires lorsqu'ils ne sont pas prudents dans leur travail. Dans le cadre des responsabilit�s quotidiennes qui leur incombent, les administrateurs syst�me ont un acc�s aux syst�mes informatiques qui est plus �tendu que ce dont ils ont vraiment besoin (sans parler de leurs privil�ges de super-utilisateur) d'o� la possibilit� de rendre, par erreur, le syst�me indisponible.

Les administrateurs syst�me peuvent commettre des erreurs soit au niveau d'une mauvaise configuration, soit lors de la maintenance.

8.1.4.3.1. Erreurs dues � une mauvaise configuration

Les administrateurs syst�me doivent souvent configurer diff�rents aspects d'un syst�me informatique. Il est possible que cette configuration inclue les aspects suivants�:

  • Email

  • Comptes utilisateur

  • R�seau

  • Applications

La liste pourrait bien s�r �tre un peu plus longue. La t�che de configuration proprement dite peut prendre des formes tr�s vari�es�; certaines t�ches demandent qu'un fichier texte soit �dit� (� l'aide d'une des centaines de syntaxes diff�rentes utilis�es pour les fichiers de configuration), alors que d'autres n�cessitent l'ex�cution d'un utilitaire de configuration.

Le fait que ces t�ches soient toutes trait�es de mani�re diff�rente ne repr�sente rien d'autre qu'un d�fi suppl�mentaire au fait que chaque t�che de configuration elle-m�me, n�cessite des connaissances diff�rentes. Par exemple, les connaissances n�cessaires pour configurer l'agent de transport de courrier sont fondamentalement diff�rentes de celles n�cessaires � la configuration d'une nouvelle connexion r�seau.

Suite � ce bref expos� de la situation g�n�rale, il est surprenant de voir qu'en fait si peu d'erreurs se produisent. Dans tous les cas, la configuration est, et demeurera, un d�fi pour les administrateurs syst�me. Existe-t-il un moyen de rendre le processus moins vuln�rable aux erreurs�?

8.1.4.3.1.1. Contr�le des changements

Le point commun � toute modification de la configuration est qu'un certain changement a �t� apport�. Ce dernier peut �tre d'une grande ou d'une petite envergure. Il s'agit n�anmoins d'un changement et � ce titre devrait �tre trait� d'une mani�re particuli�re.

De nombreuses entreprises impl�mentent un certain type de processus de contr�le. L'intention de ce dernier est d'aider les administrateurs syst�me (et toutes les parties affect�es par ces changements) � g�rer le processus de changement et de r�duire l'exposition de l'entreprise aux erreurs qui pourraient se produire.

Lors du processus de contr�le des changements, chaque changement suit normalement un certain nombre d'�tapes diff�rentes. Ci-dessous figure un exemple des �tapes pouvant faire partie du processus�:

Recherches pr�liminaires

Les recherches pr�liminaires tentent de clairement d�finir�:

  • La nature du changement devant avoir lieu

  • Son impact, dans le cas o� le changement serait effectu� avec succ�s

  • Une position de repli, dans le cas o� le changement �chouerait

  • Une �valuation des diff�rents types de d�faillances possibles

Les recherches pr�liminaires incluront peut-�tre un test du changement propos� qui sera effectu� pendant un moment d'indisponibilit� pr�vu�; ou cette �tape pourra m�me aller jusqu'� l'impl�mentation du changement dans un premier temps, dans un environnement test, sur du mat�riel test pr�vu � cet effet.

Panification

Le changement est examin� avec une attention toute particuli�re aux m�canismes m�mes de son impl�mentation. La planification n�cessaire du changement inclut un aper�u des diff�rentes �tapes et du cadre temporel de ce changement (ainsi que la s�rie des diff�rentes �tapes et le cadre temporel � respecter pour sortir du changement engendr�, au cas o� un probl�me surgirait) et une estimation ad�quate du temps allou� � l'impl�mentation du changement, en s'assurant bien que l'op�ration n'entrera pas en conflit avec tout autre activit� effectu�e au niveau du syst�me.

Le r�sultat de ce processus se pr�sente souvent sous la forme d'une liste d'�tapes que l'administrateur syst�me utilisera lors de l'impl�mentation du changement. Chacune de ces �tapes expose les instructions � suivre afin de sortir du changement amorc�, dans le cas o� l'�tape �chouerait. Une estimation des dur�es de chaque �tape est souvent donn�e, permettant ainsi � l'administrateur syst�me de d�terminer facilement si l'op�ration se d�roule comme pr�vue ou non.

Ex�cution

� ce stade, l'ex�cution m�me des �tapes n�cessaires � l'impl�mentation du changement devrait �tre claire et simple. Soit le changement est impl�ment�, soit il est annul� pour revenir � la situation pr�c�dente (dans le cas o� un probl�me surgirait).

Contr�le

Que le changement soit impl�ment� ou non, l'environnement est contr�l� afin de s'assurer que tout fonctionne bien comme pr�vu.

Documentation

Si le changement a �t� impl�ment�, toute documentation existante est mise � jour afin de refl�ter la nouvelle configuration.

Il est �vident que tous les changements de configuration ne n�cessitent pas ce niveau de d�tail. La cr�ation d'un nouveau compte utilisateur ne devrait n�cessiter aucune recherche pr�liminaire et la planification de cette t�che ne consistera probablement qu'� d�terminer si l'administrateur syst�me dispose de temps libre pour cr�er le compte. L'�tape d'ex�cution sera tout aussi rapide, l'activit� de contr�le consistera peut-�tre � s'assurer que le compte est bien utilisable et la t�che de documentation elle, prendra vraisemblablement la forme d'un email envoy� au gestionnaire du nouvel utilisateur.

Mais, au fur et � mesure que la complexit� des changements de configuration augmente, un processus de contr�le des changements plus formel s'impose.

8.1.4.3.2. Erreurs commises lors de la maintenance

Ce type d'erreur peut �tre insidieux car la panification et le suivi effectu�s lors des op�rations de maintenance quotidiennes sont g�n�ralement r�duits au minimum.

Tous les jours les administrateurs syst�me sont les t�moins des cons�quences de ce type d'erreur, venant particuli�rement de la part de nombreux utilisateurs affirmant cat�goriquement qu'ils n'ont rien chang� — l'ordinateur est tout simplement tomb� en panne. L'utilisateur ayant cette conviction ne se rappelle g�n�ralement pas ce qu'il a fait, et quant vous serez dans cette m�me situation, vous ne vous rappellerez certainement pas non plus ce que vous avez fait.

L'�l�ment essentiel � garder � l'esprit est que vous devez �tre � m�me de vous rappeler les changements que vous avez apport�s lors de la maintenance, si vous voulez �tre en mesure de r�soudre les probl�mes rapidement. Il n'est pas r�aliste d'envisager un processus minutieux de contr�le des changements portant sur des centaines de petites modifications apport�es pendant la journ�e. Que faire pour effectuer un suivi des centaines de petites choses qu'un administrateur syst�me fait au cours d'une journ�e�?

La r�ponse est simple — il faut prendre des notes. Qu'elles se pr�sentent sous une forme quelconque, dans un carnet, dans un assistant personnel ou comme commentaires dans le fichier concern�, prenez des notes. En documentant ce que vous avez fait, vous avez une meilleure chance d'identifier une d�faillance li�e � un changement que vous avez apport� r�cemment.

8.1.4.4. Erreurs de la part des techniciens d'assistance

Dans certains cas, les personnes m�mes qui sont suppos�es vous aider � garantir le bon fonctionnement de vos syst�mes en fait, les endommagent. Une telle situation n'est pas due � une conspiration, seulement, toute personne travaillant sur une technologie quelle qu'elle soit, risque pour une raison ou une autre de mettre cette technologie hors service. Il en va de m�me lorsque les programmeurs en essayant de corriger un bogue, finissent par en cr�er un autre.

8.1.4.4.1. Mat�riel mal r�par�

Dans ce cas, le technicien a soit �chou� dans son diagnostic du probl�me et a par cons�quent effectu� une r�paration qui n'�tait pas n�cessaire (ou inutile) ou le diagnostic �tait bon mais la r�paration n'a pas �t� effectu�e comme elle aurait d� l'�tre. Il se peut aussi que la pi�ce de rechange elle-m�me ait �t� d�fectueuse ou que la proc�dure ad�quate n'ait pas �t� suivie lors de la r�paration.

C'est la raison pour laquelle il est tr�s important de savoir ce que le technicien fait � tout moment. Ce faisant, vous serez plus attentif aux d�faillances qui semblent �tre li�es d'une mani�re ou d'une autre, au probl�me d'origine. Cette approche permet de mettre le technicien sur la bonne voix, dans le cas o� un probl�me surviendrait�; autrement, il y a une forte chance que le technicien consid�re cette erreur comme �tant nouvelle et compl�tement ind�pendante de celle qui devait �tre corrig�e au d�part. De cette mani�re, les techniciens ne perdent pas de temps � essayer de r�soudre un faux probl�me.

8.1.4.4.2. Correction d'une erreur et cr�ation d'une autre

Parfois, bien que le probl�me ait �t� diagnostiqu� et r�solu avec succ�s, un autre probl�me surgit � sa place. Le module CPU a �t� remplac�, mais le sac anti-statique dans lequel il se trouvait a �t� oubli� dans le placard et a bloqu� le ventilateur entra�nant un arr�t d� � une temp�rature trop �lev�e. Ou le disque dur d�faillant de la matrice RAID a bien �t� remplac� mais une personne a butt� contre le connecteur d'un autre disque et l'a accidentellement d�connect� si bien que la matrice est toujours hors service.

De tels incidents peuvent �tre d�s � des n�gligences chroniques ou � une simple erreur. Dans tous les cas, vous devriez toujours passer en revue les modifications apport�es par le technicien et vous assurer que le syst�me fonctionne bien correctement avant que le technicien ne parte.

Notes

[1]

Et cette dur�e serait tr�s probablement consid�r�e comme le temps de r�ponse donn� dans le meilleur des cas, puisque les techniciens sont g�n�ralement responsables de r�gions qui s'�tendent bien au-del� de leurs bureaux et ce, tous azimuts. Si vous vous trouvez � une des extr�mit�s de leur territoire et que le seul technicien disponible se trouve lui � l'extr�mit� oppos�e, le temps de r�ponse sera �videmment beaucoup plus long

[2]

La technologie UPS est examin�e de mani�re plus d�taill�e dans la Section 8.1.3.2.3.2.

[3]

Si les op�rateurs de votre entreprise ne disposent pas d'un ensemble de proc�dures de fonctionnement, collaborez avec eux, avec la direction de votre entreprise et avec vos utilisateurs afin de les cr�er. Sans proc�dures, votre centre de donn�es sera incontr�lable et rencontrera vraisemblablement de graves probl�mes au cours du d�roulement de son activit� quotidienne.

 
 
  Published under the terms of the GNU General Public License Design by Interspire