Windows Server 2003 환경에서 클러스터 서비스를 운영 중일 때, 온라인 상태에서 간단히 점검해 볼 항목들에 대해서 정리해 봤습니다. 자동차 정비소에 가도 엔지니어분들이 엔진오일을 비롯한 각종 오일류, 타이어 공기압, 부동액 등 몇 가지 점검을 해 주시잖아요... IT 엔지니어들도 이런 거 한 번씩 점검해 주시잖아요... 


1. 클러스터 관리자(cluadmin) 서비스 상태 점검 
 가. 그룹, 리소스에서 '온라인' 상태가 되어 있지 않은 리소스가 있는지 확인 
 나. 클러스터 구성 - 네트워크에서 실패한 네트워크가 있는지 확인
 다. 클러스터 구성 - 네트워크 - Private : '내부 클러스터 통신에만 사용' 설정 권장
 라. 클러스터 구성 - 네트워크 - Public : '모든 통신' 설정 권장
 마. 클러스터 - 속성 - 네트워크 우선 순위 : Private 네트워크 최상위 설정 권장 


2. 로그 확인 
 가. 이벤트 : 어플리케이션, 시스템 로그에 '오류' 확인 
 나. C:\WINDOWS\CLUSTER\CLUSTER.LOG 파일에 'WARN', 'ERR' 확인 


3. 각 클러스터 노드 점검
 가. 클러스터 구성된 노드 각각 Hardware Device Driver, 펌웨어 버전이 일치하는지 확인
 나. Microsoft 최신 업데이트가 설치되어 있는지 확인
 다. 디스크 볼륨 확인 : 디스크 관리에서 '오류' 존재 여부 확인
 라. CPU, MEMORY, DISK 가용성 확인 


4. 백신 소프트웨어 비검사 영역 설정 확인
 가. Quorum Drive 
 나. %systemroot%\Cluster


작성자 : Lai Go / 작성일자 : 2009.10.15
Posted by Lai Go