SQL Server 2000 clustering 작업 중 발생한 이슈에 대해서 아래와 같이 정리하였습니다. 간단히 요약하면 Passive node 에 SQL Server 를 설치하는 과정에서 네트워크 이슈로 정상적인 설치가 진행되지 않았던 사례입니다.
기술지원에 도움을 주신 한국 마이크로소프트 기술지원부에 감사 드립니다.
[환경]
Windows 2000 Server SP+
SQL Server 2000 SP4
[현상]
MSCS 환경에서 새롭게 추가한 Passive node 에 SQL Server Cluster 를 설치하려고 하였으나 "클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다" 라는 메시지가 나온 후 몇 분 후 (최소 2분 최장 18분 정도 상태가 지속 되었음) "클러스터 노드에서 필요한 작업을 수행하지 못했습니다" 라는 오류가 발생하고 작업이 취소 되었습니다.
[원인]
네트워크 어댑터와 Switch Network 장비 포트에 Duplex 레벨이나 전송 속도가 일치하지 않을 경우 이러한 현상이 나타날 수 있습니다. 실제 Network switch 의 전송 속도가 Auto 로 설정되어 있는 것을 확인하였으며 어댑터의 속도를 제대로(100MB/FULL을 100MB/HALF로 연결) 감지하지 못하였습니다.
[해결방법]
클러스터 노드간에 연결되는 Public network duplex 레벨과 동일하게 L2 Switch Network 의 Duplex, speed를 100MB/FULL 로 고정 설정합니다. - 고정 후 ping 연결이 request timed out 이 발생하지 않고 정상 설치 되었습니다.
[분석결과]
1. C:\WINNT\SQLSTP.LOG 파일 확인
가. 사례 1
클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다.
23:29:32 C:\DOCUME~1\clusteradmin\LOCALS~1\Temp\SqlSetup\Bin\remsetup.exe C:\WINNT\remsetup.ini
23:32:44 Process Exit Code: (121) 세마포어 시간 초과 기간이 만료되었습니다.
23:32:44 Begin Action : GetRemsetupRetCode
23:32:44 Installation return status on LAIGOFS01: 0
23:32:44 Installation return status on LAIGOFS02: 121
나. 사례 2
22:16:25 클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다.
22:16:25 C:\DOCUME~1\clusteradmin\LOCALS~1\Temp\SqlSetup\Bin\remsetup.exe C:\WINNT\remsetup.ini
22:33:37 Process Exit Code: (2) 지정된 파일을 찾을 수 없습니다.
22:33:37 Begin Action : GetRemsetupRetCode
22:33:37 Installation return status on LAIGOFS01: 0
22:33:37 Installation return status on LAIGOFS02: 2
2. Active Node 에서 Passive Node 로 ping 테스트를 하였을 때 (Public Network 사용) Request timed out 이 간헐적으로 발생하는 것을 확인함 - 양쪽 노드 Private Network 이 100MB/FULL DUPLEX 로 설정되어 있음을 확인함
3. L2 switch network 장비에서 해당 클러스터 노드 머신과 연결되어 있는 링크 상태가 Auto 로 되어 있으며 실제 100MB/HALF DUPLEX 로 설정 되어 있음을 확인함
[참고자료]
Advanced network adapter troubleshooting for Windows workstations
작성자 : Lai Go / 작성일자 : 2009.09.23