2007~2011/SQL Server2009. 9. 24. 00:01
SQL Server 2000 clustering 작업 중 발생한 이슈에 대해서 아래와 같이 정리하였습니다. 간단히 요약하면 Passive node 에 SQL Server 를 설치하는 과정에서 네트워크 이슈로 정상적인 설치가 진행되지 않았던 사례입니다. 

기술지원에 도움을 주신 한국 마이크로소프트 기술지원부에 감사 드립니다. 


[환경]
Windows 2000 Server SP+
SQL Server 2000 SP4


[현상]
MSCS 환경에서 새롭게 추가한 Passive node 에 SQL Server Cluster 를 설치하려고 하였으나 "클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다" 라는 메시지가 나온 후 몇 분 후 (최소 2분 최장 18분 정도 상태가 지속 되었음) "클러스터 노드에서 필요한 작업을 수행하지 못했습니다" 라는 오류가 발생하고 작업이 취소 되었습니다.


[원인]
네트워크 어댑터와 Switch Network 장비 포트에 Duplex 레벨이나 전송 속도가 일치하지 않을 경우 이러한 현상이 나타날 수 있습니다. 실제 Network switch 의 전송 속도가 Auto 로 설정되어 있는 것을 확인하였으며 어댑터의 속도를 제대로(100MB/FULL을 100MB/HALF로 연결) 감지하지 못하였습니다. 


[해결방법]
클러스터 노드간에 연결되는 Public network duplex 레벨과 동일하게 L2 Switch Network 의 Duplex, speed를 100MB/FULL 로 고정 설정합니다. - 고정 후 ping 연결이 request timed out 이 발생하지 않고 정상 설치 되었습니다. 


[분석결과]
1. C:\WINNT\SQLSTP.LOG 파일 확인
 가. 사례 1 
클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다.
23:29:32  C:\DOCUME~1\clusteradmin\LOCALS~1\Temp\SqlSetup\Bin\remsetup.exe C:\WINNT\remsetup.ini
23:32:44 Process Exit Code: (121) 세마포어 시간 초과 기간이 만료되었습니다.

23:32:44 Begin Action : GetRemsetupRetCode
23:32:44 Installation return status on LAIGOFS01: 0
23:32:44 Installation return status on LAIGOFS02: 121

 나. 사례 2
22:16:25 클러스터 노드에 필요한 작업을 수행 중입니다. 몇 분 정도 걸릴 수 있습니다.
22:16:25  C:\DOCUME~1\clusteradmin\LOCALS~1\Temp\SqlSetup\Bin\remsetup.exe C:\WINNT\remsetup.ini
22:33:37 Process Exit Code: (2) 지정된 파일을 찾을 수 없습니다.

22:33:37 Begin Action : GetRemsetupRetCode
22:33:37 Installation return status on LAIGOFS01: 0
22:33:37 Installation return status on LAIGOFS02: 2


2. Active Node 에서 Passive Node 로 ping 테스트를 하였을 때 (Public Network 사용) Request timed out 이 간헐적으로 발생하는 것을 확인함  - 양쪽 노드 Private Network 이 100MB/FULL DUPLEX 로 설정되어 있음을 확인함

3. L2 switch network 장비에서 해당 클러스터 노드 머신과 연결되어 있는 링크 상태가 Auto 로 되어 있으며 실제 100MB/HALF DUPLEX 로 설정 되어 있음을 확인함 


[참고자료]
Advanced network adapter troubleshooting for Windows workstations


작성자 : Lai Go / 작성일자 : 2009.09.23
Posted by Lai Go