OS Unix [IBM aix]/trouble shooting

DLPAR 동적할당(Cpu, mem 증설 및 회수 불가능 시) rebuild the managed system and try again

infra 2022. 6. 19. 15:30

VMware 처럼 AIX내에서도 리소스를 늘릴 수 있다.

또한 AIX 에서 특이한 점은 리소스를 감소 시킬 수도 있는 방법이다.(vmware 내에선 리소스를 줄이는 건 불가능으로 알고 있음)=>  리소스 줄이는 것 또한 가능함

 

 

다음 링크는 vmware내의 가상화 guets OS 내 온라인상에서도 증설 가능한 메모리 증설 방법 링크이다.

https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.vm_admin.doc/GUID-223C31D1-181D-4E3B-99EA-9165764A151C.html

그래서 vmware내에서도 온라인으로 증설 가능한 hot add memory, cpu가 있다.

 

 

[AIX]

dlpar하다가 자원 꼬여서 안될때  다음과 같이 발생할 것이다.

 

기존 profile과 동적으로 리소스를 증설 하려할 때 sync 가 맞지 않아 발생하는 이벤트이다.

 

해결책은 hmc 를 리부팅하고 proc 에 관한 명령어를 수행하여 해당 박스에 대한 processor에 대한 정보를 reset 시키는 방법이며, 이렇게함으로써 박스 내 문제나 리소스 과부하를 혹시나 일으킬 수 있을지 확인했으나 특이사항은 없었다.

 

 

 

https://www.ibm.com/support/pages/hscl03f5-hsce2210-and-hscl0637-errors-due-pending-and-current-values-out-sync

 

Problem Resolution
To force a re-synchronization of the pending and current available values, run the command rsthwres as follows:

rsthwres -r proc -m managed-system

해당 내용 해결책은 IBM 공식 사이트의 URL이다.

자세한 절차는 다음과 같다

 

[절차]

 

[1]

물리서버 1U짜리 HMC 를 리부팅한다.

< 하드웨어 관리 콘솔이라, lpar 또는 박스에 대한 장애 , 서비스 에 영향이 없으므로 HMC를 리부팅해도 된다.>

 

[2]HMC 리부팅 완료 후 terminal 접속을 진행한다. putty 또는 hmc 접속 후 management> open a restrict shell 로 해당 HMCCLI 접속 후 해당 명령어 수행

1)hscroot@ HMC alias ~>lssyscfg -r sys -F name
InFraLee-8408-E8D-SN100AABB

 

해당 박스 정보 나온 후 proc 만 수행

 

2)rsthwres -r proc -m InFraLee-8408-E8D-SN100AABB

 

 

cf)메모리를 reset 하려면 명령어 동일하며 명령어 중간의 옵션 중 proc 대신 mem 만 따로 수행해준다.

rsthwres -r mem -m InFraLee-8408-E8D-SN100AABB

 

 

추가 설명)

해당 박스를 확인하기 위해 

hscroot@ HMC alias ~>lssyscfg -r sys -F name

명령어를 수행하면 박스 당 머신 시리얼 정보가 나올 것이다.

 

 

예를 들어 적용 시 다음과 같다.

 

hscroot@ HMC alias ~>lssyscfg -r sys -F name

InFraLee-8408-E8D-SN100AABB

 

rsthwres -r proc -m InFraLee-8408-E8D-SN100AABB

 

[2-1] optional  [추가 action plan]

이 명령어를 수행함으로써 동적 파티셔닝의 리소스 할당이 적용되지 않는 경우가 있다.

 

해당 파티션 클릭 > Dynamic Partitioning > Processor, memory > Add or Remove 또는 remove 중 Add or Remove 클릭

 

그런 경우에 메세지를 확인하여 OS 까지 리부팅해야한다는 내용이 나오면

OS 까지도 리부팅을 하게되면 DLPAR 적용이 정상화된다.

AIX[=VIOC] #shutdown -Fr 또는  HMC 내 해당 파티션 클릭> operation >> restart

 

시스템이 부팅이 완료 된 후 확인 시 해당 cpu의 core를 적용되었음을 확인할 수 있다.

 

[3] [최종 확인 단계]

HMC 내 processing units=해당 클라이언트에서 lparstat -i 명령어 수행 후 Entitle Capacity(=core) 수가 서로

일치하는지 확인.