VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-9th-march2019.html


VMware ESXi

Virtual machine traffic will be intermittent during FCoE LUN device failover process

FCoE 기반의 LUN을 사용할 경우 Device Failover 과정에서 간헐적인 트래픽 발생하는 이슈로 현재 해결 방법은 없습니다.


Quiesced snapshot fails when Storage Spaces is configured

Windows VM에 Storage Space가 구성된 경우 Quiesced snapshot이 실패 합니다. Storage Space를 지원하지 않기 때문에 VMware Tools 에서 VSS Application Quiescing을 Disable 해야 합니다.



VMware Horizon

“Unable to accept connection, authentication failed, reason=authCertSsl” error when upgrading from Horizon 7 version 7.0.3 to 7.5.1

Horizon 7 버전 7.0.3에서 7.5.1으로 upgrade 할때 발생하는 오류로 Horizon 7 버전 7.5.1의 replica 서버를 먼저 설치해서 해결할 수 있습니다.


Enabling New User Authentication Security Features in Horizon 7 Version 7.5.2 and Horizon 6 version 6.2.8

Horizon 7 버전 7.5.2와 Horizon 6 버전 6.2.8 에 사용자 인증을 위한 새로운 기능이 Disable 되어 있어 Enable 을 해주어야 합니다.


Instant clones failed stating managed object not found

Connection 서버안에 있는 백신 문제로 인스턴트 클론이 실패할 수 있습니다. Horizon 7.5 에서 해결되었으며 이전 버전의 경우 마스터 VM 생성 후 30분 후에 인스턴트 클론을 만들어야 합니다.



VMware NSX-T Data Center

Booting a Bare Metal server with an NSX-T Edge ISO fails with the error: “Incorrect CD-ROM detected”

NSX-T 2.4에서 NSX-T Edge ISO 로 부팅시에 오류가 발생할 경우 BIOS에서 SD Card Configuration을 Disable 하여 문제를 회피할 수 있습니다.


Bare Metal Edge ISO installation fails with the error: “Select and install software – Installation step failed”

베어 메탈 서버의 논리 볼륨이 이전에 사용중이던 것일 경우 설치에 실패할 수 있습니다. 기존 LVM을 삭제한 후 설치를 하면 해결됩니다.


NSX-T 2.4.0 Load Balance Service may observe low performance on HTTPs

FIPS가 Enable 되어 있으면 LB에 성능 저하가 발생할 수 있습니다. system_fips를 삭제해서 회피할 수 있습니다.



VMware PKS

K8S worker node hangs indefinitely during the PKS Upgrade

PKS 업그레이드 과정에서 pod를 unschedule 할 수 없어 행이 발생할 수 있습니다. PodDisruptionBudget  를 변경하거나 삭제해서 회피할 수 있습니다.



VMware SDDC Manager

Password Rotation failing in SDDC Manager after manually updating the vRealize Log Insight passwords.

vRealize Log Insight 암호를 변경한 후 SDDC Manager 암호 변경이 실패할 수 있습니다. vRealize Log Insight 의 SSL 인증서의 FQND과 IP address를 올바르게 설정해서 해결할 수 있습니다.



VMware vCenter Server

vCenter server 6.x installed on Windows minor patch upgrades fails with error codes 2349 and 1603

Windows 기반의 vCenter에 마이너 패치 업그레이드를 할때 오류가 발생하는 것으로 3rd party 방화벽과 백신 때문에 발생하는 문제 입니다.


vCenter Server Appliance upgrade 6.5 to 6.7 fails at pre-check with “Unable to contact the source vCenter “

VCSA 6.5을 6.7로 업그레이드 할 때 암호가 만료되어 발생하는 문제로 암호를 reset 하여 해결할 수 있습니다.


Customization options like changing hostname does not populate when VM is deployed from template in content library.

컨텐츠 라이브러리로부터 VM을 배포할 때 Customization 옵션이 보이지 않는 것으로 Flex client를 사용해서 회피할 수 있습니다.


Upgrade to vCenter Server Appliance 6.7 fails if external VUM configured in the past and uninstalled later

External VYUM 이 구성되어 있다가 삭제된 경우 VCSA 6.7 업그레이드가 실패할 수 있습니다.  VUM을 삭제하고 다시 업그레이들 하면 해결할 수 있습니다.



VMware vCloud Director for Service Provider

“The VDC associated with this vApp does not have the required network resources to start this vApps” error when powering on a vSphere imported virtual machine

VM이 Shared Organization vDC 네트워크에 연결되어 있는 경우 vCenter를 vCD에 연결할때 오류가 발생할 수 있습니다. Network을 수동으로 삭제 후 재설정하여 해결할 수 있습니다.



VMware vRealize Operations Manager

Common User Authentication of the Service Discovery Management Pack requires the local administrator credentials

Service Discovery Management Pack 설정시에 local administrator 권한이 요구되는 것은 현재 디자인으로 향후 개선될 것입니다.


Reclaimable|Oversized VMs metrics removed in vRealize Operations Manager 7.0

Reclaimable|Oversized VM 매트릭이 vROPs 7.0에서 제거되었습니다.



VMware vSAN

Content-Based Read Cache (CBRC) is not supported for vSAN DP-enabled virtual machines
vSAN DP가 Enable 되어 있는 VM에는 CBRC가 적용되지 않습니다.



'KB' 카테고리의 다른 글

[VMware] 3월 23일자 신규 KB  (0) 2019.03.31
[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10
[VMware] 2월 28일자 신규 KB  (0) 2019.03.02
[VMware] 2월 21일자 신규 KB  (0) 2019.02.23

VMworld 2017에서 성능 이슈를 해결하고 원인 분석을 하는 동영상을 정리해보았습니다.


VMworld 2017 SER1534BUR - VMware vSphere Performance Troubleshooting and Root Cause Analysis

https://www.youtube.com/watch?v=a_VyvjGeEcQ


ESXTOP

Esxtop은 ESXi host에서 실행되는 실시간 성능 모니터링 도구로 리눅스의 top 명령과 유사합니다. 옵션은 다음과 같습니다.

C: CPU     m: Memory    d: Disk(Adapter)    u: Disk (device)    v:Virtual Disk (소문자)    n: network

V: Virtual Machine view(대문자)    h: help    q: Quit


CPU

VMware에서 VM이나 ESXi 에서 실행되는 작업을 World 라고 부르는데 World가 Schedule 되는 상태는 다음과 같습니다.

World 상태 중 Ready, Costop이 중요 합니다. Ready 각 vCPU 별로 10 이상이 되어서는 안됩니다. 10 이상이라는 것은 VM의 vCPU가 실행되려 할 때 Hypervisor가 pCPU를 할당해주지 못하는 상태입니다. 그리고 Cstop은 3이상이 되어서는 안됩니다. cstop은 vSMP 일때 사용되는 것으로 Core가 2개인 VM이 있을 때 빠른 vCPU가 느린 vCPU를 기다린 시간 입니다. Cstop 값이 높다면 NUMA를 고려해서 physical CPU의 구조를 따르는 것이 좋습니다. 8 개 이상의 vCPU가 필요한 VM은 하나의 코어를 소캣을 각각 생성하는 방법을 고려할 수 있습니다.


CPU Key performance indicator는 다음과 같습니다.

ESXi host: Ready time, Utilization, Load average

VM: Ready time(%RDY), Co-stop(%CSTP), Swap wait(%SWPWT), MaxLimited(%MLMTD)

%USED 와 %RDY가 높다는 것은 CPU가 over-commitment 되었다는 의미 입니다.


Memory

esxtop 에서 m을 누르면 Memory의 상태를 확인할 수 있습니다. PMEM 은 설치된 물리 메모리를 나타내고 VMKMEM은 VMkernel에 관리하는 메모리를 나타냅니다. Minfree 는 VMkernel이 free 상태 유지해야 하는 메모리 양을 나타내고 rsvd는 Resource Pool에 Reserve 된 메모리의 양을 나타냅니다.

ESXi host는 Minfree 의 양을 계산해서 Memory의 state를 표시 합니다. Minfree의 크기는 물리 메모리의 크기에 따라서 자동으로 계산되는데 0~4GB 물리 메모리의 경우 245MB 정도가 할당되고 12~28GB의 경우 696MB 정도가 할당된다. Minfree 대비 어느 정도의 Free 메모리가 남아 있는지에 따라서 Memory State가 High, Clear, Soft 등으로 표시된다.

 

esxtop 에서 j 를 누르면 Ballooning 상태를 확인할 수 있습니다. MEMCTL/MB 값으로 Memory Balloon 상태를 알 수 있으며 MCTL이 Y로 되어 있으면 해당 VM에 Balloon Driver가 설치된 것 입니다. MCTLSZ 값이 0이 아닌 경우 Host의 메모리가 over-commit 되어 Bollandriver가 메모리를 회수하는 것입니다. ZIP은 Host에서 메모리가 압축된 상태를 보여줍니다. CACHESZ로 압축된 캐시의 크기를 보여주고 ZIP/s 와 UNZIP/s 를 통해서 압축을 하는데 사용된 IO를 보여 줍니다.

SWAP은 VM의 성능에 많은 영향을 주는데 SWCUR 값으로 현재 SWAP에 사용된 메모리의 양을 할 수 있고 SWR/s, SWW/s를 통해서 SWAP 동작을 확인할 수 있습니다. SWAP 관련 값들은 0 이상일 경우 SWAP이 발생하였고 SWAP으로 인해 VM의 성능저하가 발생했는지 확인할 수 있습니다.


Network

Network 은 여러가지 지점에서 성능을 확인해봐야 합니다. 우선 Virtual NIC를 살펴보면 Virtual NIC이 사용하는 uplink를 확인해야 하고, Virtual NIC의 대역폭을 확인해야 하고, Virtual NIC의 패킷 수와 평균 패킷 크기 마지막으로 Virtual NIC에서 drop 한 패킷을 확인해야 합니다. 그리고 물리 NIC에서도 대역폭, 패킷 수, 평균 패킷 크기 마지막으로 drop 한 패킷을 확인해야 합니다.


esxtop 에서 n 을 누르면 network의 성능 정보를 볼 수 있습니다. %DRPTX %DRPRX 는 packet이 drop 되었다는 것으로 0 값을 가져야 합니다.

(물리 NIC 마다 NetPol 이라고 불리는 Receive Thread가 할당되어 있습니다. NetPol의 사용량은 esxtop의 vmx의 %SYS  값으로 확인할 수 있습니다.)

Network packet은 Buffer가 부족하면 Drop 됩니다. 패킷을 보내거나 받기 위해서는 버퍼가 필요 합니다. Virtual NIC이나 Virtual switch port의 버퍼를 사용하는데 버퍼의 크기보다 패킷이 더 많은 경우 Drop 하게 됩니다.


Storage

스토리지 성능을 이해 하려면 몇가지 용어를 알아야 합니다. 

IOPS: 초당 Input/output 또는 Read/Write를 한 횟수

SCSI Command: Disk의 명령으로 Read/Write, SCSI reservation 등이 있습니다.

SCSI Reservation: 분산 파일시스템에서 메타 데이터를 보호하기 위해 LUN을 lock 하는 것입니다.

Latency: SCSI 명령이 최초 발생/처리/완료 되는데 걸린 시간으로 보통 ms 단위 입니다.

Throughput: Disk에 전달된 데이터의 총합으로 보통 MBps 단위 입니다.


esxtop 에서 v 를 누르면 VM의 vmdk 디스크의 성능, u를 누르면 LUN의 성능 마지막으로 d를 누르면 HBA/RAID card 시점에서 성능을 확인할 수 있습니다. 

 


CMDS/s 는 초당 Disk에 전달된 명령의 양을 확인할 수 있고 DAVG는 Driver driver에서 실제 디스크 장치까지의 응답 시간으로 15 ~ 20 ms 내의 시간을 가져야 합니다. KAVG는 VMKernel의 응답 시간으로 2 ~ 3ms의 시간을 가져야 합니다. (Guest 가 인식하는 응답 시간은 DAVG+KAVG 입니다).마지막으로 Disk의 ABRTS/s 값은 0이어야 합니다. DAVG가 높고 KAVG가 낮은 경우는 Array에 부하가 많이 걸린 것이고 KAVG가 높고 DAVG가 낮은 경우는 Host에 부하가 걸린 것입니다.

아래 내용을 참고해서 esxtop에 대해서 더 알아볼 수 있습니다.


Interpreting esxtop Statistics

https://communities.vmware.com/docs/DOC-9279


Using esxtop to identify storage performance issues for ESX / ESXi (multiple versions) (1008205)

https://kb.vmware.com/s/article/1008205


감사합니다.

'Virtualization' 카테고리의 다른 글

[VMware] Guest OS Disk timeout 설정  (0) 2019.04.06
vSphere Performance Troubleshoooting and RCA  (0) 2019.03.10
VMware vCenter Performance  (0) 2019.02.23
ESXi Internal  (0) 2018.10.20

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-2nd-march2019.html


VMware Essential PKS

Heptio Support

VMware 가 2018년 12월에 인수한 Heptio의 기술지원을 받는 방법입니다.



VMware ESXi

FDM Manager restarts on an ESXi host after vMotion of a VM has completed

vMotion 후 경합으로 인해 FDM이 크래시 될 수 있습니다. 패치는 아직 나오지 않았습니다.


ESXi Firewall Rule configuration continuously updated on the hosts with enable and disable operations for “esxupdate

vSAN health Check 로 인해 방화벽 규칙이 반복적으로 update 되는 것으로 의도된 디자인 입니다. VUM scans를 중지 하거나 주기를 늘려서 회피할 수 있습니다.


Host may crash by loading qfle3 driver with an arbitrary debug_mask value

debug_mask=1이 설정되면 ESXi 호스트가 느려지거나 크래시가 발생할 수 있습니다. debug_mask 는 디버깅을 할때만 사용해야 하고 debug_mask=0로 disable 할 수 있습니다.


VMDK disks not loading when vSphere ImportVApp API called in loop

ImportVApp API를 사용해서 새로운 VM을 만드는 경우 disk 정보가 업데이트 되지 않을 수 있습니다. 엔지니어링에서 해결 방법을 찾고 있으며 ImportVApp API 호출 후 10 초간 기다리는 방법으로 회피할 수 있습니다.


VMware NSX-T

Clear management-plane command is not working on nsxcli

clear management-plane 명령은 2.4.0 부터 사용되지 않고 del nsx를 사용해야 합니다. 



VMware PKS

VMware PKS cluster creation fails with pods stuck on “ContainerCreating” state

Hyperbus 통신 이슈로 Pod가 ContainerCreating 상태에서 멈추어서 PKS 클러스터 생성이 실패할 수 있습니다. esxi에서 netcpad 를 재시작해서 해결할 수 있습니다.


Harbor DNS resolution from the worker nodes is failing after re-deploying the Harbor instance

Harbor 인스턴스를 제거하고 다시 설치하는 과정에서 업그레이드 클러스터를 선택하지 않은 경우 발생할 수 있으며 수동으로 설정을 업데이트해서 해결할 수 있습니다.



VMware SDDC Manager

Alerts generated in SDDC Manager are not cleared automatically after the triggered alert condition has been resolved

SDDC Manager의 Alert은 이슈가 살라져도 자동으로 제거되지 않습니다. 수동으로 제거해야 합니다.



VMware Validated Design for Software-Defined Data Center

아래 문서들은 VVD 를 기반으로 vRealize 를 설정하는 법 입니다.

VMware Validated Design 4.2 vRealize Operations Disaster Recovery Failover and Failback

VMware Validated Design 4.2 and 4.3 Planned Migration of vRealize Operations

VMware Validated Design 4.3 vRealize Operations Disaster Recovery Failover



VMware vCenter Server

“A general system error occurred: missing vmsn file” error occurs during a cloning task in vCenter Server 6.7 U1

Template의 Snapshot에서 VM을 clone 할때 변환 오류로 실패 합니다. 문제 해결 방법을 찾고 있으며 template 객체를 VM 객체로 변환해서 회피할 수 있습니다.



VMware vCenter Server Appliance

vCenter Server Appliance 6.x Upgrade fails with the error “transport.guestops Failed to download from https://<esxi ip>/guestFile”

source VCSA가 실행중인 ESXi 호스트와 업그레이드가 되려는 머신 사이이 통신이 안될 때 VCSA 업그레이드가 실패 합니다. 


Using the CLI to add or configure SSO identity sources in vSphere 6.5 & 6.7

vSphere 5.5/6/0에서 사용하던 custom script는 더 이상 사용되지 않고 vmware-identity-sso.jar 파일을 변경하는 방식을 사용해야 합니다.



VMware vRealize Automation

Joining the vRealize Automation appliance to the domain overrides the Network Time Protocol server settings configured in the virtual appliance 

management interface

vRA가 Integraded Windows Authentication을 사용해서 domain에 join 하면 NTP 설정에 있는 서버와 시간 동기화를 하지 않고 Domain Controller가 지정한 서버와 동기화를 하게 됩니다.



VMware vRealize Network Insight

Build numbers and versions of VMware vRealize Network Insight (vRNI)



VMware vRealize Operations Tenant App for VMware vCloud Director

Oracle Datapump expdp for vcloud schema

vCloud 문제 해결을 위해 vCloud 데이터베이스로 사용하는 오라클 데이터베이스의 데이터를 덤프하는 방법 입니다.


감사합니다.

'KB' 카테고리의 다른 글

[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10
[VMware] 2월 28일자 신규 KB  (0) 2019.03.02
[VMware] 2월 21일자 신규 KB  (0) 2019.02.23
[VMware] 2월 14일자 신규 KB  (0) 2019.02.16

+ Recent posts