VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다. 
https://blogs.vmware.com/kb/2019/04/new-kb-articles-published-for-the-week-ending-6th-april2019.html

 

VMware NSX for vSphere

Juniper Networks QFX5100/QFX5110 HW VTEP Support for NSX-v 6.4.4
NSX-V 6.4.4가 하드웨어 VTEP으로 Juniper Networks의 QFX5100/QFX5110를 지원 합니다.

 

VMware NSX-T Data Center

Collect NSX-T NCP logs in PKS environment
PKS 환경에서 NSX-T NCP log를 수집하는 방법 입니다.

NSX-T NCP troubleshooting and debug logging
NSX-T NCP 문제 해결 방법 및 디버깅 로그에 대한 정보 입니다.

 

VMware PKS

Shutdown and Startup order for VMware PKS environment
PKS 환경에서 shutdown/startup 순서에 대한 설명 입니다.

How to shutdown and startup a Kubernetes cluster in VMware PKS
PKS 환경에서 Kubernetes 클러스터를 shutdown/startup 하는 방법 입니다.

 

VMware Validated Design for Software-Defined Data Center (SDDC)

Updates for vRealize Operations Dashboards and Notifications in VMware Validated Design 4.3 and 5.0
VVD 4.5과 5.0에 맞게 대시보드를 업데이트하는 방법 입니다.

 

VMware vCloud Availability for Cloud-to-Cloud DR

Snapshot creation fails for a VM replicated and failed over by vCloud Availability for Cloud-to-Cloud DR 1.x
vCD VM의 이름 길이 때문에 Failover 된 VM의 스냅샷 생성에 실패할 수 있습니다. 현재 해결 방법은 없습니다.

 

VMware vCloud Director for Service Provider

Global Roles Cannot be Created or Edited in the vCloud Director HTML5 UI
HTML5 UI에서 글로벌 롤을 만들지 못하는 이슈로 구성을 직접 Load Balancer나 vCloud Director 구성을 변경해서 해결할 수 있습니다.

vCloud Director WebMKS console is not sending ?Ctrl+Alt+Delete? input correctly to the GuestOS
vCD 9.5.0.2, 9.5.0.3 그리고 9.7의 WebMKS에서 GuestOS에 "Ctrl+Alt+Delete"를 보내지 못할 수 있습니다. IE/Edge 브라우저를 사용하거나, HTML5 독립 VMRC 콘솔을 사용하거나, Guest OS에서 스크린 키보드를 사용해서 회피할 수 있습니다.

 

VMware vRealize Operations

vRealize Operations Insight End of Life and free conversion process to vRealize Suite Standard
vRealize Operations Insight 가 EOS 되었고 vRealize Suite Standard로 전환 가능 합니다.

 

VMware vRealize Operations Manager

Cost calculation does not show up on one or more Datacenters or Custom Datacenters in vRealize Operations Manager 7.0
vROPS 7.0에서 비용 계산에 이슈가 있습니다. Security patch를 설치해서 문제를 해결할 수 있습니다.

 

VMware vSAN

PSOD on hosts using vSAN iSCSI Target
vSAN iSCSI target을 사용하면 PSOD가 발생할 수 있습니다. 동일한 IQN을 사용해서 동일한 Target에 접근할 때 문제가 발생할 수 있습니다. 동일한 IQN을 사용하지 않게 해서 문제를 회피할 수 있습니다.

 

VMware vSphere ESXi

Using the Send_NMI_To_Guest Option with HTML5 Client causes other Guest OS To BSOD
HTML5 UI를 사용할 때 send_NMI_Guest 옵션만 선택하고 System log export를 하면 ESXi 호스트의 VM들에서 BSOD가 발생할 수 있습니다. Flex 기반의 UI를 사용해서 문제를 회피할 수 있습니다.

'KB' 카테고리의 다른 글

[VMware] 4월 20일자 신규 KB  (0) 2019.04.28
[VMware] 4월 13일자 신규 KB  (0) 2019.04.28
[VMware] 3월 30일자 신규 KB  (0) 2019.04.14
[VMware] 3월 23일자 신규 KB  (0) 2019.03.31
[VMware] 3월 16일자 신규 KB  (0) 2019.03.24

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.
https://blogs.vmware.com/kb/2019/04/new-kb-articles-published-for-the-week-ending-30th-march2019.html

 

VMware Cloud Provider Pod

“Cannot not locate datastore ‘localStore’ in host…” error when deploying the management vCSA in Cloud Provider Pod 1.1
Cloud Provider Pod 1.1에 management vCSA를 배포할 때 vCenter Server Appliance가 Management host 가 구성 완료 되기 전에 배포가 될면 배포가 실패 합니다. 배포가 실패하면 처음 부터 다시 배포를 해야 하며 모든 호스트의 전원을 한번에 켜지 말고 첫 호스트를 켠 후 10분 정도 후에 마지막 호스트를 키면 문제를 회피할 수 있습니다.

“VIM Task info is null” error when connecting the management vCSA to a distributed virtual port group in Cloud Provider Pod 1.1
VMNICS가 가상 분산 스위치에 연결되어 있지 않은 경우 Management vCSA를 분산 가상 포트 그룹에 연결할 때 실패할 수 있습니다. VMNICs가 정상적으로 잘 선택된 후 구성을 새로 만들면 문제를 회피할 수 있습니다.

 

VMware Integrated OpenStack

VIO During upgrade Data migration fails
참조가 해제된 LBs, Listeners, Pools 과 Monitor가 neutron.nsxv_lbaas_* table 대문에 데이타 마이그레이션이 실패할 수 있습니다. VMware Integrated Openstack 4.1.1에서 해결 되었습니다.

VIO serial console logs in /var/log/vspc fill up all space on compute01 disk
로그 파일이 디스크 공간을 다 차지하는 이슈로 log rotate 파일을 만들어서 회피할 수 있습니다.

VIO Creating a snapshot from a volume backend vm fails
Volume backede VM을 Snapshot 할때 실패할 수 있는데 이런 작업은 VMware Integrated Openstack 5.x에서 허용되지 않는 것입니다.

 

VMware NSX for vSphere

NSX Edge deployment fails with invalid MAC address configuration
vCenter에서 NSX Manager로 Inventory 업데이트가 지연될 경우 NSX Edge 배포가 실패할 수 있습니다. NSX for vSphere 6.3.5와 6.4.0에서 해결 되었으며 NSX Edge를 생성할 때 MAC address를 지정하지 않으면 문제를 회피할 수 있습니다.

Layer7 application detection of RDP/UDP fails in NSX-v 6.4.x and NSX-T 2.4.x
RDP에 대한 Layer7 application detection이 올바르가 동작하지 않는 이슈가 있습니다. Layer7이 아닌 Layer4를 사용해서 문제를 회피할 수 있습니다.

 

VMware NSX-T Data Center

ESXi Firewall rule for IPFIX(port 2055) gets disabled on ESXi 6.7 post reboot / netcpa process restart
ESXi 호스트를 재부팅하거나 netcpa 프로세스를 재시작하면 OPFIX 방화벽 룰이 Disable 됩니다. ESXi 6.7에서 해결 되었고 Disable 된 방화벽 룰을 다시 Enable 해서 문제를 회피할 수 있습니다.

 

VMware PKS

How to backup and restore the Harbor tile in VMware PKS environment
일반적인 백업 방법을 지원하지 않는 Harbor VM 백업 방법에 대한 문서 입니다.

 

VMware vCenter Server

Adding a new entry to /etc/hosts file when a Linux VM is customized to DHCP IP
127.0.0.1 FQDN Hostname 항목이 /etc/hosts 에 이미 있는 경우 VM을 커스터마이징 하는 과정에서 내용이 변경될 수 있습니다. 설정하고자 하는 항목을 VM 커스터마이징에 정용해서 문제를 회피할 수 있습니다.

 

VMware vRealize Automation

Connecting VMware vIDM to an Active Directory domain fails
NetBIOS 이름이 소문자를 가지고 있는 경우 vDIM connector가 AD 도메인에 접속되지 않습니다. NetBIOS 이름을 대문자로 만들어야 합니다.

After Joining Second node to the cluster, the new appliance connectors are missing
잘못된 WorkerID가 /usr/local/horizon/conf/states/<TenantID>에 들어 있어 vRealize Automation cluster에 새로 추가한 new appliance 연결이 안될 수 있습니다. vRealize Automation 7.3의 알려진 이슈로 올바른 Connector ID만  /usr/local/horizon/conf/states/. 에 남겨서 문제를 회피할 수 있습니다.

 

VMware vRealize Business for Cloud

Workaround to stop the blacklisted clusters from appearing in UI for current month
블랙리스트 클러스터가 이번달 UI에 표시되는 것을 막는 방법 입니다.

 

VMware vRealize Operations Manager

Alert Definitions with long IDs prevent the Analytics service from starting in vRealize Operations Manager 6.x and later
Alert 정의에 긴 ID가 있는 경우 Analytics 서비스가 시작되지 않을 수 있습니다. 이 문제를 해결 하려면 문제가 있는 Alert 정의를 제거하고 서비스를 재시작 해야 합니다.

Datacenter objects not reporting Workload Demand % metrics for CPU or Memory in vRealize Operations Manager 6.7
데이터센터 오브젝트가 워크로드 도메인의 CPU나 Memory 메트릭을 표시하지 않는 이슈로 해결을 위해서는 VMware support로 지원을 요청해야 합니다.

 

VMware vSAN

While attempting a storage vMotion within the vSAN datastore, a warning “The operation is not supported on the object. Disk ‘XXXX’ is not moving, so any transform requests will not be honored.” is displayed
vSAN 데이터스토어에서 storage vMotion을 할때 경고가 나타나는 이슈로 무시하면 됩니다.

 

VMware vSphere ESXi

Unable to join ESXi 6.0 host to domain through authentication proxy, fails with error : “The specified vSphere Authentication Proxy Server is not reachable, or has denied access to the service”
사용자가 권한이 부족한 경우 ESXi 6.0 호스트가 Authentication proxy를 통해서 도메인에 조인이 안될 수 있습니다. Authentication proxy를 사용하지 않고 수동으로 도메인에 추가하면 문제를 회피할 수 있습니다.

 

Memory Admission Control Issue for Storage IO Control
vSphere 6.7 이상에서 Memory Admission Control에 이슈가 있습니다. SIOC 서비스를 재시작하는 것으로 문제를 회피할 수 있습니다.

 

VMware Workstation Pro

Soundcard stops working after P2V
P2V를 한 후 사운드카드가 동작하지 않을 수 있습니다. VM에서 기존 사운드 카드를 제거해서 문제를 해결할 수 있습니다.

'KB' 카테고리의 다른 글

[VMware] 4월 13일자 신규 KB  (0) 2019.04.28
[VMware] 4월 06일자 신규 KB  (1) 2019.04.14
[VMware] 3월 23일자 신규 KB  (0) 2019.03.31
[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24

오늘은 Guest OS Disk timeout 설정에 대해서 정리해보고자 합니다.

 

Windows VM에서 Disk timeout 값이 작게 설정되어 있는 경우에 SAN datastore 를 사용하면 성능에 문제가 있다는 문서가 있습니다

Inconsistent Windows virtual machine performance when disks are located on SAN datastores (1014)

https://kb.vmware.com/s/article/1014

Windows VM이 위치한 SAN datastore 에서 오류가 발생해서 Retry, Link down timeout, Failover 등이 발생하는 경우 조치에 걸리는 시간보다 Disk의 Timeout이 길어야 ESXi 레이어에서 Storage에 대한 복구가 될 때 까지 Disk 가 오류가 발생하지 않게 됩니다. 문서에서는 일반적인 60초로 설정을 하도록 하였으나 정확한 값은 각 스토리지 업체의 값을 따라야 하고 Windows VM에서 실행되고 있는 Application의 특성을 따라야 합니다.

좀더 자세히 살벼보면 Windows WDK의 SCSI Miniport Driver 문서에는 Timeout을 설정하지 않을 경우 10초로 설정된다고 되고 Windows 8 (Windows Server 2012) 부터는 Miniport driver에 설정된 timeout 값이 적용됩니다.

https://docs.microsoft.com/en-us/windows-hardware/drivers/storage/registry-entries-for-scsi-miniport-drivers

하지만 아래 Microsoft 에서 나온 블로그 들을 보면 Timeout을 무조건 60 초로 설정하지는 말라고 되어 있습니다. Windows 에서는 Timeout이 발생하면 Storport 드라이버가 8번까지 재시도를 하게 되어 있어 만약 timeout이 60초로 설정되된 경우 최대 8분까지 (60초 x 8회) 재시도를 하는 것이 됩니다. SQL Server 나 Exchange Server와 같이 IO가 중요한 시스템들은 무조건 60초를 설정하기 보다는 Application 특성, 물리/가상머신 여부, Multipath, 스토리지 특성 등을 다 고려해서 적절한 값을 설정하는 것이 중요합니다.

Disk Timeout
https://blogs.technet.microsoft.com/hugofe/2011/09/07/disk-timeout/

Windows Disk Timeouts and Exchange Server 2010
https://blogs.technet.microsoft.com/exchange/2011/11/17/windows-disk-timeouts-and-exchange-server-2010/

 

Linux Guest OS의 Disk timeout도 설정되어야 합니다. 아래 문서를 보면 Linux Guest OS에서 SAN에서 IO retry, Path failover 등에 시간이 오래 걸려서 file system이 read-only로 설정되거나 Panic이 발생하는 경우가 있어 패치를 적용하고 Disk의 Timeout 값을 180으로 설정해야 합니다. (ESX 4 이후 부터는 VMware tools 를 설치한 경우 Timeout 값이 180으로 설정됩니다.)

Linux based file systems become read-only (51306)
https://kb.vmware.com/s/article/51306

Storage path failover might cause kernel panic in Linux kernels if using a virtual LSILogic adapter (Parallel or SAS) (1010759)
https://kb.vmware.com/s/article/1010759

Increasing the disk timeout values for a Linux 2.6 virtual machine (1009465)
https://kb.vmware.com/s/article/1009465

Filesystem on VMware Red Hat Enterprise Linux 4, 5, 6, & 7 guests went read-only
https://access.redhat.com/solutions/35329

 

Storage 업체의 권고를 확인해 보면 NetApp에서는 vSphere 환경에서 Linux 와 Windows 모두 60초를 설정할 것을 권장하고 있습니다.

What are the guest OS tunings needed for a VMware vSphere deployment?
https://kb.netapp.com/app/answers/answer_view/a_id/1001979/~/what-are-the-guest-os-tunings-needed-for-a-vmware-vsphere-deployment%3F-

 

결론은 Application/Storage 특성, ESXi 에서의 구성등을 모두 고려해서 Disk timeout을 설정해야 합니다.

 

'Virtualization' 카테고리의 다른 글

vSphere Performance Troubleshoooting and RCA  (0) 2019.03.10
VMware vCenter Performance  (0) 2019.02.23
ESXi Internal  (0) 2018.10.20

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-23rd-march2019.html

 

VMware App Volumes

Multiple duplicate Writables are seen after upgrading from App Volumes 2.13.2 to App Volumes 2.16
App Volumes을 2.13.2에서 2.16으로 업그레이드할때 Writable 이 중복되어 보일 수 있습니다. App Volume Manager에서 수정을 해야 합니다.

 

VMware Horizon

Unable to launch RDS based desktop or application session
터미널 서버의 사용자 세션 종료에 대한 통보를 Horizon agent가 받지 못해 이슈가 발생할 수 있습니다. UsePPNotificationsForSessions 레지스트리 키를 설정해서 해결할 수 있습니다.

 

VMware NSX for vSphere

Guest Introspection deployment failure if ESX host has vmkernel interface configured to use 169.254.1.1
ESXi host의 vmkernel interface에 169.254.1.1 이 설정되어 있으면 GI 배포가 실패 합니다. 169.254.1.1을 설정하지 않으면 해결할 수 있습니다.

 

VMware NSX SD-WAN by VeloCloud

VMware SD-WAN by Velo Could Support Portal
SD-WAS 제품인 VeloCloud 지원 포털에 대한 Q&A 입니다.

 

VMware SDDC Manager

Some older workflows and tasks are not present in SDDC Manager after upgrading VMware Cloud foundation to 3.7.
VCF 3.7로 업그레이드 한 후 예전 workflow와 task가 보이지 않는 문제가 발생합니다. 이전 workflow와 task는 /home/vcf/workflows.jaon에 저장되어 있어 확인 가능 합니다.

Adding a host or a cluster to an existing VMware Cloud Foundation 3.7 workload domain fails
호스트나 클러스터를 VCF 3.7 workload domain에 추가할때 암호가 정상적으로 저장되지 않아 실패할 수 있습니다. 암호를 수동 변경해서 회피할 수 있습니다.

Creating a Horizon workload domain in VMware Cloud Foundation 3.7 fails at task ‘Install primary CS binaries’
Horizon workload domin 을 VCF 3.7에 설치할 때 Install primary CS binaries 오류가 발생하면서 실패할 수 있습니다. 작업을 다시 시도하면 설치를 성공할 수 있습니다.

VMware Cloud Foundation 3.5.1 network migration pre-validation
VCF 2.3.2.5를 3.5.1로 업그레이드할 때 네트워크 마이그레이션 검증 단계를 설명 합니다.

VMware Cloud Foundation 3.0.1 patch to address Perl vulnerability CVE-2018-6913
VCF 3.0.1에 Perl 취약점인 CVE-2018-6913 관련 패치 입니다.

VMware Cloud Foundation 3.5.1 patch to address multiple Perl vulnerabilities
VCF 3.5.1에 다수의 Perl 취약점 패치 입니다.

 

VMware Validated Design for Software-Defined Data Center (SDDC)

Updating the VMware Validated Design 5.0 to version 5.0.1
VVD 5.0이 5.0.1로 업그레이드 되었습니다.

 

VMware vCenter Server

“VMware Syslog Collector failed with error code ‘3010’” error when upgrading vCenter Server
vCenter server를 업그레이드 할 때 프로세스가 dll을 잡고 있어서 syslog collector가 실패 합니다. 업그레이드 작업 전에 백신/백업 프로그램을 중지해야 합니다.

 

VMware vCenter Server Appliance

Unable to apply updates to the VCSA. Upgrading from the VAMI interface fails at 70%
tool 설치 문제로 VCSA 업그레이드가 실패할 수 있습니다. vmware-tools-core 와 vmware-tools-foundation을 제거해고 다시 시도하면 해결할 수 있습니다.

Mixed case hostname fails when upgrading to vCenter Server Appliance 6.5/6.7
VCSA의 hostname 이 대소문자가 섞여 있으면 업그레이드 할 때 실패할 수 있습니다. 소문자만 사용하면 해결할 수 있습니다.

 

VMware vRealize Operations Manager

vRealize Operations Manager Log Insight agent is unable to connect to vRealize Log Insight via SSL
인증서 문제로 Agent가 SSL 통신을 못할 수 있습니다. web_chain.pem 을 무시하게 설정해서 문제를 해결할 수 있습니다.

'KB' 카테고리의 다른 글

[VMware] 4월 06일자 신규 KB  (1) 2019.04.14
[VMware] 3월 30일자 신규 KB  (0) 2019.04.14
[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-16th-march2019.html



VMware Cloud Foundation

VMware Cloud Foundation ESXi root requirements

VCF는 자동화를 위해 ESXi의 root 권한을 사용 합니다.



VMware NSX for vSphere

After NSX Manager upgrade to 6.4.4, unable to upgrade edge to 6.4.4 or modify configuration

NSX Manager를 6.4.4로 업그레이드하면 Edge를 6.4.4로 업그레이드 하거나 설정을 변경하지 못하게 됩니다. 현재는 해결 방법이 없습니다.



VMware NSX-T

With IP Discovery enabled, host VIB update may fail when upgrading from NSX-T 2.3.1 to NSX-T 2.4.0

IP Discovery가 Enable 되어 있는 경우 NSX-T 2.3.1에서 NSX-T 2.4.0으로 업그레이드가 실패 합니다. Maintenance mode를 사용해서 업그레이드를 할 수 있습니다.


Host VIB update may fail when upgrading from NSX-T 2.3.x to NSX-T 2.4.0 if VMs are storage vMotioned before host upgrade

NSX-T 2.3.x 에서 NSX-T 2.4.0으로 업그레이드를 할 때 Host VIB 업데이트가 실패할 수 있습니다. Maintenance mode를 사용해서 업그레이드를 할 수 있습니다.



VMware NSX-T Data Center

Important information before upgrading to NSX-T Data Center 2.4.0

NSX-T Data Center 2.4.0으로 업그레이드 할 때 미리 확인해야 할 중요 사항입니다.


Edge Load Balancer service status is UNKNOWN or NO_STANDBY

많은 수의 LB 구성 작업이 실행될 때 Edge LB의 상태가 UNKNOWN 이나 NO_STANDBY 상태가 될 수 있습니다. 2.4에서 해결 되었습니다.



VMware PKS

PKS Container creation fails due to HyperBus interface vmk50 not being present on ESXI. PKS 1.2 NSX-T 2.1

HyperBus interface vmk50이 보이지 않아 PKS 컨테이너 생성이 실패할 수 있습니다. vmk50을 추가해서 해결할 수 있습니다.


Unable to connect to Bosh client with an error “Requesting token via client credentials grant: UAA responded with non-successful status code ‘503’ response ‘FAILURE'”

BOSH 서비스가 실행되고 있지 않아 오류가 발생할 수 있습니다. 서비스를 수동으로 실행 시켜서 해결할 수 있습니다.


PKS cluster creation fails with “Error: Timed out sending ?get_state? to worker node after 45 seconds”

IP 충돌로 PKS 클러스터 생성이 실패할 수 있습니다. 문제를 예방하려면 예약된 IP는 사용해서는 안됩니다.



VMware SDDC Manager

NSX-T workload domain creation fails when the ESXi hosts use physical NICs other than vmnic0 and vmnic1

ESXi 호스트가 잘못된 물리 NIC를 사용할 때 발생하는 문제로 VCF 3.7에서 해결되었으며 회피 방법은 KB를 참고하세요



VMware vCenter Converter Standalone

The vCenter Converter Standalone services fail to start on Windows 2008 SP2/6.0.6001 in vCenter Converter Standalone 6.2.0.1

인증서 문제로 vCenter Converter Standalone 서비스가 시작되지 않을 수 있습니다. 인증서를 설치해서 해결할 수 있습니다.



VMware vCenter Server Appliance

vCenter Server 6.5 Update 2d Converge fails with “MonitorPSCDeployTask execution failed”

Converge tool을 실행할 때 MonitorPSCDeployTask 가 실패할 수 있습니다. ldu 를 설정해서 해결할 수 있습니다.


Updating vCenter Server Appliance 6.5/6.7 from VAMI UI fails with “Appliance (OS) root password is expired or is going to expire soon”

VAMI가 암호를 변경할 수 없을 때 발생하는 오류로 수동으로 암호를 재설정해서 해결할 수 있습니다.


Migration from vCenter Server 6.0 installed on Windows 2008 R2 to vCenter Server Appliance 6.7 using external PSC, fails with “cannot retrieve PSC version”

TLS 이슈로 Windows Server 2008 R2 기반의 vCenter의 마이그레이션이 실패할 수 있습니다. TLS 1.2를 설치해서 해결할 수 있습니다.



VMware vRealize Operations Manager

vRealize Operations Manager Dashboard link sharing is not working in IE 11

IE 11에서 vROPs 대시보드가 정상동작 하지 않을 수 있습니다. 다른 브라우저를 사용해서 회피할 수 있습니다.



VMware vSphere ESXi

Fail to create namespace in a VM when NVDIMM size is not a multiple of 128MB
NVDIMM 의 크기가 128MB의 배수가 아닐경우 오류가 발생할 수 있습니다. 


'KB' 카테고리의 다른 글

[VMware] 3월 30일자 신규 KB  (0) 2019.04.14
[VMware] 3월 23일자 신규 KB  (0) 2019.03.31
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10
[VMware] 2월 28일자 신규 KB  (0) 2019.03.02

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-9th-march2019.html


VMware ESXi

Virtual machine traffic will be intermittent during FCoE LUN device failover process

FCoE 기반의 LUN을 사용할 경우 Device Failover 과정에서 간헐적인 트래픽 발생하는 이슈로 현재 해결 방법은 없습니다.


Quiesced snapshot fails when Storage Spaces is configured

Windows VM에 Storage Space가 구성된 경우 Quiesced snapshot이 실패 합니다. Storage Space를 지원하지 않기 때문에 VMware Tools 에서 VSS Application Quiescing을 Disable 해야 합니다.



VMware Horizon

“Unable to accept connection, authentication failed, reason=authCertSsl” error when upgrading from Horizon 7 version 7.0.3 to 7.5.1

Horizon 7 버전 7.0.3에서 7.5.1으로 upgrade 할때 발생하는 오류로 Horizon 7 버전 7.5.1의 replica 서버를 먼저 설치해서 해결할 수 있습니다.


Enabling New User Authentication Security Features in Horizon 7 Version 7.5.2 and Horizon 6 version 6.2.8

Horizon 7 버전 7.5.2와 Horizon 6 버전 6.2.8 에 사용자 인증을 위한 새로운 기능이 Disable 되어 있어 Enable 을 해주어야 합니다.


Instant clones failed stating managed object not found

Connection 서버안에 있는 백신 문제로 인스턴트 클론이 실패할 수 있습니다. Horizon 7.5 에서 해결되었으며 이전 버전의 경우 마스터 VM 생성 후 30분 후에 인스턴트 클론을 만들어야 합니다.



VMware NSX-T Data Center

Booting a Bare Metal server with an NSX-T Edge ISO fails with the error: “Incorrect CD-ROM detected”

NSX-T 2.4에서 NSX-T Edge ISO 로 부팅시에 오류가 발생할 경우 BIOS에서 SD Card Configuration을 Disable 하여 문제를 회피할 수 있습니다.


Bare Metal Edge ISO installation fails with the error: “Select and install software – Installation step failed”

베어 메탈 서버의 논리 볼륨이 이전에 사용중이던 것일 경우 설치에 실패할 수 있습니다. 기존 LVM을 삭제한 후 설치를 하면 해결됩니다.


NSX-T 2.4.0 Load Balance Service may observe low performance on HTTPs

FIPS가 Enable 되어 있으면 LB에 성능 저하가 발생할 수 있습니다. system_fips를 삭제해서 회피할 수 있습니다.



VMware PKS

K8S worker node hangs indefinitely during the PKS Upgrade

PKS 업그레이드 과정에서 pod를 unschedule 할 수 없어 행이 발생할 수 있습니다. PodDisruptionBudget  를 변경하거나 삭제해서 회피할 수 있습니다.



VMware SDDC Manager

Password Rotation failing in SDDC Manager after manually updating the vRealize Log Insight passwords.

vRealize Log Insight 암호를 변경한 후 SDDC Manager 암호 변경이 실패할 수 있습니다. vRealize Log Insight 의 SSL 인증서의 FQND과 IP address를 올바르게 설정해서 해결할 수 있습니다.



VMware vCenter Server

vCenter server 6.x installed on Windows minor patch upgrades fails with error codes 2349 and 1603

Windows 기반의 vCenter에 마이너 패치 업그레이드를 할때 오류가 발생하는 것으로 3rd party 방화벽과 백신 때문에 발생하는 문제 입니다.


vCenter Server Appliance upgrade 6.5 to 6.7 fails at pre-check with “Unable to contact the source vCenter “

VCSA 6.5을 6.7로 업그레이드 할 때 암호가 만료되어 발생하는 문제로 암호를 reset 하여 해결할 수 있습니다.


Customization options like changing hostname does not populate when VM is deployed from template in content library.

컨텐츠 라이브러리로부터 VM을 배포할 때 Customization 옵션이 보이지 않는 것으로 Flex client를 사용해서 회피할 수 있습니다.


Upgrade to vCenter Server Appliance 6.7 fails if external VUM configured in the past and uninstalled later

External VYUM 이 구성되어 있다가 삭제된 경우 VCSA 6.7 업그레이드가 실패할 수 있습니다.  VUM을 삭제하고 다시 업그레이들 하면 해결할 수 있습니다.



VMware vCloud Director for Service Provider

“The VDC associated with this vApp does not have the required network resources to start this vApps” error when powering on a vSphere imported virtual machine

VM이 Shared Organization vDC 네트워크에 연결되어 있는 경우 vCenter를 vCD에 연결할때 오류가 발생할 수 있습니다. Network을 수동으로 삭제 후 재설정하여 해결할 수 있습니다.



VMware vRealize Operations Manager

Common User Authentication of the Service Discovery Management Pack requires the local administrator credentials

Service Discovery Management Pack 설정시에 local administrator 권한이 요구되는 것은 현재 디자인으로 향후 개선될 것입니다.


Reclaimable|Oversized VMs metrics removed in vRealize Operations Manager 7.0

Reclaimable|Oversized VM 매트릭이 vROPs 7.0에서 제거되었습니다.



VMware vSAN

Content-Based Read Cache (CBRC) is not supported for vSAN DP-enabled virtual machines
vSAN DP가 Enable 되어 있는 VM에는 CBRC가 적용되지 않습니다.



'KB' 카테고리의 다른 글

[VMware] 3월 23일자 신규 KB  (0) 2019.03.31
[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10
[VMware] 2월 28일자 신규 KB  (0) 2019.03.02
[VMware] 2월 21일자 신규 KB  (0) 2019.02.23

VMworld 2017에서 성능 이슈를 해결하고 원인 분석을 하는 동영상을 정리해보았습니다.


VMworld 2017 SER1534BUR - VMware vSphere Performance Troubleshooting and Root Cause Analysis

https://www.youtube.com/watch?v=a_VyvjGeEcQ


ESXTOP

Esxtop은 ESXi host에서 실행되는 실시간 성능 모니터링 도구로 리눅스의 top 명령과 유사합니다. 옵션은 다음과 같습니다.

C: CPU     m: Memory    d: Disk(Adapter)    u: Disk (device)    v:Virtual Disk (소문자)    n: network

V: Virtual Machine view(대문자)    h: help    q: Quit


CPU

VMware에서 VM이나 ESXi 에서 실행되는 작업을 World 라고 부르는데 World가 Schedule 되는 상태는 다음과 같습니다.

World 상태 중 Ready, Costop이 중요 합니다. Ready 각 vCPU 별로 10 이상이 되어서는 안됩니다. 10 이상이라는 것은 VM의 vCPU가 실행되려 할 때 Hypervisor가 pCPU를 할당해주지 못하는 상태입니다. 그리고 Cstop은 3이상이 되어서는 안됩니다. cstop은 vSMP 일때 사용되는 것으로 Core가 2개인 VM이 있을 때 빠른 vCPU가 느린 vCPU를 기다린 시간 입니다. Cstop 값이 높다면 NUMA를 고려해서 physical CPU의 구조를 따르는 것이 좋습니다. 8 개 이상의 vCPU가 필요한 VM은 하나의 코어를 소캣을 각각 생성하는 방법을 고려할 수 있습니다.


CPU Key performance indicator는 다음과 같습니다.

ESXi host: Ready time, Utilization, Load average

VM: Ready time(%RDY), Co-stop(%CSTP), Swap wait(%SWPWT), MaxLimited(%MLMTD)

%USED 와 %RDY가 높다는 것은 CPU가 over-commitment 되었다는 의미 입니다.


Memory

esxtop 에서 m을 누르면 Memory의 상태를 확인할 수 있습니다. PMEM 은 설치된 물리 메모리를 나타내고 VMKMEM은 VMkernel에 관리하는 메모리를 나타냅니다. Minfree 는 VMkernel이 free 상태 유지해야 하는 메모리 양을 나타내고 rsvd는 Resource Pool에 Reserve 된 메모리의 양을 나타냅니다.

ESXi host는 Minfree 의 양을 계산해서 Memory의 state를 표시 합니다. Minfree의 크기는 물리 메모리의 크기에 따라서 자동으로 계산되는데 0~4GB 물리 메모리의 경우 245MB 정도가 할당되고 12~28GB의 경우 696MB 정도가 할당된다. Minfree 대비 어느 정도의 Free 메모리가 남아 있는지에 따라서 Memory State가 High, Clear, Soft 등으로 표시된다.

 

esxtop 에서 j 를 누르면 Ballooning 상태를 확인할 수 있습니다. MEMCTL/MB 값으로 Memory Balloon 상태를 알 수 있으며 MCTL이 Y로 되어 있으면 해당 VM에 Balloon Driver가 설치된 것 입니다. MCTLSZ 값이 0이 아닌 경우 Host의 메모리가 over-commit 되어 Bollandriver가 메모리를 회수하는 것입니다. ZIP은 Host에서 메모리가 압축된 상태를 보여줍니다. CACHESZ로 압축된 캐시의 크기를 보여주고 ZIP/s 와 UNZIP/s 를 통해서 압축을 하는데 사용된 IO를 보여 줍니다.

SWAP은 VM의 성능에 많은 영향을 주는데 SWCUR 값으로 현재 SWAP에 사용된 메모리의 양을 할 수 있고 SWR/s, SWW/s를 통해서 SWAP 동작을 확인할 수 있습니다. SWAP 관련 값들은 0 이상일 경우 SWAP이 발생하였고 SWAP으로 인해 VM의 성능저하가 발생했는지 확인할 수 있습니다.


Network

Network 은 여러가지 지점에서 성능을 확인해봐야 합니다. 우선 Virtual NIC를 살펴보면 Virtual NIC이 사용하는 uplink를 확인해야 하고, Virtual NIC의 대역폭을 확인해야 하고, Virtual NIC의 패킷 수와 평균 패킷 크기 마지막으로 Virtual NIC에서 drop 한 패킷을 확인해야 합니다. 그리고 물리 NIC에서도 대역폭, 패킷 수, 평균 패킷 크기 마지막으로 drop 한 패킷을 확인해야 합니다.


esxtop 에서 n 을 누르면 network의 성능 정보를 볼 수 있습니다. %DRPTX %DRPRX 는 packet이 drop 되었다는 것으로 0 값을 가져야 합니다.

(물리 NIC 마다 NetPol 이라고 불리는 Receive Thread가 할당되어 있습니다. NetPol의 사용량은 esxtop의 vmx의 %SYS  값으로 확인할 수 있습니다.)

Network packet은 Buffer가 부족하면 Drop 됩니다. 패킷을 보내거나 받기 위해서는 버퍼가 필요 합니다. Virtual NIC이나 Virtual switch port의 버퍼를 사용하는데 버퍼의 크기보다 패킷이 더 많은 경우 Drop 하게 됩니다.


Storage

스토리지 성능을 이해 하려면 몇가지 용어를 알아야 합니다. 

IOPS: 초당 Input/output 또는 Read/Write를 한 횟수

SCSI Command: Disk의 명령으로 Read/Write, SCSI reservation 등이 있습니다.

SCSI Reservation: 분산 파일시스템에서 메타 데이터를 보호하기 위해 LUN을 lock 하는 것입니다.

Latency: SCSI 명령이 최초 발생/처리/완료 되는데 걸린 시간으로 보통 ms 단위 입니다.

Throughput: Disk에 전달된 데이터의 총합으로 보통 MBps 단위 입니다.


esxtop 에서 v 를 누르면 VM의 vmdk 디스크의 성능, u를 누르면 LUN의 성능 마지막으로 d를 누르면 HBA/RAID card 시점에서 성능을 확인할 수 있습니다. 

 


CMDS/s 는 초당 Disk에 전달된 명령의 양을 확인할 수 있고 DAVG는 Driver driver에서 실제 디스크 장치까지의 응답 시간으로 15 ~ 20 ms 내의 시간을 가져야 합니다. KAVG는 VMKernel의 응답 시간으로 2 ~ 3ms의 시간을 가져야 합니다. (Guest 가 인식하는 응답 시간은 DAVG+KAVG 입니다).마지막으로 Disk의 ABRTS/s 값은 0이어야 합니다. DAVG가 높고 KAVG가 낮은 경우는 Array에 부하가 많이 걸린 것이고 KAVG가 높고 DAVG가 낮은 경우는 Host에 부하가 걸린 것입니다.

아래 내용을 참고해서 esxtop에 대해서 더 알아볼 수 있습니다.


Interpreting esxtop Statistics

https://communities.vmware.com/docs/DOC-9279


Using esxtop to identify storage performance issues for ESX / ESXi (multiple versions) (1008205)

https://kb.vmware.com/s/article/1008205


감사합니다.

'Virtualization' 카테고리의 다른 글

[VMware] Guest OS Disk timeout 설정  (0) 2019.04.06
VMware vCenter Performance  (0) 2019.02.23
ESXi Internal  (0) 2018.10.20

VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/03/new-kb-articles-published-for-the-week-ending-2nd-march2019.html


VMware Essential PKS

Heptio Support

VMware 가 2018년 12월에 인수한 Heptio의 기술지원을 받는 방법입니다.



VMware ESXi

FDM Manager restarts on an ESXi host after vMotion of a VM has completed

vMotion 후 경합으로 인해 FDM이 크래시 될 수 있습니다. 패치는 아직 나오지 않았습니다.


ESXi Firewall Rule configuration continuously updated on the hosts with enable and disable operations for “esxupdate

vSAN health Check 로 인해 방화벽 규칙이 반복적으로 update 되는 것으로 의도된 디자인 입니다. VUM scans를 중지 하거나 주기를 늘려서 회피할 수 있습니다.


Host may crash by loading qfle3 driver with an arbitrary debug_mask value

debug_mask=1이 설정되면 ESXi 호스트가 느려지거나 크래시가 발생할 수 있습니다. debug_mask 는 디버깅을 할때만 사용해야 하고 debug_mask=0로 disable 할 수 있습니다.


VMDK disks not loading when vSphere ImportVApp API called in loop

ImportVApp API를 사용해서 새로운 VM을 만드는 경우 disk 정보가 업데이트 되지 않을 수 있습니다. 엔지니어링에서 해결 방법을 찾고 있으며 ImportVApp API 호출 후 10 초간 기다리는 방법으로 회피할 수 있습니다.


VMware NSX-T

Clear management-plane command is not working on nsxcli

clear management-plane 명령은 2.4.0 부터 사용되지 않고 del nsx를 사용해야 합니다. 



VMware PKS

VMware PKS cluster creation fails with pods stuck on “ContainerCreating” state

Hyperbus 통신 이슈로 Pod가 ContainerCreating 상태에서 멈추어서 PKS 클러스터 생성이 실패할 수 있습니다. esxi에서 netcpad 를 재시작해서 해결할 수 있습니다.


Harbor DNS resolution from the worker nodes is failing after re-deploying the Harbor instance

Harbor 인스턴스를 제거하고 다시 설치하는 과정에서 업그레이드 클러스터를 선택하지 않은 경우 발생할 수 있으며 수동으로 설정을 업데이트해서 해결할 수 있습니다.



VMware SDDC Manager

Alerts generated in SDDC Manager are not cleared automatically after the triggered alert condition has been resolved

SDDC Manager의 Alert은 이슈가 살라져도 자동으로 제거되지 않습니다. 수동으로 제거해야 합니다.



VMware Validated Design for Software-Defined Data Center

아래 문서들은 VVD 를 기반으로 vRealize 를 설정하는 법 입니다.

VMware Validated Design 4.2 vRealize Operations Disaster Recovery Failover and Failback

VMware Validated Design 4.2 and 4.3 Planned Migration of vRealize Operations

VMware Validated Design 4.3 vRealize Operations Disaster Recovery Failover



VMware vCenter Server

“A general system error occurred: missing vmsn file” error occurs during a cloning task in vCenter Server 6.7 U1

Template의 Snapshot에서 VM을 clone 할때 변환 오류로 실패 합니다. 문제 해결 방법을 찾고 있으며 template 객체를 VM 객체로 변환해서 회피할 수 있습니다.



VMware vCenter Server Appliance

vCenter Server Appliance 6.x Upgrade fails with the error “transport.guestops Failed to download from https://<esxi ip>/guestFile”

source VCSA가 실행중인 ESXi 호스트와 업그레이드가 되려는 머신 사이이 통신이 안될 때 VCSA 업그레이드가 실패 합니다. 


Using the CLI to add or configure SSO identity sources in vSphere 6.5 & 6.7

vSphere 5.5/6/0에서 사용하던 custom script는 더 이상 사용되지 않고 vmware-identity-sso.jar 파일을 변경하는 방식을 사용해야 합니다.



VMware vRealize Automation

Joining the vRealize Automation appliance to the domain overrides the Network Time Protocol server settings configured in the virtual appliance 

management interface

vRA가 Integraded Windows Authentication을 사용해서 domain에 join 하면 NTP 설정에 있는 서버와 시간 동기화를 하지 않고 Domain Controller가 지정한 서버와 동기화를 하게 됩니다.



VMware vRealize Network Insight

Build numbers and versions of VMware vRealize Network Insight (vRNI)



VMware vRealize Operations Tenant App for VMware vCloud Director

Oracle Datapump expdp for vcloud schema

vCloud 문제 해결을 위해 vCloud 데이터베이스로 사용하는 오라클 데이터베이스의 데이터를 덤프하는 방법 입니다.


감사합니다.

'KB' 카테고리의 다른 글

[VMware] 3월 16일자 신규 KB  (0) 2019.03.24
[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 2월 28일자 신규 KB  (0) 2019.03.02
[VMware] 2월 21일자 신규 KB  (0) 2019.02.23
[VMware] 2월 14일자 신규 KB  (0) 2019.02.16


VMware KB 블로그에 올라온 새로나온 KB를 정리해 보았습니다.

https://blogs.vmware.com/kb/2019/02/new-kb-articles-published-for-the-week-ending-23rd-february2019.html


VMware NSX for vSphere

Setting a Proxy Server in the Linux or Mac NSX SSL VPN Client Fails

Date Published: 2/23/2019

Linux와 Mac OS에서 SSL VPN client에서 Proxy server를 지원하지 않습니다. Windows 기반의 SSL VPN 기반 클라이언트를 사용해야 합니다.


Drop counters in DFW for packets increments in presence of fragmented packets in NSX-v

Date Published: 2/22/2019

DFW 에서 단편화된 패킷이 수신되면 DFW의 Drop count 가 올라 갑니다. NSX 6.3.6의 이슈로 NSX를 6.4.0 로 업그레이드 해야 합니다.



VMware SDDC Manager

VMware Cloud Foundation update fails during VRM update when Log Insight was manually upgraded

Date Published: 2/23/2019

Log Insight를 수동으로 먼저 업그레이드 한 경우 VCF 업데이트가 실패합니다. SDDC Manager Controller VM에 ssh로 접속해서 수동으로 변경을 해서 문제를 회피할 수 있습니다.


Workload domain expansion fails with the error “Validation Error: Not enough resources available for workload expansion”

Date Published: 2/20/2019

Workload domain이 redundancy 레벨이 High로 설정되어 있고 다른 렉에만 free host가 있는 경우 확장에 실패합니다. 같은 렉에 host를 추가하고 Redondency 를 Normal로 바꿔서 문제를 회피할 수 있습니다.


Creating an NSX-T VI workload domain in VMware Cloud Foundation 3.5.x fails

Date Published: 2/19/2019

NSX-T VI workload domain에 있는 host가 vmnic0 이름의 물리 nic이 없을때 발생하는 것으로 수동으로 분산 스취치 관련 설정을 변경해서 회피할 수 있습니다.


ESXi upgrades during a VMware Cloud Foundation 3.5 upgrade fail due to misidentified Intel Disks for VSAN

Date Published: 2/21/2019

VCF 3.5 업그레이드 과정 중 ESXi의 업그레이드가 vSAN의 Intel disk 이슈로 실패할 수 있습니다. 문제가 발생한 host를 Silence Alert 설정을 하면 회피할 수 있습니다.



VMware vCenter

InstantClone fails due to exceed in maximum number of delta disks

Date Published: 2/19/2019

Delta dike의 limit 때문에 InstantClone이 실패할 수 있습니다. Soruce VM을 Freeze 하거나, redo log delta disk를 정리하는 방법으로 회피할 수 있습니다.


VMware vCloud Availability for vCloud Director

“Failed to install updates” error when upgrading the vRCS and vRMS components to vCloud Availability for vCloud Director 2.0.1.1

Date Published: 2/21/2019

/opt/vmware/logs 폴더가 다 사용되어 실패할 수 있습니다. 폴더에 있는 파일을 삭제해서 문제를 해결할 수 있습니다.



VMware vCloud Director for Service Provider

‘Number must not be null’ when creating a new Routed Network or modifying an existing Routed Network

Date Published: 2/20/2019

NAT 룰을 Edge Gateway에 만들때 tag가 빠져서 발생하는 것으로 REST API를 사용해서 회피할 수 있습니다.



VMware vRealize Orchestrator

vRealize Orchestrator node configured to authenticate against loadbalanced platform service controllers intermittently being marked as down

Date Published: 2/23/2019

LB 뒤에 있는 다수의 PSC 노드를 인증하도록 구성된 vRealize Orchestrator 노드가 down으로 표시되는 문제로 Session persistence timeout 값을 변경해서 해결할 수 있습니다.



VMware vSAN

ESXi host takes longer time to shutdown if ESXi host has been placed into Maintenance mode immediately after VMs were powered off on vSanDatastore.

Date Published: 2/20/2019

vSAN datastore에 있는 VM을 power off 한 후 바로 Maintenance mode로 변경할 경우 ESXi host shutdown이 오래 걸릴 수 있씁니다. VM poweroff 후 10초 후에 ESXi host를 Maintenance mode로 변경하면 회피할 수 있습니다.


vSAN diskgroup is not shown from Web Client after cache disk failure

Date Published: 2/18/2019

Cache disk가 실패하면 vSAN diskgroupdl Web Client에서 안 보일 수 있습니다. HTML5 client for vSphere Server 6.7에서 해결되었습니다.


vSAN Disk Groups fail to mount after boot

Date Published: 2/18/2019

Booting 과정에서 LSOM heap 부족으로 Mount가 실패할 수 있습니다. LSOM heap size를 늘려서 해결할 수 있습니다.


감사합니다.


'KB' 카테고리의 다른 글

[VMware] 3월 9일자 신규 KB  (0) 2019.03.24
[VMware] 3월 8일자 신규 KB  (0) 2019.03.10
[VMware] 2월 21일자 신규 KB  (0) 2019.02.23
[VMware] 2월 14일자 신규 KB  (0) 2019.02.16
[VMware] 2018년 2월 8일자 신규 KB  (0) 2019.02.10

VMworld 2017에서 발표된 vCenter Performance 관련 동영상을 정리해 보았습니다.

성능 이슈를 이해 하고 분석 하려면 기반 지식을 모두 알아야 하는데 이 동영상을 통해서 vCenter의 구조, 어떤 성능상 문제가 있을 수 있는지? 문제를 확인하는 방법 등을 확인할 수 있습니다.


동영상은 아래 링크에서 확인 가능 합니다.

VMworld 2017 - SER1504BE - VMware vCenter Performance Deep Dive

https://www.youtube.com/watch?v=cIAGxJ4tVbA


vCenter의 구성이 간단한하고 부하가 많이 걸리지 않은 경우 Windows 기반과 VCSA 모두 성능이 비슷 합니다. 하지만 복잡한 구성과 부하가 많이 걸리는 경우 vCenter Windows 버전보다 VCSA가 성능이 더 뛰어납니다. 


vCenter의 메인 서비스인 vpxd로 Client의 요청을 처리해서 DB에 저장하는 역할을 합니다. 사용자가 Web Browser를 사용해서 vCenter를 사용해서 VM 생성 등의 작업을 요청하면 요청을 vsphere-client가 받아서 SSO로 인증을 처리한 후 VPXD에 요청을 하는 것입니다. 요청을 받은 VPXD는 vSphere host에 요청을 하고 변경 사항을 DB에 저장하는 것입니다. vpxd는 C++로 작성 되었고 다른 서비스는 java나 Python 등으로 작성되었습니다.


VM을 켜는 동작을 좀 더 자세히 살펴 보면 다음과 같습니다. Client의 요청을 vCenter에서 받은 후 ESXi host에 Name을 Reserve 하고 VM 생성 요청을 한 후 상태를 확인 한 후 DB에 update 하고 Client에 결과를 돌려줍니다. 작업은 Storage와 DB 단에 지연이 있을 수 있으니 최적화를 해서 성능을 향상시킬 수 있습니다.


vCenter 노드는 Management node 를 담당하고 PSC 노드는 라이선싱, 디렉토리 서비스, SO를 담당합니다. vCenter와 PSC를 동일한 노드에 둘 수도 있고 대규모 환경에서는 분리할 수도 있습니다.


하나의 PSC에 여러개의 VC를 연결할 경우 하나이 Single Domain으로 관리할 수 있고 하나의 디렉토리 서비스를 사용하기 때문에 롤, 권한 라이선싱, 테그 등을 공유해서 관리할 수 있습니다. 이 구조에서는 PSC가 Single Point of Failure 이기 때문에 PSC를 2개 설치하고 Replication을 해서 HA 구성을 할 수 있습니다. (vSphere 6.7 에서는 Embeded PSC 구조에서 HA를 직접 구성할 수 있기 때문에 PSC를 외부로 설치하고 HA 구성을 할 필요가 없읍니다.)

https://blogs.vmware.com/vsphere/2018/11/external-platform-services-controller-a-thing-of-the-past.html


DSL 이라는 Tag를 검색한다고 할때 Web Browser 는 VC 를 통해서 PSC에 검색을 하고 VC 간에 다시 검색을 하게 됩니다. VC 간에 지연이 있다면 Tag 검색에 시간이 많이 걸리게 됩니다. VC나 PSC 사이에 통신 속도가 6.0 에서는 10ms 이하, 6.5 에서는 30ms 이하일 경우 하나의 site로 구성을 합니다.


VCs, PSC 사이의 통신이 6.0에서 10ms 이상 6.5에서 30ms 이상일 경우 multi-site를 구성 합니다. (6.0/6.5 모두 사이트간 통신 속도는 100ms 이하를 권장 합니다.)


vCenter는 동시에 640개의 작업을 처리할 수 있고 최대 2,000개의 세션을 처리할 수 있습니다. Esxi host (6.0+)은 호스트당 16개의 cost를 처리할 수 있습니다. Cost는 작업에 드는 부하(?)를 의미하는데 Clone/relocate/vMotion은 2, Storage vMotion은 8과 같이 정해져 있습니다. 아래 그림에서 Host A 에서 B로 Clone을 할 경우 두 호스트 모두에 2라는 부하(?)가 걸립니다. 하나의 호스트에서 Clone을 할 경우 해당 호스트에 4의 부하가 걸립니다.


Datastore의 동시 작업은 128까지 가능하고 vMotion의 부하는 1, Storage vMotion의 부하는 16 입니다. 1Gb NIC은 동시에 4, 10Gb NIC은 동시에 8까지 동시 작업이 가능하고 vMotion 은 1의 부하를 가집니다.


CPU와 Memory는 70%가 넘지 않아야 합니다. CPU가 70%가 넘어갈 경우 어떤 프로세스 (vpxd, vSphere-client, 등)의 CPU 사용률이 높아졌는지 확인해야 하며 vpxd의 사용률이 높으면 CPU를 추가해야 합니다. java 서비스가 높은 경우 GC 관련 동작인지 확인하고 메모리를 추가해야 합니다. Memory의 경우 swap 이 되지 않도록 충분한 메모리를 추가해 주어야 하며 VM으로 VC를 실행하고 있다면 VM size 만큼 메모리를 Reserve 해야 합니다.

VCSA를 사용할 경우 CPU and Memory를 통해서 CPU/Memory 사용률을 확인할 수 있으며 자세히 보려면 Windows의 경우 Task manager와 Process explorer 를 사용해서 확인하고 java 프로세스의 경우 User name이나 Command Line을 통해서 어떤 서비스가 실행되는지 확인할 수 있습니다. VCSA의 경우 vimtop 명령을 통해 확인 가능 합니다. (CPU 100% 이면 1 core를 사용하는 것이고 CPU 200% 이면 2 core를 사용하는 것입니다.)

API 요청 때문에 성능 문제가 발생할 경우 vpxd 로그나 vpxd-profiler log를 사용해서 어떤 API가 호출되는지 확인하고 session 수는 얼마나 되는지 등 정보를 확인해서 Troubleshooting 해야 합니다.

DB의 경우 DB 가 사용하는 파티션이 부족한 현상이 발생하는지 확인해야 하고 성능 문제가 있을 경우 profiling 을 해서 성능을 확인해야 합니다. VCSA의 경우 /opt/vmware/vpostgres/current/bin/pg_top -U postgres -d VCDB를 통해서 profiling 정보를 확인할 수 있습니다.

vimtop 명령을 사용해서 vSphere client의 Heap 에 문제가 있는지 확인할 수 있습니다.


감사합니다.




'Virtualization' 카테고리의 다른 글

[VMware] Guest OS Disk timeout 설정  (0) 2019.04.06
vSphere Performance Troubleshoooting and RCA  (0) 2019.03.10
ESXi Internal  (0) 2018.10.20

+ Recent posts