Rocky 9.2
무료 오픈 소스 그래픽 장치 드라이버
프로젝트의 이름은 새로운 것을 의미하는 단어 nouveau에서 유래 됨
NVIDIA 관련 toolkit과 충돌이 발생할 수 있기 때문입니다.
# lsmod | grep nouveau
nouveau 2469888 0
mxm_wmi 16384 1 nouveau
wmi 36864 2 mxm_wmi,nouveau
video 61440 1 nouveau
i2c_algo_bit 16384 1 nouveau
drm_display_helper 172032 1 nouveau
drm_ttm_helper 16384 2 vmwgfx,nouveau
ttm 90112 3 vmwgfx,drm_ttm_helper,nouveau
drm_kms_helper 192512 3 vmwgfx,drm_display_helper,nouveau
drm 581632 8 vmwgfx,drm_kms_helper,drm_display_helper,drm_ttm_helper,ttm,nouveau # vim /etc/default/grub
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=1G-4G:192M,4G-64G:256M,64G-:512M resume=/dev/mapper/rl-swap rd.lvm.lv=rl/root rd.lvm.lv=rl/swap modprobe.blacklist=nouveau rhgb quiet"
GRUB_DISABLE_RECOVERY="true"
GRUB_ENABLE_BLSCFG=true ※ /etc/default/grub: GRUB의 메뉴 정보 및 부팅 과정을 제어하기 위한 파일
# vim /etc/modprobe.d/nouveau-blacklist.conf
blacklist nouveau
options nouveau modeset=0 # grub2-mkconfig -o /boot/grub2/grub.cfg
# grub2-mkconfig -o /boot/efi/EFI/rocky/grub.cfg
# systemctl reboot
# lsmod | grep nouveau
# lspci | grep NVIDIA
03:00.0 3D controller: NVIDIA Corporation GA100 [A100 PCIe 80GB] (rev a1) – SecureBoot가 활성화 되어 있다면 BIOS에서 비활성화 해주시면 됩니다.
# mokutil –sb-state
SecureBoot enabled # mokutil –sb-state
SecureBoot disabled multi-user.target으로 표시되지 않고 graphical.target으로 표시가 되면 변경해 주시면 됩니다.
# systemctl get-default
multi-user.target # systemctl set-default multi-user.target
NVDIA Driver 설치 화면을 보시면 위와 같이 표시됩니다.
사용 하시려는 GPU를 검색합니다.
NVIDIA A100인 경우 낮은 버전의 Driver가 나옵니다.
하단에 보시면 베타 드라이버를 클릭합니다.
설치하시려는 GPU를 검색합니다.
여러가지 버전이 표시되는 것을 확인하실 수 있습니다.
설치하려는 버전을 선택합니다.
Download 버튼을 클릭합니다.
Agree & Download 버튼을 오른쪽 마우스로 클릭하여 Copy link address를 클릭합니다.
Linux에서 이제 명령어를 입력하여 NVIDIA Driver를 다운로드 합니다.
# wget https://us.download.nvidia.com/tesla/535.86.10/NVIDIA-Linux-x86_64-535.86.10.run
# sh NVIDIA-Linux-x86_64-535.86.10.run
OK
Yes
OK
OK
# nvidia-smi
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.86.10 Driver Version: 535.86.10 CUDA Version: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA A100 80GB PCIe Off | 00000000:03:00.0 Off | 0 |
| N/A 40C P0 69W / 300W | 4MiB / 81920MiB | 29% Default |
| | | Disabled |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=======================================================================================|
| No running processes found |
+---------------------------------------------------------------------------------------+ https://youtu.be/n8-wlkZiqio 1. 개요 NFS(Network File System)를 설치하고, rw/ro 및 root_squash 옵션에 따른 접근 제어와 성능을 테스트하는 방법을 정리한 가이드입니다.…
https://youtu.be/4MVxzmepY3s 1. 개요 리눅스에서 정기적으로 실행되는 작업(백업, 로그 정리, 모니터링 등)은 cron 서비스를 통해 자동화할 수 있습니다.…
https://youtu.be/vPfxWFBE1yc 1. 개요 리눅스 서버를 운영할 때 사용자 계정 생성, 비밀번호 설정, 권한 부여, 계정…
https://youtu.be/Gvp2XwBfoKw 1. 개요 리눅스 서버에서는 시스템 시간(OS 시간) 과 하드웨어 시간(RTC, Real-Time Clock) 을 동기화하는 것이 매우 중요합니다. 클러스터…
https://youtu.be/pt9qhawl8LY 1. 개요 리눅스 서버에서는 시스템 시간(OS 시간) 과 하드웨어 시간(RTC, Real-Time Clock) 을 모두 관리할 수 있습니다. 운영체제의…
https://youtu.be/iPdHGXh7DUg 1. 개요 서버 운영 시 시스템 시간이 올바르게 설정되어 있지 않으면 로그 분석, 모니터링,…
댓글 보기