**Ubuntu Server trên Proxmox: "Biến" máy ảo thành cỗ máy AI GPU NVIDIA chỉ trong tích tắc**

Ubuntu Server trên Proxmox: "Biến" máy ảo thành cỗ máy AI GPU NVIDIA chỉ trong tích tắc

Bạn đang sở hữu một máy chủ Proxmox mạnh mẽ với GPU NVIDIA và muốn khai thác tối đa sức mạnh của nó cho các tác vụ trí tuệ nhân tạo (AI)? Bài viết này sẽ cung cấp hướng dẫn chi tiết, từng bước để bạn tạo một máy chủ Ubuntu Server được tối ưu hóa, sẵn sàng cho việc huấn luyện mô hình học máy, suy luận và triển khai các ứng dụng AI tiên tiến. Chúng ta sẽ tập trung vào việc đảm bảo hiệu suất cao, độ ổn định và khả năng tương thích với các framework AI phổ biến như PyTorch, TensorFlow và đặc biệt là các mô hình ngôn ngữ lớn (LLM) đang ngày càng phổ biến.

Điều Kiện Tiên Quyết

  • Máy chủ Proxmox đã được cài đặt và cấu hình hoàn chỉnh.
  • GPU NVIDIA đã được cách ly thành công thông qua công nghệ passthrough (tham khảo các hướng dẫn trước đó để đảm bảo quá trình này diễn ra suôn sẻ).
  • File ISO Ubuntu Server LTS (Long Term Support) phiên bản mới nhất đã được tải lên bộ nhớ của Proxmox.
  • Đã phân bổ tài nguyên máy ảo phù hợp: số lượng lõi CPU, dung lượng RAM và dung lượng lưu trữ.
  • Kết nối mạng ổn định đến máy chủ Proxmox.

Giai Đoạn 1: Tạo Máy Ảo Proxmox – Cấu Hình Tối Ưu Cho AI

Truy cập vào giao diện quản lý Proxmox và nhấp vào nút "Tạo máy ảo". Hãy chú ý đến từng tab cấu hình, vì các thiết lập ở đây sẽ ảnh hưởng trực tiếp đến hiệu suất và khả năng nhận diện GPU của máy ảo.

General Tab

Đặt tên cho máy ảo một cách mô tả rõ ràng (ví dụ: "ubuntu-ai-server", "llm-vm") để dễ dàng quản lý sau này. Proxmox sẽ tự động gán một ID duy nhất cho máy ảo.

OS Tab

Chọn "Linux" làm loại hệ điều hành và chọn file ISO Ubuntu Server LTS đã tải lên. Giữ nguyên mục "Loại" là Linux – Proxmox sẽ tự động phát hiện bản phân phối.

System Tab – Yếu Tố Quyết Định Cho GPU Passthrough Hiện Đại

Đây là tab quan trọng nhất đối với các tác vụ liên quan đến GPU. Tuyệt đối chọn OVMF (UEFI) làm BIOS. Các GPU NVIDIA hiện đại yêu cầu firmware UEFI để khởi tạo chính xác. Không sử dụng SeaBIOS, vì nó có thể gây ra các vấn đề tương thích với tính năng truyền GPU trực tiếp. Chọn ô "Thêm ổ đĩa EFI" và phân bổ dung lượng 1 GB. Đặt Machine thành q35 (mặc định của Proxmox) và SCSI Controller thành VirtIO SCSI để tối ưu hóa hiệu suất lưu trữ. Việc sử dụng VirtIO SCSI giúp giảm thiểu độ trễ và tăng tốc độ truy cập dữ liệu.

CPU Tab – Tập Lệnh AVX/AVX2 và Số Lượng Lõi

Phân bổ 4-16 lõi CPU tùy thuộc vào cấu hình CPU của máy chủ và khối lượng công việc dự kiến. Đặt Loại CPU thành “host”. Điều này là bắt buộc để tận dụng tối đa hiệu năng. Loại CPU “host” cho phép máy ảo truy cập trực tiếp vào các tập lệnh của CPU vật lý, bao gồm AVX và AVX2, vốn được tối ưu hóa cho các thư viện AI như PyTorch và TensorFlow. Nếu không có loại CPU “host”, hiệu suất AI sẽ giảm đáng kể. Theo các benchmark gần đây, việc sử dụng CPU "host" có thể cải thiện hiệu suất huấn luyện mô hình lên đến 30%.

Tab Bộ Nhớ – Cân Bằng Giữa Hiệu Năng và Ổn Định

Phân bổ một lượng RAM cố định (ví dụ: 32 GB, 64 GB hoặc 128 GB) tùy thuộc vào dung lượng RAM khả dụng và quy mô khối lượng công việc dự kiến. Bỏ chọn “Thiết bị Ballooning”. Ballooning cho phép Proxmox tự động điều chỉnh RAM của máy ảo, gây ra hiện tượng chậm trễ và lỗi bộ nhớ cache trong quá trình huấn luyện hoặc suy luận AI. Khối lượng công việc AI yêu cầu phân bổ bộ nhớ ổn định. Việc phân bổ RAM cố định giúp đảm bảo hiệu suất ổn định và tránh các vấn đề về bộ nhớ trong quá trình xử lý dữ liệu lớn.

Network Tab

Để nguyên các thiết lập mặc định. Proxmox sẽ tự động gán một card mạng ảo và sử dụng DHCP để cung cấp địa chỉ IP.

Xác Nhận và Tạo

Xem lại tất cả các thiết lập và nhấp vào "Hoàn tất" để tạo máy ảo.

Giai Đoạn 2: Cài Đặt Hệ Điều Hành và Khởi Động Lần Đầu

Nhấp vào "Bắt đầu" để khởi động máy ảo. Mở tab "Console" trong Proxmox để theo dõi quá trình khởi động. Trình cài đặt Ubuntu sẽ xuất hiện trong vài giây.

Làm theo các hướng dẫn cài đặt tiêu chuẩn: chọn ngôn ngữ, bố cục bàn phím, cấu hình mạng và thiết lập lưu trữ. Khi đến màn hình Lưu trữ, hãy chấp nhận mặc định – sử dụng toàn bộ ổ đĩa ảo. Nhập tên máy chủ (ví dụ: "ai-server") và tạo tài khoản người dùng với mật khẩu mạnh.

Quan trọng: Khi đến màn hình Chọn phần mềm, hãy đảm bảo hộp OpenSSH được ĐÁNH DẤU. Điều này cho phép bạn kết nối từ xa qua SSH, thuận tiện hơn so với việc sử dụng bảng điều khiển Proxmox.

Để quá trình cài đặt hoàn tất và khởi động lại máy ảo.

Giai Đoạn 3: Dọn Dẹp Sau Cài Đặt – Những Việc Cần Làm

Sau khi máy ảo khởi động, đăng nhập bằng thông tin đăng nhập đã tạo. Chạy các lệnh sau:

sudo apt update && sudo apt upgrade -y

Lệnh này cập nhật kho gói phần mềm và cài đặt các bản vá bảo mật. Tiếp theo, cài đặt các tiện ích thiết yếu:

sudo apt install qemu-guest-agent neofetch htop -y
  • qemu-guest-agent: Cho phép Proxmox giám sát máy ảo và thực hiện các lệnh tắt máy sạch.
  • neofetch: Hiển thị thông tin hệ thống.
  • htop: Trình giám sát tiến trình tương tác.

Khởi động lại máy ảo:

sudo reboot

Kiểm tra trạng thái của QEMU Guest Agent:

sudo systemctl status qemu-guest-agent

Đảm bảo trạng thái là "active (running)". Nếu không, khởi động lại:

sudo systemctl restart qemu-guest-agent

Quay lại giao diện Proxmox và làm mới. Bạn sẽ thấy địa chỉ IP của máy ảo trong mục "IPs".

Giai Đoạn 4: Cài Đặt Trình Điều Khiển NVIDIA

Đây là bước quan trọng để GPU được nhận diện. Nếu tính năng truyền GPU được cấu hình chính xác, GPU của bạn sẽ được nhận diện ở đây. Nếu không, hãy kiểm tra lại cấu hình IOMMU và danh sách đen của máy chủ.

Sử dụng công cụ ubuntu-drivers tích hợp sẵn:

sudo ubuntu-drivers list

Lệnh này sẽ hiển thị các trình điều khiển NVIDIA có sẵn. Ưu tiên các phiên bản mã nguồn mở (có hậu tố -open) để đảm bảo độ ổn định. Cài đặt trình điều khiển được đề xuất:

sudo ubuntu-drivers autoinstall

Quá trình này sẽ cài đặt trình điều khiển phù hợp. Khởi động lại máy ảo:

sudo reboot

Sau khi khởi động lại, chạy:

nvidia-smi

Nếu mọi thứ hoạt động chính xác, bạn sẽ thấy thông tin về GPU, phiên bản trình điều khiển và bộ nhớ. Nếu lệnh này thất bại, hãy kiểm tra lại cấu hình Proxmox và đảm bảo GPU không nằm trong danh sách đen.

Những Điều Cần Kiểm Tra

  • Tên GPU: Xác nhận GPU của bạn đã được truyền thành công.
  • Phiên bản trình điều khiển: Đảm bảo trình điều khiển đã được cài đặt đúng cách.
  • Phiên bản CUDA: Kiểm tra khả năng tương thích với các framework AI. CUDA Toolkit 12.3 là phiên bản mới nhất tính đến thời điểm hiện tại (tháng 10/2023).
  • Bộ nhớ: Xác nhận toàn bộ VRAM có thể truy cập được.

Giám Sát GPU Thời Gian Thực (Tùy Chọn)

Cài đặt:

sudo apt install nvtop

Chạy:

nvtop

Công cụ này cung cấp giao diện trực quan để giám sát việc sử dụng GPU.

Bước Tiếp Theo: Cài Đặt Ollama và Chạy LLM

Bây giờ bạn đã có một máy chủ Ubuntu ổn định, được tăng tốc bằng GPU, sẵn sàng cho việc phát triển AI. Hệ thống có bộ nhớ cố định, truyền CPU đúng cách và nhận diện GPU đã được xác minh. Bước tiếp theo là cài đặt Ollama – một công cụ đơn giản và mạnh mẽ để tải xuống và chạy các LLM mã nguồn mở. Với Ollama, bạn có thể chạy các mô hình như Llama 2 7B chỉ trong vòng vài phút. Truy cập ollama.com để biết thêm chi tiết và hướng dẫn cài đặt.

Kết Luận: Nền Tảng Vững Chắc Cho AI và LLM

Bạn đã thành công "biến" một máy ảo Proxmox thành một cỗ máy AI GPU NVIDIA mạnh mẽ. Với cấu hình tối ưu này, bạn có thể tự tin khám phá thế giới AI, huấn luyện các mô hình phức tạp và triển khai các ứng dụng sáng tạo. Hãy nhớ theo dõi các bản cập nhật trình điều khiển NVIDIA và các framework AI để đảm bảo hiệu suất tốt nhất.

Từ khóa chính: Ubuntu Server trên Proxmox: "Biến" máy ảo thành cỗ máy AI GPU NVIDIA chỉ trong tích tắc

Từ khóa phụ: GPU passthrough, NVIDIA, AI, LLM, Ubuntu Server, Proxmox, CUDA, huấn luyện mô hình, suy luận AI, Ollama.

Mới hơn Cũ hơn