Yêu cầu phần cứng tối thiểu cho môi trường AI Vector
Để triển khai PostgreSQL với extension pgvector và chạy các mô hình Embedding qua LlamaIndex, server cần đáp ứng các yêu cầu sau để đảm bảo hiệu năng và độ ổn định.
CPU: Tối thiểu 4 nhân (vCore). Các tác vụ vector search và tính toán embedding đòi hỏi khả năng xử lý song song. Khuyến nghị sử dụng CPU thế hệ mới (Intel Xeon Scalable hoặc AMD EPYC) để tối ưu hóa qua AVX2/AVX-512.
RAM: Tối thiểu 16GB. PostgreSQL cần RAM để cache dữ liệu (shared_buffers), trong khi Python và các thư viện AI (như numpy, torch) tiêu tốn nhiều bộ nhớ. Nếu chạy mô hình embedding trực tiếp trên server, cần cộng thêm 8-16GB tùy kích thước model.
Storage: Tối thiểu 100GB SSD NVMe. pgvector lưu trữ vector dạng nhị phân và index HNSW cần tốc độ I/O cao. HDD truyền thống sẽ gây nghẽn cổ chai nghiêm trọng khi thực hiện truy vấn tìm kiếm tương tự.
Network: Băng thông 1Gbps trở lên. Việc truyền tải dữ liệu embedding từ client về server hoặc giữa các microservices cần đường truyền ổn định.
Verify yêu cầu phần cứng
Trên máy ảo hoặc server thật, chạy lệnh sau để kiểm tra cấu hình hiện tại.
lscpu | grep -E "Model name|CPU(s)" && free -h && df -h /
Kết quả mong đợi: Dòng CPU hiển thị số nhân >= 4, cột "Mem:" trong free -h >= 16G, và cột "Available" trong df -h >= 100G cho partition root (/).
Tải và cài đặt Ubuntu 24.04 LTS
Ubuntu 24.04 LTS (Noble Numbat) là phiên bản Long Term Support mới nhất, mang theo kernel 6.8 và các công cụ hệ thống tối ưu cho workload AI.
Xuất bản ISO và chuẩn bị môi trường ảo
Tải file ISO chính thức từ trang chủ Ubuntu. Đảm bảo chọn phiên bản "Desktop" nếu cần GUI để debug, hoặc "Server" nếu chỉ chạy command line. Phiên bản Server nhẹ hơn và phù hợp cho production.
curl -O https://releases.ubuntu.com/24.04/ubuntu-24.04-live-server-amd64.iso
Kết quả mong đợi: File iso được tải về thư mục hiện tại với kích thước khoảng 1.5GB. Hash SHA256 của file cần khớp với file checksum trên trang Ubuntu để đảm bảo tính toàn vẹn.
Cài đặt hệ điều hành (Cloud/VPS hoặc VM)
Nếu bạn đang sử dụng VPS (AWS, DigitalOcean, Vultr, Azure...), hãy chọn image "Ubuntu 24.04 LTS" trực tiếp từ marketplace. Nếu cài trên máy ảo (VMware/VirtualBox), mount file ISO vừa tải vào CD/DVD drive và boot máy.
Trong quá trình cài đặt, cấu hình các mục quan trọng sau:
- Language: Chọn "English (US)" để tránh lỗi encoding trong các thư viện Python và log hệ thống.
- Keyboard layout: Chọn "US International" hoặc tương đương để hỗ trợ gõ ký tự đặc biệt.
- Profile setup: Tạo user root hoặc sudo user với username là "admin" hoặc tên kỹ thuật viên.
- Storage configuration: Chọn "Use entire disk" (Cài vào toàn bộ ổ cứng) hoặc phân vùng thủ công nếu cần tách /var.
- SSH Setup: Tích chọn "Install OpenSSH server". Sau đó upload SSH key public của bạn vào mục "Import SSH keys" để truy cập ngay lập tức.
Kết quả mong đợi: Hệ thống khởi động xong, màn hình login xuất hiện. Bạn có thể SSH vào máy bằng lệnh ssh admin@IP_SERVER (với IP là địa chỉ công của server).
Verify cài đặt thành công
Đăng nhập vào server và kiểm tra phiên bản hệ điều hành.
cat /etc/os-release
Kết quả mong đợi: Dòng "VERSION=" hiển thị "24.04.1 LTS (Noble Numbat)" và "PRETTY_NAME=" hiển thị "Ubuntu 24.04.1 LTS".
Cập nhật hệ thống và cài đặt công cụ cơ bản
Sau khi cài đặt, hệ thống cần được cập nhật lên phiên bản mới nhất để vá các lỗ hổng bảo mật và đồng bộ nguồn gói (repository). Tiếp theo là cài đặt các gói nền tảng cho việc compile code và quản lý source.
Cập nhật gói phần mềm và nâng cấp hệ thống
Chạy lệnh cập nhật danh sách gói từ repository chính và nâng cấp các gói hiện có lên phiên bản mới nhất.
sudo apt update && sudo apt upgrade -y
Kết quả mong đợi: Quá trình chạy xong, không báo lỗi "Failed to fetch". Dòng cuối cùng hiển thị thông báo "0 upgraded, 0 newly installed, 0 to remove" (nếu đã mới nhất) hoặc liệt kê các gói đã được nâng cấp.
Cài đặt Git, Curl và Build-essential
Git cần thiết để clone mã nguồn LlamaIndex và các dự án liên quan.
Curl dùng để tải file và gọi API.
Build-essential bao gồm GCC, G++, make, cần thiết để compile các thư viện C/C++ từ nguồn (source) khi cài đặt Python packages phức tạp như numpy hay pgvector.
sudo apt install -y git curl build-essential
Kết quả mong đợi: Hệ thống báo "Setting up git", "Setting up curl", "Setting up build-essential". Không có dòng nào báo lỗi.
Cấu hình Git user (Bắt buộc)
Để tránh cảnh báo mỗi khi commit, hãy cấu hình tên và email của bạn trong Git ngay từ đầu.
git config --global user.email "your.email@example.com" && git config --global user.name "Your Name"
Kết quả mong đợi: Lệnh chạy không báo lỗi. Kiểm tra bằng lệnh git config --list sẽ thấy email và name đã được gán.
Verify toàn bộ công cụ
Chạy lệnh kiểm tra phiên bản của từng công cụ đã cài đặt để đảm bảo chúng hoạt động đúng.
git --version && curl --version && gcc --version
Kết quả mong đợi:
- Git hiển thị phiên bản >= 2.43 (phiên bản mặc định trong Ubuntu 24.04).
- Curl hiển thị phiên bản >= 8.6.0.
- gcc hiển thị phiên bản >= 13.2.0.
Nếu cả 3 dòng đều hiển thị phiên bản cụ thể mà không báo "command not found", môi trường cơ bản đã sẵn sàng cho các bước tiếp theo.
Điều hướng series:
Mục lục: Series: Triển khai Database AI với pgvector, LlamaIndex và Ubuntu 24.04
Phần 2: Cài đặt và cấu hình PostgreSQL trên Ubuntu 24.04 »