手把手部署 Elasticsearch ：打造你的 RAG 向量數據庫底座

作者：Goldma 2025-07-29 09:04:41

本文將以Elasticsearch 8.15.0為例，從目錄規劃到插件配置，手把手帶你完成生產級部署 —— 無論是單節點測試環境，還是多節點集群，都能快速上手；特別針對 RAG 場景優化了分詞器配置與權限管理，確保后續向量入庫、語義檢索環節穩定高效。跟著操作，10 分鐘內即可搭建好你的 RAG 向量底座！

在大模型與知識庫結合的浪潮中，RAG（檢索增強生成）技術憑借其精準匹配、可控輸出的特性，已成為落地場景中的 “剛需”。而向量數據庫作為 RAG 的 “記憶中樞”，負責高效存儲、檢索海量向量數據，直接決定了整個系統的響應速度與匹配精度。

Elasticsearch（簡稱 ES）作為一款成熟的分布式搜索引擎，不僅具備強大的全文檢索能力，更在 8.x 版本后通過dense_vector類型和knn查詢接口，完美適配了向量存儲與近鄰搜索需求。相較于專用向量數據庫，它支持 “文本 + 向量” 混合檢索、自帶分布式擴展能力，且對中文場景友好（搭配 IK 分詞器可實現精準語義解析），成為中小團隊部署 RAG 系統時的高性價比選擇。

本文將以Elasticsearch 8.15.0為例，從目錄規劃到插件配置，手把手帶你完成生產級部署 —— 無論是單節點測試環境，還是多節點集群，都能快速上手；特別針對 RAG 場景優化了分詞器配置與權限管理，確保后續向量入庫、語義檢索環節穩定高效。跟著操作，10 分鐘內即可搭建好你的 RAG 向量底座！

目錄規劃

通過清晰劃分程序、數據、日志、插件的存儲路徑，實現 Elasticsearch 文件管理的規范化，便于后續維護（如數據備份、日志排查、插件升級）；同時統一設置屬主為es:es，遵循 “最小權限原則”，避免敏感操作風險，為 RAG 場景下的穩定運行奠定基礎。

用途	路徑	屬主
程序	`/opt/elasticsearch-8.15.0`	es:es
數據	`/data/elasticsearch`	es:es
日志	`/var/log/elasticsearch`	es:es
插件	`/opt/elasticsearch-8.15.0/plugins`	es:es

下面來手把手介紹部署流程：

安裝包下載

離線方式：從官網下載安裝包，并上傳到/opt文件夾

https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.15.0-linux-x86_64.tar.gz

在線方式：

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.15.0-linux-x86_64.tar.gz

解壓安裝包

將壓縮包中的程序文件釋放到規劃的程序目錄（/opt/elasticsearch-8.15.0）：

tar -zxvf elasticsearch-8.15.0-linux-x86_64.tar.gz

創建一個專門用于運行 Elasticsearch 的系統用戶es

Elasticsearch 禁止使用root用戶運行（出于安全考慮），創建獨立的es用戶可隔離進程權限，限制其僅能操作 Elasticsearch 相關目錄，避免誤操作影響系統其他組件，符合生產環境安全規范。

useradd -r -s /bin/bash -d /home/es -m es

設置目錄權限（關鍵步驟）

通過chown -R es:es將程序、數據、日志、插件目錄的屬主綁定到es用戶，確保es用戶擁有完整操作權限（讀寫、執行），滿足服務運行需求；
同時防止其他用戶（如root或普通用戶）隨意篡改數據或配置，保障 RAG 場景下向量數據的完整性和安全性。

1.修改用戶資源限制（文件句柄和進程數）

修改/etc/security/limits.conf提升es用戶的文件句柄和進程數限制，避免 Elasticsearch 因 “打開文件數不足”“進程數超限” 導致啟動失敗或運行中斷（尤其在 RAG 場景下，向量數據量大時需高頻讀寫文件）；

# 編輯系統限制文件
vi /etc/security/limits.conf


# 在文件末尾添加以下內容（針對es用戶的限制）：
es soft nofile 65536  # 軟限制：最多打開的文件句柄數
es hard nofile 65536  # 硬限制：最多打開的文件句柄數
es soft nproc 4096    # 軟限制：最多創建的進程數
es hard nproc 4096    # 硬限制：最多創建的進程數

注意事項：

若之前的系統中/etc/profile或/etc/profile.d/目錄下有ulimit相關設置（如ulimit -n 20480），可能會覆蓋上述配置，需檢查并刪除：

# 檢查是否有沖突的配置
grep ulimit /etc/profile /etc/profile.d/* 2>/dev/null

若輸出類似/etc/profile:ulimit -n 20480的內容，編輯對應文件（如vi /etc/profile），注釋或刪除該行為即可。

2. 修改虛擬內存限制（內核參數）

調整vm.max_map_count內核參數，滿足 Elasticsearch 對內存映射區域的需求（向量檢索依賴內存高效訪問，足夠的映射區域可提升查詢性能）。

# 編輯內核參數文件
vi /etc/sysctl.conf

在文件末尾添加以下內容，提升內存映射區域限制（Elasticsearch要求至少262144，此處設為655360更寬松）：

vm.max_map_count=655360

保存后執行以下命令使配置生效：

sysctl -p

修改 Elasticsearch 核心配置文件（elasticsearch.yml）

主要實現：

自定義集群 / 節點名稱、網絡綁定 IP 和端口，確保服務可被 RAG 系統的應用層（如 API 服務）訪問；
配置數據和日志路徑，與前期規劃的目錄對應，避免文件存儲混亂；
開啟跨域支持，允許 Kibana（可視化工具）或 RAG 應用直接調用 Elasticsearch 的 API；
單節點 / 多節點配置分別適配測試環境和生產環境：單節點簡化部署，適合快速驗證 RAG 流程；多節點集群通過分布式存儲和負載均衡，提升向量數據的可靠性和檢索效率。

配置文件路徑為/opt/elasticsearch-8.15.0/config/elasticsearch.yml，需要根據 “單節點” 或 “多節點集群” 場景修改，以下分別說明：

場景 1：單節點部署（適合測試或小型環境）

單節點配置無需復雜的集群發現設置，只需指定基礎路徑、網絡和跨域等參數：

1. 編輯配置文件

vi /opt/elasticsearch-8.15.0/config/elasticsearch.yml

2. 添加 / 修改以下配置（按實際 IP 和需求調整）：

# 集群名稱（自定義，如cluster-es）
cluster.name: cluster-es
# 節點名稱（單節點可設為node-1）
node.name: node-1
# 網絡綁定：填寫當前IP（如192.168.1.100，若允許所有IP訪問可設為0.0.0.0）
network.host: 192.168.1.100
# HTTP端口（默認9200，可自定義）
http.port: 9200
# 傳輸端口（節點間通信，默認9300）
transport.port: 9300
# 最大請求體大小（支持大文件上傳，如200MB）
http.max_content_length: 200mb
# 跨域配置（允許外部工具如Kibana、Cerebro訪問）
http.cors.enabled: true
http.cors.allow-origin: "*"
# 單節點模式（無需發現其他節點）
discovery.type: single-node
# 路徑配置（按規劃的目錄修改）
# 數據存儲路徑
path.data: /data/elasticsearch
# 日志存儲路徑
path.logs: /var/log/elasticsearch

3. 關鍵參數說明：

path.data和path.logs必須指向之前創建的/data/elasticsearch和/var/log/elasticsearch，且屬主為es:es。
network.host若設為0.0.0.0，表示允許所有 IP 訪問（適合虛擬機/服務器內測試）；若需限制訪問，填寫具體 IP。

場景 2：多節點集群部署（以 3 節點為例）

若部署集群，需確保各節點配置統一的集群名稱，且差異化配置節點名稱、IP 等。以下以 “節點 1” 為例，其他節點僅需修改node.name和network.host，并保持其他參數一致。

1. 編輯節點 1 的配置文件

vi /opt/elasticsearch-8.15.0/config/elasticsearch.yml

2. 添加 / 修改以下配置：

# 集群名稱（所有節點必須相同）
cluster.name: cluster-es
# 節點1名稱（每個節點唯一，如node-1）
node.name: node-1
# 節點1的IP（如192.168.1.101）
network.host: 192.168.1.101
# HTTP端口（所有節點保持一致，如9200）
http.port: 9200
# 傳輸端口（所有節點保持一致，如9300）
transport.port: 9300
# 最大請求體大小
http.max_content_length: 200mb
# 跨域配置
http.cors.enabled: true
http.cors.allow-origin: "*"
# 路徑配置（所有節點統一按規劃目錄）
path.data: /data/elasticsearch
path.logs: /var/log/elasticsearch
# 集群發現配置（所有節點需包含集群內所有節點的IP:9300）
discovery.seed_hosts: ["192.168.1.101:9300", "192.168.1.102:9300", "192.168.1.103:9300"]
# 初始主節點候選列表（首次啟動時生效，填所有節點名稱，如node-1、node-2、node-3）
cluster.initial_master_nodes: ["node-1", "node-2", "node-3"]
# 節點角色（默認同時作為主節點和數據節點，適合3節點集群）
node.master: true  # 允許參與主節點選舉
node.data: true    # 允許存儲數據

3. 其他節點配置：

節點 2：修改node.name: node-2、network.host: 192.168.1.102，其他參數與節點 1 一致。
節點 3：修改node.name: node-3、network.host: 192.168.1.103，其他參數與節點 1 一致。

安裝 IK 分詞器（離線方式）

Elasticsearch 默認分詞器對中文支持較差（會將詞語拆分為單個字），而 RAG 場景需要基于中文語義的精準檢索。IK 分詞器可對中文文本進行智能拆分（如 “中華人民共和國” 拆分為 “中華人民共和國”“人民共和國” 等），提升文本向量轉化的準確性，進而優化 RAG 的檢索匹配效果。

下載與 Elasticsearch 8.15.0 版本匹配的 IK 分詞器，上傳到虛擬機/服務器的/opt目錄（與 Elasticsearch 安裝包同路徑方便操作）

https://release.infinilabs.com/analysis-ik/stable/elasticsearch-analysis-ik-8.15.0.zip

2. 解壓插件到 Elasticsearch 插件目錄，Elasticsearch 插件目錄為/opt/elasticsearch-8.15.0/plugins，需創建ik子目錄并解壓：

# 創建 IK 插件目錄（必須命名為 analysis-ik，否則 ES 無法識別）
mkdir -p /opt/elasticsearch-8.15.0/plugins/analysis-ik
# 進入插件目錄
cd /opt/elasticsearch-8.15.0/plugins/analysis-ik
# 使用內置 jar 命令解壓 IK 分詞器
/opt/elasticsearch-8.15.0/jdk/bin/jar xf /opt/elasticsearch-analysis-ik-8.15.0.zip
# 驗證解壓結果
ls /opt/elasticsearch-8.15.0/plugins/analysis-ik

3. 設置插件目錄權限，確保插件目錄屬主為es:es：

chown -R es:es /opt/elasticsearch-8.15.0/plugins/analysis-ik

安裝 IK 分詞器（在線方式）

確保你已經進入到 Elasticsearch 的安裝目錄，然后使用 Elasticsearch 的插件管理工具來安裝 IK 插件。注意要確保使用的插件版本與你的 Elasticsearch 版本兼容。

cd /opt/elasticsearch-8.15.0
# 安裝 IK 插件，注意替換版本號為 8.15.0
bin/elasticsearch-plugin install https://get.infini.cloud/elasticsearch/analysis-ik/8.15.0

啟動 Elasticsearch 服務

通過es用戶啟動服務，使配置生效并運行進程；后臺啟動（-d）適合生產環境，前臺啟動（無-d）便于調試日志查看；啟動后驗證端口監聽狀態和 IK 分詞器功能，確保服務正常可用，為 RAG 系統接入向量數據做好準備。

1. 切換到es用戶

su - es  # 切換到es用戶（-表示加載用戶環境變量）

2. 啟動服務（后臺運行）

/opt/elasticsearch-8.15.0/bin/elasticsearch -d

建議首次運行，使用/opt/elasticsearch-8.15.0/bin/elasticsearch前臺啟動，會打印elastic 用戶的初始密碼、CA 證書指紋等，需要記住初始密碼。

3. 驗證啟動是否成功

啟動后等待 1-2 分鐘，執行以下命令檢查服務狀態：

# 查看9200端口是否監聽（需用root用戶或有權限的用戶執行）
netstat -tpln | grep 9200

4. 驗證 IK 分詞器是否生效

curl --cacert /opt/elasticsearch-8.15.0/config/certs/http_ca.crt \
  -u elastic:你的密碼 \
  -X GET "https://192.168.1.101:9200/_analyze?pretty" \
  -H 'Content-Type: application/json' \
  -d '{
    "analyzer": "ik_max_word",
    "text": "中華人民共和國國歌"
  }'

若返回分詞結果（如["中華人民共和國", "中華人民", "中華", "華人", "人民共和國",...]），說明 IK 分詞器安裝成功。

修改es密碼（如需要）

Elasticsearch 默認啟用安全認證，首次啟動生成的初始密碼為臨時密碼，修改為自定義強密碼可防止未授權訪問（RAG 場景下向量數據庫包含業務敏感信息，需嚴格控制訪問權限）。

curl -k -u elastic:初始密碼 -X POST "https://192.168.1.101:9200/_security/user/elastic/_password" \
  -H "Content-Type: application/json" \
  -d '{"password":"新密碼"}'

Elasticsearch 的能力遠不止于基礎部署 —— 在 RAG 場景中，它的向量檢索優化、索引設計、性能調優等深度特性，將直接影響大模型回答的精準度與響應速度，后續會持續深挖ES的深度特性。

責任編輯：龐桂玉來源：小白學AI算法

Elasticsea RAG 向量數據庫檢索增強生成