Skip to content

Commit

Permalink
Site updated: 2024-06-04 09:34:57
Browse files Browse the repository at this point in the history
  • Loading branch information
zhaozhiming committed Jun 4, 2024
1 parent d2b51b0 commit e2fcc7d
Show file tree
Hide file tree
Showing 2 changed files with 4 additions and 4 deletions.
2 changes: 1 addition & 1 deletion 2024/06/01/llamaindex-llama3-es-hybrid-search/index.html
Original file line number Diff line number Diff line change
Expand Up @@ -174,7 +174,7 @@ <h2 id="多种检索方式"><a href="#多种检索方式" class="headerlink" tit
<ul>
<li>首先定义了一个 ElasticsearchStore 对象来连接 ElaticSearch 本地服务</li>
<li>然后使用 SimpleDirectoryReader 加载本地的文档数据</li>
<li>使用 SentenceSplitter 对文档进行分块处理,应为 TEI 的输入 Token 数最大只能 512,所以这里的 chunk_size 设置为 256,chunk_overlap 设置为 50</li>
<li>使用 SentenceSplitter 对文档进行分块处理,因为 TEI 的输入 Token 数最大只能 512,所以这里的 chunk_size 设置为 256,chunk_overlap 设置为 50</li>
<li>构建 StorageContext 对象,指定向量存储为之前定义的 ElasticsearchStore 对象</li>
<li>创建一个自定义 Embeddings 对象,使用的是 TEI 部署的 Embeddings 模型服务,这里<code>CustomEmbeddings</code>的代码可以参考<a href="https://zhaozhiming.github.io/2024/01/13/llamaindex-eleasticsearch-rga-practice/">这篇文章</a>中的代码</li>
<li>最后使用 VectorStoreIndex 对象将文档数据入库</li>
Expand Down
Loading

0 comments on commit e2fcc7d

Please sign in to comment.