diff --git a/docs/agreement/disclaimer/index.html b/docs/agreement/disclaimer/index.html index c569933e851..61c958ed9de 100644 --- a/docs/agreement/disclaimer/index.html +++ b/docs/agreement/disclaimer/index.html @@ -1,5 +1,4 @@ -
FastGPT 商业版相关说明
FastGPT 商业版是基于 FastGPT 开源版的增强版本,增加了一些独有的功能。只需安装一个商业版镜像,并在开源版基础上填写对应的内网地址,即可快速使用商业版。
FastGPT 商业版软件根据不同的部署方式,分为 3 类收费模式。下面列举各种部署方式一些常规内容,如仍有问题,可联系咨询
共有服务
特有服务
🤖
6个版本的升级服务不是指只能用 6 个版本,而是指依赖 FastGPT 团队提供的升级服务。大部分时候,建议自行升级,也不麻烦。
根据需求,定制实现某个需求的编排功能,最终会交付一个应用编排。可根据实际情况商讨。
2000 ~ 3000元/人/天
大部分更新升级,重新拉镜像,然后执行一下初始化脚本就可以了,不需要执行额外操作。
跨版本更新或复杂更新可参考文档自行更新;或付费支持,标准与技术服务费一致。
请填写咨询问卷,我们会尽快与您联系。
如何交付?
完整版应用 = 开源版镜像 + 商业版镜像
我们会提供一个商业版镜像给你使用,该镜像需要一个 License 启动。
二次开发如何操作?
可自行修改开源版代码进行二次开发,不支持修改商业版镜像。
Sealos 云服务属于按量计费,下面是它的价格表:
navigate_before 数据集
FastGPT 数据集中文件与数据的设计方案
线上版定价 navigate_next
FastGPT 线上版定价
加入 FastGPT 开发者社区和我们一起成长
FastGPT 是一个由用户和贡献者参与推动的开源项目,如果您对产品使用存在疑问和建议,可尝试以下方式寻求支持。我们的团队与社区会竭尽所能为您提供帮助。
📱 扫码加入社区微信交流群👇
🐞 请将任何 FastGPT 的 Bug、问题和需求提交到 GitHub Issue。
navigate_before 免责声明
FastGPT 免责声明
知识库搜索原理
在知识库搜索的方式上,FastGPT提供了三种方式,分别为“语义检索”“增强语义检索”“混合检索”。
语义检索是通过向量距离,计算用户问题与知识库内容的距离,从而得出“相似度”,当然这并不是语文上的相似度,而是数学上的。
优点:
缺点:
才用传统的全文检索方式。适合查找关键的主谓语等。
同时使用向量检索和全文检索,并通过 RRF 公式进行两个搜索结果合并,一般情况下搜索结果会更加丰富准确。
由于混合检索后的查找范围很大,并且无法直接进行相似度过滤,通常需要进行利用重排模型进行一次结果重新排序,并利用重排的得分进行过滤。
利用ReRank模型对搜索结果进行重排,绝大多数情况下,可以有效提高搜索结果的准确率。不过,重排模型与问题的完整度(主谓语齐全)有一些关系,通常会先走问题补全后再进行搜索-重排。重排后可以得到一个0-1的得分,代表着搜索内容与问题的相关度,该分数通常比向量的得分更加精确,可以根据得分进行过滤。
ReRank
0-1
FastGPT 会使用 RRF 对重排结果、向量搜索结果、全文检索结果进行合并,得到最终的搜索结果。
RRF
每次搜索最多引用n个tokens的内容。
n
tokens
之所以不采用top k,是发现在混合知识库(问答库、文档库)时,不同chunk的长度差距很大,会导致top k的结果不稳定,因此采用了tokens的方式进行引用上限的控制。
top k
chunk
一个0-1的数值,会过滤掉一些低相关度的搜索结果。
该值仅在语义检索或使用结果重排时生效。
语义检索
结果重排
navigate_before Web 站点同步
FastGPT Web 站点同步功能介绍和使用方式
高级编排介绍 navigate_next
快速了解 FastGPT 高级编排
快速体验 FastGPT 基础功能
更多使用技巧,查看视屏教程
开始前,请准备一份测试电子文档,WORD,PDF,TXT,excel,markdown 都可以,比如公司休假制度,不涉密的销售说辞,产品知识等等。
这里使用 FastGPT 中文 README 文件为例。
首先我们需要创建一个知识库。
知识库创建完之后我们需要上传一点内容。
上传内容这里有四种模式:
这里,我们选择 QA 拆分,让 AI 自动生成问答,若问答质量不高,可以后期手动修改。
点击上传后我们需要等待数据处理完成,等到我们上传的文件状态为可用。
点击「应用」按钮来新建一个应用,这里有四个模板,我们选择「知识库 + 对话引导」。
应用创建后来再应用详情页找到「知识库」模块,把我们刚刚创建的知识库添加进去。
添加完知识库后记得点击「保存并预览」,这样我们的应用就和知识库关联起来了。
然后我们就可以愉快的开始聊天啦。
navigate_before 快速了解 FastGPT
FastGPT 的能力与优势
Web 站点同步 navigate_next
该功能目前仅向商业版用户开放。
Web 站点同步利用爬虫的技术,可以通过一个入口网站,自动捕获同域名下的所有网站,目前最多支持200个子页面。出于合规与安全角度,FastGPT 仅支持静态站点的爬取,主要用于各个文档站点快速构建知识库。
同域名
200
静态站点
Tips: 国内的媒体站点基本不可用,公众号、csdn、知乎等。可以通过终端发送curl请求检测是否为静态站点,例如:
curl
+Table of Contents什么是 Web 站点同步如何使用1. 新建知识库,选择 Web 站点同步2. 点击配置站点信息3. 填写网址和选择器创建应用,绑定知识库选择器如何使用首先打开浏览器调试面板(通常是 F12,或者【右键 - 检查】)输入对应元素的选择器多选择器使用
curl https://doc.fastgpt.in/docs/intro/ -
curl https://doc.fastgpt.in/docs/intro/
好了, 现在点击开始同步,静等系统自动抓取网站信息即可。
选择器是 HTML CSS JS 的产物,你可以通过选择器来定位到你需要抓取的具体内容,而不是整个站点。使用方式为:
菜鸟教程 css 选择器,具体选择器的使用方式可以参考菜鸟教程。
上图中,我们选中了一个区域,对应的是div标签,它有 data-prismjs-copy, data-prismjs-copy-success, data-prismjs-copy-error 三个属性,这里我们用到一个就够。所以选择器是: -div[data-prismjs-copy]
div
data-prismjs-copy
data-prismjs-copy-success
data-prismjs-copy-error
div[data-prismjs-copy]
除了属性选择器,常见的还有类和ID选择器。例如:
上图 class 里的是类名(可能包含多个类名,都是空格隔开的,选择一个即可),选择器可以为:.docs-content
.docs-content
在开头的演示中,我们对 FastGPT 文档是使用了多选择器的方式来选择,通过逗号隔开了两个选择器。
我们希望选中上图两个标签中的内容,此时就需要两组选择器。一组是:.docs-content .mb-0.d-flex,含义是 docs-content 类下同时包含 mb-0和d-flex 两个类的子元素;
.docs-content .mb-0.d-flex
docs-content
mb-0
d-flex
另一组是.docs-content div[data-prismjs-copy],含义是docs-content 类下包含data-prismjs-copy属性的div元素。
.docs-content div[data-prismjs-copy]
把两组选择器用逗号隔开即可:.docs-content .mb-0.d-flex, .docs-content div[data-prismjs-copy]
.docs-content .mb-0.d-flex, .docs-content div[data-prismjs-copy]
navigate_before 快速上手
知识库搜索参数 navigate_next
# 设置安全凭证(即oneapi中的渠道密钥) 默认值:sk-aaabbbcccdddeeefffggghhhiiijjjkkk 也可以通过环境变量引入:sk-key。有关docker环境变量引入的方法请自寻教程,此处不再赘述。
为 chatglm2 和 m3e-large 各添加一个渠道,参数如下:
这里我填入 m3e 作为向量模型,chatglm2 作为语言模型
curl 例子:
+
curl --location --request POST 'https://domain/v1/embeddings' \ --header 'Authorization: Bearer sk-aaabbbcccdddeeefffggghhhiiijjjkkk' \ --header 'Content-Type: application/json' \ @@ -75,7 +74,7 @@ "maxToken": 1800 } ], -
curl --location --request POST 'https://domain/v1/embeddings' \ --header 'Authorization: Bearer sk-aaabbbcccdddeeefffggghhhiiijjjkkk' \ --header 'Content-Type: application/json' \ @@ -75,7 +74,7 @@ "maxToken": 1800 } ],
M3E 模型的使用方法如下:
创建知识库时候选择 M3E 模型。
注意,一旦选择后,知识库将无法修改向量模型。
导入数据
搜索测试
应用绑定知识库
注意,应用只能绑定同一个向量模型的知识库,不能跨模型绑定。并且,需要注意调整相似度,不同向量模型的相似度(距离)会有所区别,需要自行测试实验。
chatglm2 模型的使用方法如下: +
chatglm2 模型的使用方法如下: 模型选择 chatglm2 即可
navigate_before 接入 M3E 向量模型
将 FastGPT 接入私有化模型 M3E
Nginx 中转 navigate_next
使用 Sealos 部署 Nginx 实现中转