Y-Agent Studio

系统设置

中文描述

系统设置

基础系统设置

基础系统设置,存放在 ./server_config.py 文件中。

配置参数说明

参数名必填说明约束条件
fastapi_host项目启动时绑定的主机IP-
fastapi_port项目启动时绑定端口必须为大于50小于65534的整数
db_connect_str数据库连接字符串系统运行需要一个关系型数据库支持
is_record_operationlog是否记录操作日志-
web_name项目名称-
web_desc项目说明-

修改后需重启服务端。

知识库配置

首先,系统会先按照一级标题和二级标题进行切分。请参考切分规则 切块大小:当单个文档过大的时候,系统会进行切分,按照字符个数,切分成此大小的块。 重叠大小:当前文档被切分后,两个相邻文档的重叠区域。 所有的大小都是指字符长度。

向量数据库配置

向量数据库配置:

目前向量数据库仅支持Chroma,对于Milvus,Faiss等向量数据库将在后续版本中扩展。 Chroma 支持两种部署方式: 本地部署:无需修改链接字符串配置,自动启动。 远程部署:需要在远程服务器部署安装Chroma(chromadb==1.0.17)并启动 chroma run --path /db_path,启动后可以看到端口。参考网址:https://docs.trychroma.com/docs/run-chroma/client-server 部署完成后需要修改链接字符串,注意链接字符串的格式不要修改,只可以修改参数具体值。 链接字符串:

{"host":"http://远程IP","port":端口,"param_config":{"collection_metadata":{"hnsw:space":"cosine","hnsw:search_ef":200}}}

链接字符串中hnsw:space,hnsw:search_ef配置建议使用默认项,如需要修改可以参考:https://docs.trychroma.com/docs/collections/configure

向量模型配置

注意!修改向量模型后会造成已经生成的所有向量失效,请谨慎操作!

参考案例:

设置vllm向量

模型接口格式:vllm

模型名称:bge-m3

API接口地址:http://192.168.50.225:8001/v1/embeddings

APIKEY:留空

设置智谱向量

模型接口格式:vllm

模型名称:embedding-3

API接口地址:https://open.bigmodel.cn/api/paas/v4/embeddings

APIKEY:开放平台申请apikey

设置火山向量

模型接口格式:vllm

模型名称:doubao-embedding-text-240715

API接口地址:https://ark.cn-beijing.volces.com/api/v3/embeddings

APIKEY:开放平台申请apikey

设置openai向量

模型接口格式:vllm

模型名称:text-embedding-ada-002

API接口地址: https://api.openai.com/v1/embeddings

APIKEY:开放平台申请apikey

...

安全配置

建议,过期时间大于3天,刷新时间大于2天。

令牌过期时间: 令牌刷新时间:

说明:当用户通过登录界面登录后,登录的有效期是 令牌过期时间,如果用户在过期前,且剩余过期时间小于 令牌刷新时间, 进行任何操作,系统都会重新分配令牌,将过期时间重置为 完整的过期时间。具体参考JWT授权机制。

How is this guide?

最后更新

京ICP备2025145222号-1     © Copyright 向量感知(北京)智能科技有限公司 YAFO 2025.