发版日志
目录
v1.4.0Features and Enhancements改进的检索质量混合关键词与语义检索文档级检索内置知识库预设选择升级期间刷新内置知识库会话历史压缩现在可独立配置智能体模式和 MCP 工具加载构建自定义知识库改进Breaking ChangesKnown Limitationsv1.3.1Features and EnhancementsBYO Knowledge 工具多集群支持Token 配额限制历史记录改进Bug 修复v1.2.1Bug 修复改进v1.2.0Features and EnhancementsKnown Issuesv1.4.0
Features and Enhancements
改进的检索质量
内置知识库已使用更强大的模型重新进行嵌入,显著提升了答案相关性——包括跨语言检索(例如,使用中文问题查询英文文档)。现有的 v1.3.x 部署会在升级过程中自动迁移——请参见 Upgrade guide。
混合关键词与语义检索
现在答案检索会结合语义相似度和关键词匹配,然后融合为单一排序结果。这样可以恢复纯语义搜索容易遗漏的精确关键词匹配——例如 CRD 名称、命令标志和错误字符串——同时仍然保留回答自然语言问题的能力。
文档级检索
除了按各个章节建立索引外,现在还会在文档级别对每个文档进行索引。对于文档整体主题的提问,即使用户的表述与任何特定段落都没有重叠,也能找到正确的文档。
内置知识库预设选择
安装页面现在为内置知识库提供两种预设可选。默认预设适用于大多数查询;更大的预设在处理长文档类问题时,召回效果可能略好一些。
升级期间刷新内置知识库
从 v1.3.x 升级到 v1.4.x 时,会使用新的 GTE 嵌入 dump 替换内置产品知识库,并自动迁移按文档存储的元数据。无需手动执行数据库导出、导入或重启步骤——请参见 Upgrade guide。自定义和 BYO 知识库不会受此步骤影响(见下方 Breaking Changes 和 Known Limitations)。
会话历史压缩
长会话会自动进行摘要,因此可以在不丢失早期轮次的情况下保留在 LLM 的上下文窗口中。这降低了长时间智能体模式会话的 token 成本,并允许用户在多条消息之间继续分析,而不会降低质量。
现在可独立配置智能体模式和 MCP 工具加载
智能体模式(多步推理)和 ACP MCP 工具加载现在由独立的安装开关控制。你可以在不加载 ACP MCP 工具的情况下开启智能体模式——例如,当 LLM 只需基于内置知识库进行规划时——在需要实时集群操作时再重新开启这些工具。
构建自定义知识库
新指南将引导管理员将内部 Git 仓库导入 Hyperflux 知识库,从而让 Hyperflux 能基于私有 runbook、设计文档或其他内部参考资料回答问题。请参见 Build a Custom Knowledge Base。
改进
- 当工具返回较长输出时(例如日志或大型资源定义),降低了智能体模式答案的 token 成本。
- 提升了内置知识库数据库的存储性能。
Breaking Changes
- 在 v1.3.x 下构建的自定义知识库在升级前必须重新构建。 新的嵌入模型与旧模型不兼容,因此现有自定义语料数据在重新构建之前将无法使用。请参见 Build a Custom Knowledge Base 指南了解新的操作步骤。
Known Limitations
- 你通过 BYO Knowledge 工具上传的文档在 v1.4.0 升级过程中会保持不变——只有内置产品知识库会刷新。
v1.3.1
Features and Enhancements
BYO Knowledge 工具
BYO Knowledge 工具允许企业导入私有知识,并在问答过程中将其作为专用、可搜索的知识来源使用。这有助于团队基于内部文档、运维知识以及组织特定上下文提供回答。
多集群支持
多集群支持允许用户按集群名称访问来自多个集群的信息,扩展了跨集群边界的问答能力。这使得查询和比较不同集群环境中的资源更加容易。
Token 配额限制
Token 配额限制允许按用户限制请求频率和 token 使用量。这有助于管理员控制成本、管理配额并防止对模型资源的过度消耗。
历史记录
历史记录支持允许用户查看之前的对话和问答结果。这使得追踪上下文、继续先前的分析以及基于过往交互排查问题更加容易。
改进
- 优化了 RAG(langchain)和 reranking 流程,显著提升了答案准确性和相关性。
- 将核心 AI 框架升级到 LangChain 1.0,以保持与最新功能和优化的兼容性。
- 添加了常规系统检查提示,并进行了全面的代码整理和单元测试 linting。
- 将系统知识库、用户知识库和聊天历史使用的数据库分离,以提升数据隔离性和性能。
- 重新设计了 Smart Doc 交互页面,提供更直观、更高效的用户体验。
- 升级了 MCP server,新增对 OAuth 认证和可写工具配置的支持。
- 增强了文件上传集成,使知识摄取过程更加顺畅。
- 新增对自定义元素中 ID 的支持,并解决了相关的数据冗余问题。
- 实现了基于 Redis 的限流器,以增强系统稳定性并管理 API 流量。
Bug 修复
- 修复了模型下载可能失败的问题,并改进了嵌入模型的环境变量配置。
- 解决了在合并和解包更新值过程中出现的数据处理错误。
- 修复了导致自定义元素中出现冗余数据前缀的 bug。
- 解决了偶发的服务调用失败问题,以提升整体系统可靠性。
v1.2.1
注意:智能体模式是实验性功能,请谨慎使用。
Bug 修复
- 修复了设置知识数据库名称可能无效的问题。此修复新增了在安装期间设置数据库 dump 文件名的选项,并自动使用指定的数据库 dump 文件初始化知识库。
- 修复了在智能体模式下,MCP 工具可以在未经人工确认的情况下创建或删除 K8s 资源的问题。
- 修复了在智能体模式下询问磁盘空间信息时,服务可能卡住的问题。
- 修复了在 ACP 4.2 或更高版本上部署时,未处理默认节点 taints 的问题。
- 修复了一个部署错误:
kubeVersion: >=1.20.0 which is incompatible with Kubernetes v1.33.7-1。 - 修复了部署时 LLM 服务和 rerank 服务的 API key 以明文显示的问题。
改进
- 改进了用于正确识别 Hyperflux 身份的提示词。
- 移除了安装页面中未使用的配置项。
v1.2.0
Features and Enhancements
- 默认使用 RAG chain 回答用户问题,提升答案准确性。
- 支持导入数据库 dump 以初始化知识库,简化设置流程。
- 实验性: 支持启用智能体模式,利用 MCP 工具获取实时集群信息。
- 支持连接部署在 Alauda Hyperflux 安装之外的 PGVector 数据库。
- 支持 Cohere Reranker 模型以提升答案相关性。
- 支持设置 RAG chain 参数,例如 total_search_k 等。
Known Issues
- 当 LLM 返回错误时,答案生成可能失败。当返回查看聊天历史记录时,会再次向 LLM 发送问题,导致对话重复。