术语表

名称描述
大语言模型LLM(Large Language Model)是一种在海量文本数据上训练的 AI 模型,能够理解和生成自然语言,其参数规模通常从数十亿到数千亿不等。
推理服务推理服务是机器学习或深度学习领域中的一种服务,为训练后的模型提供高性能、可扩展的预测或推理能力。
Inference RuntimesInference Runtime 提供了一个用于基于模型的推理服务的高性能容器环境,优化资源利用率,加速推理过程,并降低延迟。
智能体AI Agent 是一种 AI 实体,能够感知环境、做出决策并自主执行任务,具有自主性、适应性和目标导向性。
文本生成文本生成是使用自然语言处理(NLP)技术,基于给定的输入(如上下文、提示词或规则)自动生成连贯且有意义的文本内容的过程。
文本分类文本分类是将文本数据分配到预定义类别或标签的过程,通常通过机器学习或深度学习模型实现,并用于信息检索、情感分析和垃圾邮件检测等各种应用。
图像生成图像生成是利用结合 NLP 和计算机视觉的 AI 技术,根据输入的文本描述自动生成图像,并将文本转换为视觉内容的过程。
虚拟 GPU虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机的技术,从而实现图形处理能力的共享和高效利用。
物理 GPU物理 GPU(pGPU)指的是将宿主机上的整块物理 GPU 卡直接挂载到虚拟机上,以便独占访问 GPU 资源的技术。