术语表

名称	描述
大语言模型	LLM（Large Language Model）是一种在海量文本数据上训练的 AI 模型，能够理解和生成自然语言，其参数规模通常从数十亿到数千亿不等。
推理服务	推理服务是机器学习或深度学习领域中的一种服务，为训练后的模型提供高性能、可扩展的预测或推理能力。
Inference Runtimes	Inference Runtime 提供了一个用于基于模型的推理服务的高性能容器环境，优化资源利用率，加速推理过程，并降低延迟。
智能体	AI Agent 是一种 AI 实体，能够感知环境、做出决策并自主执行任务，具有自主性、适应性和目标导向性。
文本生成	文本生成是使用自然语言处理（NLP）技术，基于给定的输入（如上下文、提示词或规则）自动生成连贯且有意义的文本内容的过程。
文本分类	文本分类是将文本数据分配到预定义类别或标签的过程，通常通过机器学习或深度学习模型实现，并用于信息检索、情感分析和垃圾邮件检测等各种应用。
图像生成	图像生成是利用结合 NLP 和计算机视觉的 AI 技术，根据输入的文本描述自动生成图像，并将文本转换为视觉内容的过程。
虚拟 GPU	虚拟 GPU（vGPU）是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机的技术，从而实现图形处理能力的共享和高效利用。
物理 GPU	物理 GPU（pGPU）指的是将宿主机上的整块物理 GPU 卡直接挂载到虚拟机上，以便独占访问 GPU 资源的技术。

术语表#

术语表