术语表

name	Description
Large Language Model	LLM（大语言模型）是一种基于海量文本数据训练的 AI 模型，能够理解和生成自然语言，参数规模通常在数十亿到数千亿级别。
Inference Service	推理服务指的是机器学习或深度学习领域中，为训练好的模型提供高性能、可扩展的预测或推理能力的服务。
Inference Runtimes	推理运行时为基于模型的推理服务提供高性能的容器环境，优化资源利用率，加速推理过程，降低延迟。
AI Agent	智能体是能够感知环境、做出决策并自主执行任务的 AI 实体，具备自主性、适应性和目标导向性。
Text Generation	文本生成指的是利用自然语言处理（NLP）技术，根据给定的上下文、提示或规则，自动生成连贯且有意义的文本内容的过程。
Text Classification	文本分类是将文本数据分配到预定义类别或标签的过程，通常通过机器学习或深度学习模型实现，应用于信息检索、情感分析、垃圾邮件检测等多个领域。
Text-to-Image	图像生成是利用结合 NLP 和计算机视觉的 AI 技术，根据输入的文本描述自动生成图像的过程。
Virtual GPU	虚拟 GPU（vGPU）是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机，实现图形处理能力的共享和高效利用的技术。
Physical GPU	物理 GPU（pGPU）指的是将主机上的整块物理 GPU 卡直接挂载给虚拟机，使其独占 GPU 资源的技术。

术语表#

术语表