| Large Language Model | LLM(大语言模型)是一种基于海量文本数据训练的 AI 模型,能够理解和生成自然语言,参数规模通常在数十亿到数千亿级别。 |
| Inference Service | 推理服务指的是机器学习或深度学习领域中,为训练好的模型提供高性能、可扩展的预测或推理能力的服务。 |
| Inference Runtimes | 推理运行时为基于模型的推理服务提供高性能的容器环境,优化资源利用率,加速推理过程,降低延迟。 |
| AI Agent | 智能体是能够感知环境、做出决策并自主执行任务的 AI 实体,具备自主性、适应性和目标导向性。 |
| Text Generation | 文本生成指的是利用自然语言处理(NLP)技术,根据给定的上下文、提示或规则,自动生成连贯且有意义的文本内容的过程。 |
| Text Classification | 文本分类是将文本数据分配到预定义类别或标签的过程,通常通过机器学习或深度学习模型实现,应用于信息检索、情感分析、垃圾邮件检测等多个领域。 |
| Text-to-Image | 图像生成是利用结合 NLP 和计算机视觉的 AI 技术,根据输入的文本描述自动生成图像的过程。 |
| Virtual GPU | 虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机,实现图形处理能力的共享和高效利用的技术。 |
| Physical GPU | 物理 GPU(pGPU)指的是将主机上的整块物理 GPU 卡直接挂载给虚拟机,使其独占 GPU 资源的技术。 |