| Large Language Model | LLM(大语言模型)是一种在海量文本数据上训练的 AI 模型,能够理解和生成自然语言,参数规模通常在数十亿到数千亿级别。 |
| Inference Service | 推理服务是指机器学习或深度学习领域中,为训练好的模型提供高性能、可扩展的预测或推理能力的服务。 |
| Inference Runtimes | 推理运行时为基于模型的推理服务提供高性能的容器环境,优化资源利用率,加速推理过程,降低延迟。 |
| AI Agent | 智能体是能够感知环境、做出决策并自主执行任务的 AI 实体,具有自主性、适应性和目标导向性。 |
| Text Generation | 文本生成是指利用自然语言处理(NLP)技术,基于给定的上下文、提示或规则,自动生成连贯且有意义的文本内容的过程。 |
| Text Classification | 文本分类是将文本数据分配到预定义类别或标签的过程,通常通过机器学习或深度学习模型实现,应用于信息检索、情感分析和垃圾邮件检测等多个领域。 |
| Text-to-Image | 图像生成是指利用结合 NLP 和计算机视觉的 AI 技术,根据输入的文本描述自动生成图像的过程。 |
| Virtual GPU | 虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机,实现图形处理能力的共享和高效利用的技术。 |
| Physical GPU | 物理 GPU(pGPU)指直接将整块物理 GPU 卡挂载到虚拟机上,使其独占访问 GPU 资源的技术。 |