| 大语言模型 | LLM(Large Language Model)是一种在海量文本数据上训练的 AI 模型,能够理解和生成自然语言,其参数规模通常从数十亿到数千亿不等。 |
| 推理服务 | 推理服务是机器学习或深度学习领域中的一种服务,为训练后的模型提供高性能、可扩展的预测或推理能力。 |
| Inference Runtimes | Inference Runtime 提供了一个用于基于模型的推理服务的高性能容器环境,优化资源利用率,加速推理过程,并降低延迟。 |
| 智能体 | AI Agent 是一种 AI 实体,能够感知环境、做出决策并自主执行任务,具有自主性、适应性和目标导向性。 |
| 文本生成 | 文本生成是使用自然语言处理(NLP)技术,基于给定的输入(如上下文、提示词或规则)自动生成连贯且有意义的文本内容的过程。 |
| 文本分类 | 文本分类是将文本数据分配到预定义类别或标签的过程,通常通过机器学习或深度学习模型实现,并用于信息检索、情感分析和垃圾邮件检测等各种应用。 |
| 图像生成 | 图像生成是利用结合 NLP 和计算机视觉的 AI 技术,根据输入的文本描述自动生成图像,并将文本转换为视觉内容的过程。 |
| 虚拟 GPU | 虚拟 GPU(vGPU)是一种利用虚拟化技术将物理 GPU 资源拆分并分配给多个虚拟机的技术,从而实现图形处理能力的共享和高效利用。 |
| 物理 GPU | 物理 GPU(pGPU)指的是将宿主机上的整块物理 GPU 卡直接挂载到虚拟机上,以便独占访问 GPU 资源的技术。 |