人工智能 (AI) 涵盖了许多复杂的新兴技术,这些技术曾经需要人工输入,现在可以由计算机执行。广义而言,AI 是一种非人类程序或模型,可展现广泛的问题解决能力和创造力。
AI 这个缩写词经常被互换使用,用来表示人工智能领域中的各种技术,但这些技术的范围可能相差很大。
有许多定义人工智能和机器学习的术语和概念,您可能会觉得很有用。您可以在这里找到 Chrome 文档中常见的术语,尤其是与客户端 AI 相关的术语。
客户端 AI
虽然网络上的大多数 AI 功能都依赖于服务器,但客户端 AI 在用户浏览器中运行,并在用户设备上执行推理。这具有诸多优势,包括缩短延迟时间、降低创建功能的成本、提高用户隐私保护水平以及支持离线访问。
客户端 AI 依赖于经过优化的较小模型,这些模型针对性能进行了优化。对于特定任务,此类模型的性能可能优于较大的服务器端模型。评估您的使用场景,确定适合您的解决方案。
内置 AI

内置 AI 是一种客户端 AI,其中较小的模型内置于浏览器中。对于 Chrome,这包括 Gemini Nano 和专家级模型。下载这些模型后,所有使用内置 AI 的网站和 Web 应用都可以跳过下载时间,直接执行功能和本地推理。
内置 AI API 旨在针对任务运行推理,并使用合适的模型类型。例如,Prompt API 针对语言模型运行推理,而 Translator API 针对内置的专家模型运行推理。
服务器端 AI
服务器端 AI 涵盖基于云的 AI 服务。将 Gemini 1.5 Pro 视为在云端运行。这些模型往往更大、更强大。对于大语言模型来说,这一点尤其重要。
混合 AI
混合 AI 是指包含客户端和服务器组件的任何解决方案。例如:
- 客户端模型,可回退到服务器端模型,专为无法在设备上有效完成的任务而构建。
- 设备上可能缺少资源。
- 相应模型或 API 仅在特定环境中提供。
- 一种在客户端和服务器之间进行模型拆分以实现安全性的方法。
- 例如,您可以拆分模型,使 75% 的执行在客户端进行,而剩余的 25% 在服务器上进行。这不仅能带来客户端优势,还能让部分模型在设备外运行,从而保持私密性。
如果您使用 Prompt API,则可以设置采用 Firebase AI Logic 的混合架构。
生成式 AI
生成式 AI 是一种机器学习技术,可帮助用户创建熟悉的内容,并模仿人类的创作方式。 生成式 AI 使用语言模型来整理数据,并根据提供的上下文创建或修改文本、图片、视频和音频。生成式 AI 不仅能进行模式匹配和预测,
大语言模型 (LLM) 具有大量(多达数十亿)参数,可用于执行各种任务,例如生成、分类或总结文本或图片。
小型语言模型 (SLM) 的参数数量明显更少,但可以执行类似的任务,并且可能可在客户端使用。
自然语言处理 (NLP)
自然语言处理是一类机器学习技术,专注于帮助计算机理解人类语言,从任何特定语言的规则到个人使用的特有表达方式、方言和俚语。
客服或 AI 客服
智能体是一种软件,它会自主规划和执行一系列操作,以代表用户完成任务,同时适应环境变化。操作可能包括在网页上或通过第三方应用(例如 Project Mariner)执行的 API 函数或数据库查询。
聊天机器人本身并不是代理。聊天机器人会响应信使(无论是人类还是其他实体),并依靠模型生成内容(例如问题的答案),而智能体则会与工具或数据库互动来完成任务。
其他资源
如果您是刚开始接触 Web AI,请查看我们的 web.dev AI 资源合集。