2023 年 5 月图像分析 4.0 产品识别(公共预览版)
借助产品识别 API,可以分析零售商店中货架的照片。 可以检测产品是否存在,并获取其边界框坐标。 将其与模型自定义结合使用,以训练模型来识别特定产品。 还可以将产品识别结果与商店的货架图文档进行比较。 产品识别。
2023 年 4 月人脸受限访问令牌
独立软件供应商 (ISV) 可以通过颁发访问令牌来管理其客户的人脸 API 使用情况,这些令牌可授予对通常关闭的人脸功能的访问权限。 这允许客户公司使用人脸 API,而无需经过正式的审批流程。 使用受限访问令牌。
2023 年 3 月Azure AI 视觉图像分析 4.0 SDK 公共预览版
基础模型现已集成到 Azure AI 视觉中。 改进的视觉服务使开发人员能够跨各个行业创建市场就绪的、负责任的 Azure AI 视觉应用程序。 客户现在可以无缝数字化、分析数据并将其连接到自然语言交互,从图像和视频内容中解锁强大的见解以支持辅助功能、通过 SEO 推动获取、保护用户免受有害内容侵害、增强安全性并缩短事件响应时间。 有关详细信息,请参阅公布 的 基础模型。
图像分析 4.0 SDK(公共预览版)
图像分析 4.0 现在可通过 C#、C++ 和 语言的客户端库 SDK 提供。 此次更新还包括 支持的图像文字描述,以及近似人类性能的密集文字描述。
图像分析 V4.0 描述文字生成和密集描述文字生成(公共预览版):
在 V4.0 中,“描述文字”取代了“描述”,它是经过显著改进的图像文字描述功能,具有丰富的细节和语义理解。 密集描述文字除了描述整个图像之外,还可以为图像中的最多 10 个区域各生成一句说明,从而提供更多详细信息。 密集描述文字还将返回所描述图像区域的边界框坐标。 还有一个新的性别中立参数,允许客户选择是否为替换文本和 AI 应用程序启用概率性别推理。 自动提供丰富的描述文字、可访问的替换文字、SEO 优化和智能照片策展,以支持数字内容。 图形描述文字。
视频摘要和帧定位器(公共预览版):
以类似于思考和写作时的直观方式搜索视频内容并与之交互。 查找相关内容,而无需其他元数据。 仅在 中可用。
图像分析 4.0 模型自定义(公共预览版)
现在,可以使用 或 v4.0 REST API 创建和训练自己的自定义图像分类和物体检测模型。
多模式嵌入 API(公共预览版)
多模式嵌入 API 是图像分析 4.0 API 的一部分,支持对图像和文本查询进行矢量化。 这些 API 可用于将图像和文本转换为多维矢量空间中的坐标。 现在,你可以使用自然语言进行搜索,并使用矢量相似性搜索查找相关图像。
背景移除 API(公共预览版)
作为图像分析 4.0 API 的一部分,背景移除 API 可用于移除图像的背景。 此操作可以输出检测到的前景物体的图像(具有透明背景),也可以输出显示检测到的前景物体的不透明度的灰度 alpha 哑光图像。
弃用 Azure AI 视觉 3.0 和 3.1 预览版
Azure AI 视觉 3.0 和 3.1 的预览版计划于 2023 年 9 月 30 日停用。 超过此日期后,客户将无法再对这些 API 进行任何调用。 建议客户将其工作负载迁移到正式发布 (GA) 的 3.2 API。 从这些预览版本迁移到 3.2 API 时,请注意以下变化:
2022 年 10 月Azure AI 视觉图像分析 4.0(公共预览版)
图像分析 4.0 已以公共预览版发布。 新的 API 包括映像字幕、图像标记、物体检测、智能裁剪、人脸检测和读取 OCR 功能,所有这些均可在一个“分析图像”操作中使用。 在性能增强的同步 API 中对常规非文档图像进行了优化,可更轻松地在工作流中嵌入 OCR 支持的体验。
2022 年 9 月停用 Azure AI 视觉 3.0/3.1 读取预览版
Azure AI 视觉 3.0 和 3.1 读取 API 的预览版计划于 2023 年 1 月 31 日停用。 建议客户参考操作指南和快速入门,以开始使用正式发布版 (GA) 的读取 API。 最新的 GA 版本具有以下优势:
2022 年 6 月 推出
是可让你从 Azure AI 视觉探索、生成特征并将其集成到应用程序的 UI 工具。
为你提供了一个平台,可用于试用多个服务功能,并以可视化的方式查看它们返回的内容。 使用 ,无需编写代码即可开始操作,然后在应用程序中使用可用的客户端库和 REST API。
用于人脸识别的负责任 AI人脸服务透明度文档停用敏感属性 包和 的公平性仪表板受限访问策略Azure AI 3.2 预览版弃用
API 3.2 预览版已计划于 2022 年 12 月停用。 建议客户改用 API 正式版 (GA)。 从 3.2 预览版迁移时请注意以下更改:
分析图像和读取 API 调用现在采用可选的 model- 参数,该参数可用于指定要使用的 AI 模型。 默认情况下,这些调用将使用最新模型。分析图像和读取 API 调用还会在成功的 API 响应中返回 model- 字段。 此字段报告使用了哪个模型。图像分析 API 现在使用不同的错误报告格式。 请参阅 API 参考文档详细了解如何调整任何错误处理代码。2022 年 5 月OCR(读取)API 模型已正式发布 (GA)
Azure AI 视觉的 OCR(读取)API 最新模型(具有 164 种支持的语言)现已正式发布为云服务和容器。
请参阅 ,了解如何使用 GA 模型。
读取 API 入门
2022 年 2 月OCR(读取)API 公共预览版支持 164 种语言
Azure AI 视觉的 OCR(读取)API 使用其最新预览版将支持的语言扩展到 164 种:
请参阅 ,了解如何使用新的预览功能。
读取 API 入门
和 中的新质量属性2021 年 9 月OCR(读取)API 公共预览版支持 122 种语言
Azure AI 视觉的 OCR(读取)API 使用其最新预览版将支持的语言扩展到 122 种:
请参阅 ,了解如何使用新的预览功能。
读取 API 入门
2021 年 8 月图像标记语言扩展
图像标记器的最新版本 (v3.2) 现支持 50 种语言的标记。 有关详细信息,请参阅语言支持页。
2021 年 7 月面向 的新的 和特征点改进2021 年 5 月空间分析容器更新
已发布提供新功能集的空间分析容器新版本。 借助此 容器,可分析实时流视频,了解人们与他们在物理环境中的移动之间的空间关系。
空间分析操作现在还提供可检测人步行/奔跑速度的配置
2021 年 4 月Azure AI 视觉 v3.2 GA
Azure AI 视觉 API v3.2 现已正式发布,进行了以下更新:
请参见 Azure AI 视觉v3.2 GA
数据结构(预览版)2021 年 3 月Azure AI 视觉 3.2 公共预览版更新
Azure AI 视觉 API 3.2 公共预览版已经更新。 该预览版包含所有 Azure AI 视觉功能以及已更新的读取 API 和分析 API。
请参见 Azure AI 视觉 3.2 公共预览版 3
2021 年 2 月读取 API v3.2 公共预览版(带有对 73 种语言的 OCR 支持)
Azure AI 视觉读取 API v3.2 公共预览版(可用作云服务和 容器)包括以下更新: