让手机像人眼一样观察世界 动态多目标识别技术亮相AI开发者大会

对于今天的手机用户来说,使用手机摄像头拍照并不是一项陌生的功能。使用许多应用程序可以相对准确地识别鲜花,商品和其他物品。但是,在我们的使用中找到它并不困难。无论屏幕中的项目数量如何,这些应用程序只能识别其中一项,并且无法识别人眼所见的目标。在今天召开的“百度创建2019”百度AI开发者大会上,百度高级副总裁兼移动生态集团总经理沉石在百度App上展示了“动态多目标识别”技术,让我们的手机迈出了一步更接近“像人眼一样看世界”。

“动态多目标识别”技术是一种基于移动实时感知和云视觉搜索的视觉AI技术。它可以实现WYSIWYG信息浏览体验。它于2018年底推出,并已应用于百度应用程序。根据百度AI开发者大会的动摇,“动态多目标识别”技术基于飞桨移动部署库。为了使这项技术在手机上顺利运行,将使用最初的200兆字节的云。可视化算法模型优化到小于5兆字节,并在100毫秒内实现对象的识别,对象的位置在8毫秒内,并跟踪更新。

将此技术应用到百度应用程序后,用户可以感受到的最大区别是,在同一张图片中可以识别的项目不超过一个,并且当用户实时移动相机时,百度应用程序也会识别屏幕中新输入的项目,同时实时跟踪识别的项目。

想要体验“动态多目标识别”的用户非常简单,只需打开最新版本的百度App,点击搜索框右侧的摄像头按钮,然后在“常规”中选择“自动”模式相机界面中的场景。在AI开发者大会网站上,沉晓用这项技术来识别和展示各种不同品牌的化妆品,识别效果快速准确。在准确识别的基础上,通过百度移动生态提供的信息和服务,用户还可以进行多平台比对和直接订购。

据报道,百度App目前可以识别超过1000万件物品,其中包括2万多种植物和数百万种美容产品;在此基础上,百度App还支持30多种智能判断场景,可针对性识别不同物品并提供不同的扩展信息和服务,如识别产品后提供同款和价格比较功能,识别技能识别植物,识别食物或食物,提供卡路里效应等信息,识别提供答案和问题分析后的维护知识。

随着人工智能技术的不断发展,它不断接近我们的生活。凭借领先的技术以及针对移动设备的优化和适应,百度App的“动态多目标识别”技术不仅可以使我们的手机摄像头更加智能化,而且还可以在未来的物联网时代。使更多设备具备智能交互功能,为用户提供更智能的AI交互体验。

http://ios.l740425.com.cn