在2016年3月的年度 Build 大会上, Microsoft 展示了一项在许多方面都给人留下深刻印象的技术,其技术甚至超过了当时的技术。感人的视频讲述了该公司一名盲人程序员的故事,该程序员用内置的人工智能技术创造了不寻常的眼镜,能够扫描周围的空间并用文字描述它。
这项技术称为 Seeing AI ,现在作为同名的单独应用程序可供iPhone所有者使用。
原理保持不变:通过打开智能手机上的程序,您可以将相机对准一个对象-程序将识别出该对象并告诉您前方的物体。您甚至可以在框架中抓住一个人,并且 看到AI 会告诉他是坐着还是站着,微笑还是皱着眉头,不管是老是老。在家里,这将帮助盲人了解他从货架上拿走了哪种产品-为此,您只需要扫描盒子中的条形码即可。但该应用程序最有用的功能之一是货币识别。由于美元大小相同,因此触觉上无法区分不同价值的钞票-以及了解您从口袋里掏出了多少钱- 看到人工智能 解决了这个问题。
该应用程序是基于神经网络构建的,该技术例如用于自动驾驶汽车和图像识别程序中。大多数数据由智能手机的处理器处理,因此几乎所有功能都可以正常工作,而无需永久连接到Internet。但是,对于某些人来说,仍然可能需要访问网络-例如,识别手写文本或扫描复杂的场景。
Seeing AI 开发负责人,视频中的盲人程序员Sakib Shaikh在接受 The Verge 的简短采访时说,他最经常使用该应用程序来识别路标和阅读菜单。在后一种情况下,该程序不仅会说出纸上写的内容,而且还会告诉您何时和向哪个方向移动相机以进一步“阅读”。 Shaikh认为工作速度是他的程序的主要优势:例如, 看到AI 可以瞬间识别人的脸。
该应用程序仍然仅对iPhone所有者可用,您只能在American App Store中 下载它。该程序也不会说俄语,但是,鉴于该项目的有用性和雄心壮志,在 Android 和其他国家/地区的App Store中 看到Seeing AI 的出现可以说是时间问题。