让视障者“读”图“看”视频

社会组织深度参与企业产品研发,深圳引领国内信息无障碍发展

2018-12-21  南方日报  AⅡ04版  记者 郭悦

法国当地时间12月3日,在第27个“国际残疾人日”之际,联合国教科文组织(UNESCO)在总部巴黎颁发“数字技术增强残疾人权能奖”。其中,腾讯是亚洲首个获奖的组织,也是全球范围内首家获奖的企业。

这个奖项的背后,是深圳信息无障碍化发展走在全国前列的有力佐证。2005年,当时国内少有的只专注“信息无障碍”的NGO——深圳市信息无障碍研究会成立,2013年,全国第一支视障工程师队伍在深圳成立。

深圳的信息无障碍发展之路同样离不开本土企业的推动。2013年,深圳市信息无障碍研究会联合腾讯、阿里巴巴、百度、微软(中国)发起了中国信息无障碍产品联盟。

什么是信息无障碍?信息无障碍行业的发展现状如何?目前的痛点和瓶颈在哪?深圳为推动信息无障碍行业的发展提供了一个创新案例。

“社会组织+深企”推动信息无障碍发展

上世纪90年代以来互联网技术飞速发展,健全人和视障人群间信息鸿沟不断拉大。“盲人学习电脑最早在1999年。”深圳市信息无障碍研究会(以下简称“研究会”)视障工程师朱广锐说,“2004年开始接触电脑的盲人越来越多,2005年迎来了盲人电脑培训的高峰期。”

深圳市信息无障碍研究会正是在那一年注册为NGO的。从最初专注于做盲人电脑培训,到打造盲人专用软件,最终到对无障碍产品进行优化,它帮助许多视障人群实现了使用互联网产品的愿望。

“简单说,互联网信息无障碍就是让包括视障者在内的残障人士能够通过辅助技术,如读屏软件等自由地使用互联网。”深圳市信息无障碍研究会秘书长陈晶向记者解释,但代码书写不规范等问题会导致读屏软件无法精确使用,导致信息障碍问题。

因此,信息无障碍的建设除了制度基础,必然要与互联网产品开发者取得合作。2013年,持续关注互联网产品无障碍化改造的腾讯与深圳市信息无障碍研究会不谋而合。“在挖掘需求层面,我们开发产品的工程师在理解残障人士使用场景上有很大偏差。”腾讯公司社交平台部总经理黄俊洪说,腾讯QQ从2013年开始便邀请研究会的人员体验优化QQ的残障人士版本。

朱广锐用微信举例解释无障碍优化前后的区别:“比如有的软件没有经过信息无障碍优化,当我点击时,读出来的话可能就是‘按纽,按纽’,或者没有读,而经过优化的微信,点击后会详细地读出‘聊天’‘通讯录’‘朋友圈’等内容。”

深圳市南山区盲协主席郑锐表示,对某一个功能加了无障碍代码属性之后,正常人看到的跟以前没有任何差异和变化,但开启读屏以后就能获取里面准确的信息。

2013年,研究会联合腾讯、阿里巴巴、百度、微软(中国)发起了中国信息无障碍产品联盟,推动行业发展的顶层设计,是中国在此领域唯一的行业组织。2014年初,基于联盟,第一支视障工程师队伍在深圳成立,视障信息无障碍工程师的称呼由此诞生。

“这些工程师本身有视力障碍,同时也是学过编程会写代码开发的人员。这支队伍成立以后,最早给腾讯QQ产品提供信息无障碍服务,为联盟成员提供服务。”陈晶说,目前联盟有覆盖全国的47家相关单位。

微信、QQ、淘宝、支付宝、Windows、全民K歌、滴滴出行、美团、华为EMUI……这些都是研究会参与过的面向障碍群体的互联网产品。截至目前,研究会已经为腾讯、阿里巴巴集团、百度、蚂蚁金服、微软、中国平安、华为、顺丰、海南航空等知名企业或机构旗下的超过40款产品提供专业信息无障碍服务,直接覆盖数十万障碍用户。

图片和视频无障碍化需要基础研究投入

根据第六次全国人口普查及第二次全国残疾人抽样调查,我国残疾人口逾8500万,其中视力残疾1263万人,约占全世界盲人总数的20%,也就是说平均110人中就有1人存在视力障碍。

但是,在互联网普及过程中,关注信息无障碍水平的人并不多。“网站和软件的设计、开发、运营更多地着眼于有一定计算机操作基础且身心正常的用户,并且无障碍水平的高低并不是评价网站和软件优劣的重要标准,所以信息无障碍在很长一段时间内并未受到足够的重视。”陈晶说。

“其实我们的互联网需求跟明眼人没有区别。”郑锐告诉记者,视障用户使用的手机App涉及到衣食住行,“全民K歌、腾讯视频、企鹅FM、滴滴我都在用。”

接着他完全凭听力进行了演示:“左滑是上一条,右滑是下一条,双击是进行读屏。”熟练使用后,视障用户也完全可以像正常人一样使用互联网产品,视力没有完全丧失的视障用户甚至还爱看短视频软件。

然而,视障用户的互联网产品体验还不尽完美。以AI技术为基础的“读图”功能由于技术壁垒,图文和视频理解存在技术门槛,比如图片上的真实含义无法完全生动地被语音描述出来,是视障者“阅读”图片的主要痛点。记者发现,一张年夜饭场景的满桌饭菜图片,读屏软件会读成“桌子上摆放着食物”。“在QQ空间中点击朋友发的状态图片,读出的是‘朋友旅游时的照片’。”朱广锐说。

“目前在图片理解上,机器已经能够识别几千个标签。下一步如何能够通过声音表达更生动的内容,其实涉及到AI技术的情感应用上,仍需要基础研究的投入。”腾讯相关负责人说。

如何让视障者通畅使用短视频软件,也是当今互联网产品无障碍信息化的痛点之一。黄俊洪表示,视频的信息无障碍化还没有图片做得完善。“因为视频虽然也是以多帧连续图片的形式组织而成的,但无障碍过程中会遇到比图片更多的连续帧信息”,他解释,“我们目前已经将视频里的很多标签都提取出来了,接下来就是要把这些标签都转化成让图片处理技术可以理解的东西。此外,我们还会把将短视频无障碍化的技术做成一个对外的开放接口,使得外部短视频用户也能使用。”

深圳市信息无障碍研究会商务合作主管张炼说,在信息无障碍化的实现过程中,最大的难点在于普通工程师没办法理解这些用户的需求。“工程师需要全面了解信息无障碍领域用户的需求、痛点,要思考怎样的解决方案才是合适的。”

最后,陈晶指出,虽然目前中国出台了一些关于信息无障碍的法律,但在具体互联网产品上架的标准方面缺乏相关法规,很多产品在没有考虑障碍用户的情况下已经上架。“如果有硬性规定,产品制造方势必会把软件优化到较好的程度才会面向用户开放。这时候用户使用体验会好很多。”

打造从体验测试到技术修复的闭环

如何解决普通工程师难以理解视障用户体验的问题?收集反馈解决问题—测试效果—发布验证收集反馈。“在这个闭环运转的模式下,视障工程师与腾讯无障碍虚拟团队会定期对产品进行优化,完善一个版本的平均周期在一个月左右。”QQ项目管理总监李悦告诉记者。

目前在技术能达到的范围之内,深圳市信息无障碍研究会组织的视障工程师队伍深度参与互联网产品的开发。“我们只需按部就班地接受测试包进行测试,然后反馈问题,如此往复”,朱广锐说,视障工程师队伍可以参与到产品深层次功能的设计中,和产品团队面对面进行头脑风暴,“比如我们和手机淘宝的合作中,产品开发完成后我们直接到他们平台下载安装包进行检测,之后他们根据我们反馈的问题进行修复,修复完后发回我们进行验证,最后才向外发布。”

“QQ和QQ空间从2009年就开始关注视障用户使用体验。为了更好地提升用户体验,解决特殊群体的使用痛点,我们成立了专项团队,主动与信息无障碍协会紧密合作;同时组建了无障碍领袖群,为我们提供专业的功能改进建议。”黄俊洪表示。

2018年1月,QQ空间推出“图片语音即时描述功能”,基于腾讯AI Lab的“图像描述生成技术”,它能自动识别图片内容,“说出”文字描述,进一步帮助视障用户获得更好的社交体验。目前,QQ空间无障碍功能全年超过1亿人次在使用。

3月,QQ空间启动无障碍AI对外开放,让更多开发者和企业接入。“我们把很多能力对外开放,包括腾讯云产品,包括OCR、语音合成、图片理解方面。我们提供的更多是基础能力和一些推荐的解决方案”,黄俊洪表示,在图像、视频的理解上,腾讯也在持续投入,包括AI lab,优图实验室等长期聚焦这个领域,“腾讯非常有意愿能把基础研究的能力更多转化到实际有益的场景下。”

“目前在无障碍领域,行业内企业对很多东西的理解不太统一。”针对行业缺少统一的信息无障碍化标准问题,腾讯等企业希望未来能同行业里更多研究机构,从行业层面自下而上一起推动信息无障碍标准在中国互联网行业的落地。

(责任编辑 黄燕如)

2018-12-21

相关新闻

  • 打印本页
  • 返回顶部
  • 关闭本页