搜狐科技/马文玥
科大讯飞很着急。
急着拼命去解释。
自9月21日被曝出在 2018 创新与新兴产业发展国际会议上所使用的“智能翻译”涉嫌造假,不是AI同传而是后台两位真人同传译员临场实时翻译后,深陷“造假”漩涡的科大讯飞前前后后出面解释了五六次。
9月21日当天下午科大讯飞公关就媒体质疑紧急做出回应;当晚,科大讯飞公司董秘、副总裁江涛组织召开电话媒体交流会;9月22日,董事长刘庆峰就此事接受媒体采访;9月24日消费者BG副总裁、听见科技总经理王玮与爆料者Bell Wang电话解释沟通;9月25,科大讯飞公众号发表了题为《真金不怕火炼 我们没有造假》的文章;9月27日,科大讯飞还将在上海举办线下沟通会。
每一次科大讯飞出面解释,其实都可以用一句话总结:我们没有造假。
如此积极的科大讯飞,最后都收到了来自爆料人Bell Wang的和解,表示此事只是工作人员沟通不畅导致的一场误会——可大多数旁观者仍然不买账。
越来越多的同传从业者站出来指责科大讯飞不是初犯;网友将“造假”的怒火迁移至“讯飞听见”夸大宣传、打擦边球;9月25日首日开盘后讯飞股票当即大跌6.2%。
科大讯飞这下更着急了。
心急的行业
科大讯飞觉得自己很冤枉,明明从来没有说过“AI代替人类同传”这句话,却硬生生被扣上了“造假”的帽子,拖进舆论风暴的中心。
人工智能行业早已习惯了这种噱头大于实质的炒作,“AI威胁论”、“AI替代论”的存在并不是一朝一夕了。
今年4月15日,李迅雷曾说,“博鳌论坛的同声传译是机器翻译,而且准确率非常高,如果继续发展,人工同传都要失业了。”;16年底,李彦宏在世界互联网大会上表示,“未来的若干年,我们很容易想象语言的障碍会完全被打破,现在做同声翻译的人可能将来就没有工作了。”;前中国移动董事长王建宙早在2013年就“预言”同声传译业过不了多久就会消失。
愿景说多了就认成了现实,整个行业都会被自我催眠。各公司的产品宣传稿上常会放出让同传下岗的狠话,包括腾讯和微软这样具有世界级影响力的巨头企业。
李开复在今年三月《我不是李开复,我是人工智能》的演讲中提到,“语音识别是所有技术里面最不成熟的,当我看到一个一个的计划非常担忧,99%会死掉。你们不要看科大迅飞说懂得语音了,他一点不懂。”
话糙理不糙,语音识别技术和语音理解的发展技术远不到成熟,经常被戏弄为“人工智障”。Speech-to-text都会还时而出现翻车,比如腾讯同传在今年的博鳌亚洲论坛第一次亮相就把“One Belt One Road”(一带一路)翻译成“一条腰带和一条公路”。Speech-to-meaning就更青涩了,比如不太能听懂人话的苹果Siri、微软小冰。
目前的人工智能翻译能专注做好于一个领域就已经很不错了,像科大讯飞、搜狗、猎豹移动等公司推出的toC产品移动翻译机,也仅仅只能适用于基础常用旅游场景,跨行业的自然语音理解根本还没有出现。许多语音公司都在吹捧的“我们的语音识别率已经达到95%以上”,这还不包括离话筒太远麦克风拾音困难、普通话不标准、环境噪音过大而出现的失败案例。
不过“人工智能”这四个字都被写进了政府工作报告,“人工智能”大爆发的当下,大量资本涌入行业。资本不会考虑技术是否成熟只想快速看到回报;企业不管是头部还是初创公司,都想在规模与秩序洗牌时涌入前列;行业也需要通过商业落地打破公众质疑证明这不只是PPT。每个人都在为“浮夸风”添柴加火,就这样将一门慢生意送上快车道。
逼急的讯飞
可科大讯飞董事长刘庆峰确实没有撒谎。
过去一年里,刘庆峰但凡在演讲中提到“AI翻译”都会提到一句”人工智能要走下神坛,AI不能代替人类同传”。不过这些话,被选择性地忽视,淹没在了那些更能吸引眼球的“AI威胁论”中。
“现在讯飞的翻译机达到的水平是大学英语六级,讯飞一直所努力的,是希望通过语音转写和翻译技术帮助同传提高工作效率、减少失误,形成人机耦合的同传新模式,并不是去替代同声传译。我们的翻译机能够帮助人们在一些场景处理语言交流的问题,但距离会议同传以及高水平翻译所讲究的信、达、雅还存在很大的差距。”刘庆峰在2017年7月如此说到,这段话也被写进了科大讯飞这几天来的回应当中。
科大讯飞没有“主动造假”,但却用随意、模糊、歧义的措辞用于产品包装与宣传,“试图造假”。
以这次的直播宣传文案来看,只粗浅地写到“讯飞听见”利用科大讯飞的语音技术实现“智能翻译”,并没有坦率地直面“翻译部分主要由同传译员完成”,“讯飞听见”其实只负责翻译语音识别进行文字转换。躲闪的态度不该是一个想要撑起千亿市值的AI领域“国家队”该有的表现。
科大讯飞深耕了20年语音技术,作为中国最大的语音识别人工智能公司,产品占据中文语音识别服务市场70%的份额,是继BAT后第四大国家科技与创新开放平台,多次斩获国际语音识别类比赛一等奖。在整个语音识别人工智能发展态势如火如荼的当下,领头羊科大讯飞承认自己的AI翻译听不懂,面子上真的挂不住。
于是,科大讯飞拿出了具备技术门槛的专业词汇“人机耦合”来针对造假风波进行反驳。表明这种直接转写同传语音作为“人机耦合”的方式,可以降低同传工作者工作强度、赋能翻译人员,并在声明中特别强调:人机耦合才是未来。大多数人根本看不懂“人机耦合”这四个字是什么意思,也就丧失了指责的权利。
简单来说,“人机耦合”是指人和机器一个输入、一个输出,达到一种人和机器响应共振的工作状态。难道彻底取代同传就不属于“人机耦合”的目标了吗?科大讯飞没有给出答案。
这种说法,既不能让没有减轻工作量的同传译员满意,也无法化解大众心中的疑惑,但至少可以让批评者暂时性失语,尽最大可能名誉的损害降到最低。
窘急的财报
科大讯飞确实受不了任何对于名誉的打击。
三个月前,科大讯飞刚刚经历过一次投资人质疑。二季度财报发布前科大讯飞高调宣布讯飞输入法的用户已突破6亿。结果根据第三方咨询公司BDR的统计,截止今年一季度我国输入法市场活跃用户一共只有6.3亿,而讯飞输入法在国内输入法市场所占的市场份额只有8.7%。
事发的6月22日当天收盘后,科大讯飞以13.12%的周跌幅创一年来新低。
作为人工智能第一明星股,科大讯飞曾经市值破千亿,而现在总市值只有600亿,继续下跌市值只有腰斩。
众所周知,科大讯飞是一家低利润公司,2016年、2017年净利润分别为4.84亿、4.35亿,今年上半年净利润1.36亿,这其中还有1/4来自政府补贴,2016年补贴1.67亿,2017年补贴1.8亿。
而科大讯飞很大一部分利润是来自教育业务,可教育行业的收入本身就靠政府补贴维系。
靠天吃饭的盈利模式必然不是长久之策,它把思路转向了消费端,推出讯飞翻译机及讯飞翻译机2.0。不过语音识别技术本身门槛较低,与市面上常见的准儿go、搜狗翻译宝等翻译机产品相比,从技术层面基本拉不开差距。而且翻译机应用场景单一,仅限于旅游,售价高达2999元,加上移动Wi-Fi向翻译机功能迭代、手机软件翻译能力日趋强大,这些都成为制约科大讯飞C端产品规模化铺开的掣肘。
科大讯飞执行总裁胡郁曾说,语音交互技术要做出杀手级应用或产品,一定是有个性化的、多样性的产品。不过究竟是怎样的产品类型,他自己还没有想到。
技术面、产品面都拉不开差距。能真正区分语音技术公司的决胜砝码,是数据。
在这方面,科大讯飞作为先行者有多年来积累的语料库进行机器学习和数据训练。不过要看到的是,竞争对手手握的是比科大讯飞更大的数据源:腾讯有微信语音、搜狗有输入法、阿里有天猫精灵,此外还有深耕车载的云知声、思必驰,语音生活搜索的出门问问等。
再回头看,没有得天独厚的场景作数据来源支撑,科大讯飞成了最好捏的软柿子。
不过,目前做语音识别人工智能企业,目前还没有一家能够盈利,仍处在大规模烧钱培育市场的发展初期。
不必太急,留给科大讯飞的还有时间。