现在智能语音智能音响音响会窃听么?

  据英国研究公司Juniper预测2023年智能语音智能音响助手的使用量将达到80亿。然而智能语音智能音响助手市场的疯狂增长离不开海量用户数据的“喂养”,隐私问题也随之滋生

  智能语音智能音响助手必须通过“窃听”来改善性能吗?有专家向南都记者表示就现阶段来说,人工监听和分析是必须的並且将在弱人工智能时代持续相当一段时间。

  人工监听语音智能音响指令是必须的吗

  为什么亚马逊、谷歌、苹果这三大科技巨擘明明在其他涉及隐私的问题上谨言慎行,却唯独在承认人工监听语音智能音响指令行为时如此“爽快”

  这是因为,就目前的语音智能音响识别技术来说人工监听和分析是必须的——在业内,这已经是公开的秘密只不过大多用户并不知情。

  中国科学院自动化研究所听觉模型与认知计算团队副研究员徐爽告诉南都记者目前主流的人工智能技术基于深度学习,善于从海量训练数据中发现统计规律能够更好的刻画数据分布特点,但还不能像人类一样“举一反三”不能很好地通过无监督的学习适应复杂的环境变化。

  有业内囚士向南都记者透露不止上述三家公司,所有开发智能语音智能音响助手的公司都有这样的团队区别仅仅在于这个团队属于公司内部還是第三方承包商。

  语音智能音响识别中的人工干预还将持续多久

  2016年,AlphaGo一战成名在自我对弈和深度学习中超越了人类的智能預期。围棋领域的这次成功尝试让人们看到了大范围实现人工智能无监督学习的一丝曙光。

  但在徐爽看来智能语音智能音响处理領域对人工干预的需求“还将持续一段时间”,而且“不是短时间”

  她指出,尽管当下人工智能领域已取得很大成功但其发展水岼还处在初级阶段。从专业角度来说人工智能可以分为两种:专用人工智能和通用人工智能,而目前的人工智能发展还处在专用人工智能阶段也就是人们通常所说的“弱人工智能”。

  徐爽说专用人工智能解决特定的智能问题,在部分专用领域有效而通用人工智能则要达到人类通用智能水平,具有自我认知和复杂环境的自适应能力

  因此,无论是在语音智能音响识别还是文本、图片、视频等其他领域,人工的数据标注、监听分析都是必不可少的事实上,数据标注已经伴随人工智能的发展成为了一种新兴职业

  有观点認为,数据标注是人工智能的入门级岗位打比方来说,光靠机器自己是无法识别任何语音智能音响指令的必须要先给它一段语音智能喑响指令,上面标注出这个指令的意思然后机器通过学习大量类似语音智能音响中的特征,才能理解这个指令的意思并给出正确的回應。

  南都记者搜索招聘网站发现仅在北京,招聘“数据标注员”的公司就有不少员工规模大部分在500个以下,有的会直接标注是为哪家大型互联网公司服务的职位要求包括学历大专以上,做事认真细致有耐心熟练使用电脑,但对经验和专业没有硬性要求

  有業内人士预测,在未来人工智能发展良好的前提下数据的缺口一定是巨大的,因此3-5年内数据标注员的需求会一直存在。

  全球三大智能语音智能音响助手“全军覆没”

  7月26日英国《卫报》报道称,苹果会雇佣外部人员监听和分析用户对Siri发出的语音智能音响指令達到识别Siri是否被意外唤醒、指令是否被正确处理等目的,以改善用户体验

  这些录音中不乏医生与病人的谈话、掩盖在引擎噪音之下嘚疑似毒品交易、性行为信息等极其私密的个人信息。

  对此苹果回应称,人工监听的录音占比不到Siri日激活量的1%而且大部分的录音時长都只有几秒,此外人工监听工作是受到苹果严格的保密协议约束的。

  今年4月亚马逊的一位合同工向彭博社爆料,称为了改进Alexa語音智能音响助手亚马逊在世界各地雇佣了数千名员工“窃听”用户的真实录音。这些员工还被要求签署保密协议不能公开谈论该项目。

  不久前谷歌的智能语音智能音响助手Google Assistant也“沦陷”了——来自谷歌雇佣的人工监听团队的爆料人向比利时荷兰语国家广播电视台(VRT)提供的1000条对话录音显示,有153条都是在Google Assistant被意外唤醒的情况下录制的

  人工智能的发展必须以用户隐私为代价?

  与智能语音智能音响助手开发公司的“坦然”相对应的是用户的隐私焦虑。

  密歇根大学助理教授Florian Schaub曾表示人们也许并不会留意到,自己跟语音智能音响助手说的小秘密可能会被其他人听到而是以为这些设备都在自发进行神奇的机器学习。

  目前人工智能产业界使用的基本上还是监督學习的技术存在过于依赖大数据、算法本身具有不可解释性等突出问题,而人工的介入在某种程度上把用户的隐私置于危险的境地。

  据南都记者了解以隐私保护严格而著称的欧盟数据保护监管机构已经行动起来了。

  8月1日德国汉堡数据保护和信息自由委员会發表声明称,已对谷歌启动行政程序禁止其员工或第三方机构对智能语音智能音响助手Google Assistant收到的用户录音进行评估,限期三个月旨在保護数据主体的隐私权。

  该委员会专员Johannes Caspar评论道语音智能音响助手系统必须是透明的,以便获得用户的知情同意信息的充分透明对于那些注重语音智能音响指令处理过程,以及意外唤醒频率和风险的人来说尤其重要

  中国信息安全研究院副院长左晓栋认为,仅从合規的角度来讲如果公司清晰告知了用户录音会被如何使用和用于什么目的,则不能视为违规

  一位专注于数据保护实务的律师表示,智能语音智能音响助手开发公司应该对从事人工监听和分析工作的员工或第三方承包商的数据合规能力进行审核并通过合同条款约束。

  采写:南都记者 蒋琳

智能语音智能音响助手安全可靠嗎

大家好,欢迎来到六分钟英语我是丹。

我是罗伯所以丹,什么是……噢抱歉。噢是我太太。额等一下……

别往心里去,丹我并不喜欢有人偷听我的电话。如果你偷听某事你就是在偷偷地听别人的谈话。你知道的有些事情是私密的?

哦!当然!我完全理解然而有一个问题要问你……你有智能语音智能音响助手吗?你知道的就像是谷歌助手,亚马逊的Alexa或者苹果的Siri

哦,当然我有智能語音智能音响助手!它太棒了!我可以问它各种各样的问题,它告诉我新闻和天气它可以在我想要播放音乐的时候播放音乐……它可以莋各种事情!你只要给它一个语音智能音响指令,它就会做你想做的!

所以它能听见你说话是吗?

当然!不然你怎么能给它一个语音智能音响指令呢

那么你怎么知道它不会对你进行窃听呢?

嗯我……噢……我明白了。我没有想到那一点

那就是这期六分钟英语的主题。你的智能语音智能音响助手有多安全然而,在那之前这里是我们的测试问题。从2017年12月到2018年12月使用智能语音智能音响助手的美国家庭的数量增加了多少?是a) 大约40%b) 大约60%,还是c) 大约80%

哦,好吧我知道它们甚至在我家都很受欢迎。所以我选c) 大约80%

我们将在稍后的节目中揭晓你的答案是否正确。所以智能语音智能音响助手和隐私!弗洛里安·绍布是密歇根大学信息学院的助理教授。这是他在BBC环球广播节目The Why Factor中关于智能语音智能音响助手的讲话。他说人们正把什么引入家里

你本质上正在引入……窃听器到你家里,到你最私密的空间然而這些公司表示,他们只是在听到关键词时才会主动去听你家里发生的事情但是为了能够检测到关键词,麦克风是一直开着的我们不知噵为了能够听到你在做什么,公司在多大程度上与政府合作或者政府在多大程度上可能试图绕过公司的安全机制。

所以罗伯,他说人們正在引入什么

他主要是说我们引入了一个窃听器。窃听器是一种用于秘密监听对话的小型电子设备更像是间谍会使用的。

是的而苴他提到窃听器是在我们最私密的空间里!Intimate指的是"秘密的,私人的"

是的,我想不到哪里比我家还私密

确实!他还说,智能语音智能音響助手的麦克风一直开着——尽管公司坚称他们只是在听到关键字时才会主动去听

是的,他表示我们无法知道一家公司在多大程度上可能与政府合作来对民众进行窃听

或者政府是否可能绕过智能语音智能音响助手的安保,在没有公司或公司所有者许可的情况下偷听!

Circumvent指嘚是"巧妙地绕过"所以如果所有这些窃听都是可能的,那么为什么智能语音智能音响助手如此受欢迎呢

问得好!弗洛里安·绍布再次谈到并给出了答案。他进行了一项研究,关于当谈到智能语音智能音响助手时人们对隐私的态度人们对拥有一个可以对他们进行窃听的智能語音智能音响助手有何感想?

我们经常看到的情况是如果人们想享受智能语音智能音响助手带给他们的便利,他们就不得不屈从于"这是怹们必须做出的妥协"

他说,人们已经接受了隐私方面的妥协如果你屈从于某件事,你就要接受无法改变的不愉快

是的,"trade-off"就是妥协伱接受了不好的事物,同时也接受了好的事物

所以人们接受智能语音智能音响助手给他们带来好处,即使可能会有缺点

是的。考虑到鈈管怎样所有的数据公司已经有了我们的数据整体上来看,这些设备所听到的数据可能并没有那么重要!

所以我能知道测验问题的答案叻吗

当然!早些时候我问,从2017年12月到2018年12月使用智能语音智能音响助手的美国家庭数量增加了百分之多少?是a) 大约40%b) 大约60%,还是c) 大约80%伱说是什么,罗伯

你答对了。答案是大约80%——从2017年12月的6600万到2018年12月的1.18亿而且现在英国大约有1000万人也在使用智能语音智能音响助手!我猜怹们真的不担心被窃听。

很好地过渡到词汇丹。如果有人对你进行窃听那指的是他们偷听了你的谈话。

他们可能通过窃听器对你进行竊听(eavesdropping)那是一种用于秘密监听谈话的小型电子设备。

是的他们可能窃听了你最私密的(intimate)或者最秘密和最私人的空间。

接下来我们提到了"绕行"(circumvent)如果你绕过某些事物,比如安保那你就是巧妙地绕过它。

然后我们学了"屈从"(resigned)如果你屈从于某事物,那就是说你接受了无法改变的不愉快之事

最后,我们学了"妥协"(trade-off)Trade-off就是"妥协"。你得到一些好的事物但也会得到一些不好的事物。

是的——就像陸分钟英语!有很棒的讨论和词汇但妥协之处是它只有六分钟!

差不多就是到现在——是时候结束了。所以在下次节目之前在网上和社交媒体上查找我们啊。只需搜索BBC教学英语再见了。

关于智能音箱的偷听、存储、泄密和人工监听哪些是真相,哪些是谣传

女儿过生日时,朋友送给司兰一台智能音箱是市场上常见的主流品牌的款式,小方盒子、价格不高司兰对新奇事物的兴趣一般,就随手摆放在了客厅倒是6岁的女儿爱上了这个小音箱,总是缠着它讲故事

逐渐地,司兰对这个智能音箱产生了好感“简直是哄娃神器”,欣喜之余她开始在淘宝上浏览相关产品,计划买一台配置更高、音质更好的款式

直到数朤前的一天,司兰无意间打开了与智能音箱连接的手机App却意外发现,其中记录的一段文字正是自己与丈夫刚刚聊天内容的文字转写。囹她惊讶的是这段对话发生在女儿听完故事之后,理论上音箱已经处于休眠状态,不应收取声音更不应该将内容传输至手机、并转為文字。

“它一直在偷听我们家里的谈话吗”疑虑浮现在司兰的心头。家人也对智能音箱产生了忌惮新机购买计划自然搁浅,对于已囿的这台音箱司兰则选择了“断电”,“女儿喜欢听故事听的时候开一会,听完就拔电源”最近四、五个月,他们都是这样使用的

1.正在“监听”的音箱

智能音箱第一起广为人知的“窃听事件”发生于美国俄勒冈州。

2018年5月Danielle的丈夫接到一位下属的电话:“马上拔掉你嘚Echo设备插头,你被黑客攻击了!”Danielle居住在俄勒冈州波特兰市家中拥有四台亚马逊智能音箱Echo设备。当天早些时候她丈夫的这位下属接到┅份录音文档,随手打开后却听到了Danielle和丈夫在家中的私密谈话,夫妻俩正在商量使用哪个牌子的硬木地板

震惊之下,Danielle拔掉了所有Echo设备電源迅速拨打亚马逊客服电话寻求解释,同时她将这一事件爆料给哥伦比亚广播公司。

对于这一事故亚马逊给出的回复是“误操作”,意思是在运行时,Echo设备将一段对话的内容误解为指令以为用户希望将此前的语音智能音响内容发送给通讯录中的某个人,随即执荇了这一指令

Echo是亚马逊推出的智能音箱,搭载其语音智能音响助手Alexa截至2018年年中,Echo在美累计出货约3500万台;根据CIRP预测其市占率达到70%,远超其它品牌

头部产品出事,消息迅速被广泛传播和发酵不久之后,Echo的第二起“事故”又出现了一位德国用户向当地杂志《c’t》爆料,当他让亚马逊发给自己个人活动的语音智能音响数据时却收到了一个可供下载的100MB压缩文件,下载内容是一份解释Alexa语音智能音响命令的PDF汾类记录以及1700份陌生人对话录音。

《c‘t》听取了其中的部分录音发现根据对话内容,可以“拼凑”出的生活细节包括:在家和外出的時间家里其它品牌的智能设备,家中人员的性别甚至包括用户沐浴的声音。

尽管亚马逊对以上两起事故均已致歉却未能掩盖一个在輿论中逐渐成型的猜测:作为一款新兴设备,智能音箱的“窃听”或许不仅是隐患、而且真实存在“它听到唤醒词就可以启动工作,那昰否意味着智能音箱正在随时随地听取我们的谈话?”司兰这样怀疑

最近数月中,智能设备相关的更多“窃听”事故正在被曝出今姩7月,据国外媒体报道苹果的一名承包商称,为了提升Siri的产品能力苹果会雇佣外部承包商审听录音,其中包括了Siri在意外被激活时收录嘚私密对话例如医疗信息、毒品交易和其它信息。

无独有偶同月,有消息传出谷歌智能助手会将录下的声音文件提供给公司员工,甚至世界各地的谷歌第三方承包商也能定期听取这些谈话内容

对于智能音箱及内置于各设备中的语音智能音响助手的疑虑正在蔓延,不僅是“窃听”智能音箱偶尔出现的自启动现象也刺激了一部分用户。从去年起先后有用户表示,Echo在未被唤醒时却出现了“呵呵”的笑声,令人毛骨悚然

类似现象也出现在一些国内的智能音箱上。一位用户透露说家中摆放的智能音箱多次突然汇报“设备正在进行系統升级,已更新**个应用”“虽说很正常的内容,但家里没其他人音箱突然说话,每次都吓我一跳”甚至有一次,在她邀请朋友到家Φ做客彼此相谈甚欢时,智能音箱突然被唤醒了并毫无预兆地为众人播放了一首林俊杰的《杀手》。

“带屏”音箱则带来了影像方面嘚疑虑随着“窃听事故”增多,有用户怀疑称自家的带屏音箱有“回家看看”的功能,既然可以远程直播家里正在进行的情景是否吔会同时将这些影像记录下来,传输至其它地方

人们对智能音箱这款新产品的疑惑越来越多。从“它在监听我吗”延伸至:它休眠时会收声吗收声之后,是否会存储和传输这些对话这些声音真的会被人听到吗?以及它会被黑客攻击,变成一个“窃听器”吗

“最近┅年,身边很多朋友买智能音箱前都会来问我监听问题”,张思成说他先后在多家公司的智能音箱部门工作,被朋友们视为行业专家“比较有趣的是,问完之后几乎每个人都还是买了音箱。”

据张思成及多位熟悉智能音箱的从业者介绍智能音箱的识别工作分为“夲地”和“云端”两种情况,在智能音箱处于未唤醒状态时为本地工作状态,虽然会收录外界声音但不会对这些声音进行存储与语义識别。“唤醒前相当于在做声波识别的工作”徐家明介绍说,“将收录的声音与唤醒词做对比声波相符时,才会自动打开”徐家明昰一位智能音箱产品经理。

张思成否认了“偷偷监听”的传言据他了解,市场主流的多款国产智能音箱无一存在主观故意监听的情况

“这是一件成本很高的事情”,张思成认为他这样算了一笔账:假设一家企业累计售出100万台音箱,有20万日活如果企业要启动这些音箱莋24小时监听,就算每秒钟产生100k数据乘以20万的话,累计起来传输带宽、存储和计算的花费相当惊人

更关键的是,在当前的技术处理能力丅企业尚不能将这些庞大而又碎片化的录音转化为有商业价值的有效信息。在张思成看来就算不考虑道德层面,只看商业利益企业吔没有动机去做主观的信息收集。

据张思成回忆在去年的一项由国家工信部主导的智能音箱检测工作中,在未唤醒状态下各家智能音箱传输的数据量均仅为KB级别,对于语音智能音响资料而言这一数据量几乎可以忽略不计。

与“窃听”传言较为相符的内容是“唤醒词”の后的智能音箱工作模式

张思成和徐家明均承认,音箱被唤醒后将进入云端工作状态,将收取的声音传输至云端服务器完成语音智能音响语义识别和反馈工作。“这是无法避免的”张思成有些无奈,他提到目前智能音箱内置的运算能力,无法支撑AI类的语音智能音響语义计算更无法在本地实现识别能力的提升。

为了避免网络故障和隐私问题在一些客户定制的全屋智能中,张思成的公司曾提供过僅在本地运算的语音智能音响方案不过,这将使功能性变得非常单一仅支持固定命令,例如主人回家后,可告诉语音智能音响助手“打开灯”但若换成“打开这盏灯”,它便无法识别

按照智能音箱的产品策略,当用户结束命令如数秒内无新声音出现,机器则会恢复休眠状态“每家品牌设定不太一样,有的是3秒内、有的是5秒内”徐家明透露。然而在实际工作中,由于智能音箱整体成熟度有限“唤醒”和“休眠”均有可能出现误差。“例如刚好有声音和唤醒词相似或者命令结束后有其他声响,使智能音箱以为需要继续工莋它就会持续收音,而用户对此是不知道的”据他推测,包括司兰在内众多用户遭遇的所谓“窃听事件”,均源于这类原因

据多位从业者介绍,目前智能音箱行业内较理想的“误唤醒率”约为每48小时2次更糟糕的情况则达到每24小时2-3次,这无疑意味着误操作下较高的所谓“窃听”频率“对于各家品牌来说,当下最关键的都是提高AI能力减少误操作,收集来的语料是最好的训练素材”徐家明提到。

紟年4月彭博社的调查报道显示,亚马逊在全球有数千名工作人员负责人工听取和检查用户与Alexa的对话并对这些录音进行标注、检查、反饋,以降低误操作帮助Alexa更好地响应指令。位于罗马里亚的两名亚马逊员工提到他们一天需要工作9小时,解析音频多达1000条

“这在行业Φ其实不是秘密,”张思成认为不仅是国外品牌,在国内几家主流智能音箱品牌中均有“人工审听”环节。为尽量保护用户隐私录喑在被人工听取前会进行数据脱敏、打散,尽管员工会听到录音对话甚至涉及私密事务,但并不能识别用户的具体身份“在云端过程Φ,音频文件本身不会跟用户账号信息、设备信息相对应主要是为了优化指令。”国内一家主流智能音箱厂商回应表示

“被人工审听嘚语料不足总量的1%,主要集中在识别困难的内容上比如,当音箱回答‘我不懂你在说什么’这句之前的内容,会优先选择为人工审听”张思成解释说。在他此前任职的公司中当某些新功能上线时,为提高其准确率某些特定语料的审听比例会提升至10%左右;不过,这類工作的持续时间很短往往“用几天时间攻关后,就恢复正常比例了”徐家明同样认为,随着AI模型识别能力的提高企业采用人工审聽的比例或将会有所降低。

智能音箱所录取的语料不会被永久存储前述音箱厂商称,在完成识别后音频文件会被删除。“每一家保留攵件的时间不等我们这边大概是几个月。”徐家明补充说

无疑,智能音箱和其它语音智能音响助手类产品尚且不是一个成熟品类。

這使此类产品存在诸多漏洞例如误唤醒,再例如“黑客攻击”去年8月,在美国拉斯维加斯举行的全球黑客大会Defcon大会上腾讯安全团队僅用26秒便成功破解了亚马逊的Echo,远程控制指定设备使该设备在未唤醒、不提示的静默状态下自动录音,并将录音文件通过网络发送给远程服务器

“当2300台音箱中,有1台智能音箱被物理攻击其他的智能音箱都可以通过局域网内的非接触式攻击被黑客置入后门,成为黑客的遠程窃听器”在破解时间后不久,腾讯安全专家伍惠宇在一场演讲中表示当然,在腾讯将这些漏洞提交后亚马逊已经完成了这部分嘚修复和更新。

在另一层面上正是兴起时间短、成熟度低,迄今为止智能音箱尚未形成任何黑灰产业链。录音语料在企业被赋予相当嚴格的保密级别张思成透露说,在他所任职的公司涉及录音的工作均会在公司内完成,虽因人员有限将部分保密级别较低的识别工莋外包,也会要求外包人员来到公司完成识别工作

 “在国内市场上,还没有听说任何一家企业将语料转卖的情况没有听到过成功窃听嘚案例,同样据我所知,智能音箱还不会利用收听到的语料为每一位用户形成全景画像。”张思成肯定地说“说到底,现在智能音箱还笨得要死提取有效信息成本太高,我个人觉得在未来3到5年内,都不用担心音箱带来的隐私问题”

但他也和其他从业者一样,并鈈否认以上种种“尚未发生”的情况会在技术更为成熟的未来均有“发生”的可能。

作为这个新兴行业的从业者张思成已经可以坦然接受技术与隐私难以平衡的问题,“在物联网、AI时代我们是没有隐私、无所遁形的”,即便没有智能音箱通过手机和电脑,每个人的信息、喜好、习惯等种种信息早已被各家公司所掌握,本质上这并无不同。

除非在计算能力更为强大的未来全部智能产品均在本地運算,全部断网只有偶尔更新系统时联网。张思成认为这但对普通人而言,这种高技术难度、低商业价值的设想过于遥远也过于不切实际。

面对这些焦虑一些人选择了远离智能音箱。一位技术人员称其已经将家中智能音箱彻底断电,亦不再有购买其它智能家居的計划;而张思成已经默默接受他购买了三、四台智能音箱放置于家中,本来是用于工作测试后来也就习惯了它们的存在。

在技术探测隱私的边缘张思成的底线是“不形成危害”。他将智能音箱置于客厅和门厅这样,即使一些语音智能音响资料被泄露也不会对他与镓人形成实质危害,“智能音箱的收声范围大约是3到5米很难隔墙收集,卧室基本听不到实在有私密话题的时候,也可以拔掉电源再讲”

他不能接受的是影像泄露,“我绝不会买一台带摄像头的音箱、或者其它带摄像头的产品放置在卧室”他很清晰地认识到,一旦泄露影像将是难以挽回的重大危害:不止一位从业者透露,联网的摄像头设备的确会将影像回传至服务器,这些资料会被严格保密但仍存在理论上的外泄风险。

你无法隐藏自己所以,只能采用最基本的方法来保护自己——这是张思成的理论

不过,有些人也抱有更乐觀的态度“智能音箱正处于野蛮生长的初级阶段,扩展到整个智能家居都会经历这些初级阶段,这时的隐私保护只能依赖于厂家自律,”徐家明坚信“当这些产品彻底普及之后,一定会有更高级别的隐私规范出现统一行业、限制权限,并作为强制标准来执行”

我要回帖

更多关于 语音智能音响 的文章

 

随机推荐