手机监听、数据泄露……关于精准广告的秘密,你需要知道这些

网络世界中存在许多听上去“细思极恐”的传说,在收到精准广告推送后,很多人会不止一次产生怀疑——手机APP是否被偷听了。

比如日常聊天谈论了最新型号的手机,转头就在某网络上看到了该手机的广告;在某购物网站搜索洗发水,随后居然在其他社交软件上看到同款洗发水……于是不少人会怀疑,手机APP会通过麦克风监听用户的聊天,并在用户不知情的情况下收集隐私信息并给他们推送相应的广告。虽然用户并没有切实的证据证实或者证伪,但网络上的种种传闻,加上日常种种“巧合”的体验,一再加深了他们心中“手机会监听”的认知。

那么从技术和商业角度来说,手机APP真的在监听用户说话吗?

个性化广告,其实不需要靠偷听

近日,在“第五届北大互联网法律媒体研讨班-数字广告与个人信息保护研讨坊”上,多位来自国内法律、大数据与人工智能技术、广告、通信安全领域的专家对这个议题进行了探讨。

大数据与人工智能专家刘鹏表示,手机监听用户这件事,从硬件层面来看是具备条件的,但从软件的实际应用角度则不可能实现。

他解释称,智能音箱这样的硬件设备,可以通过专门的芯片来判断是否有人说话,并且识别和分析语音。但如果是抖音、微信这类手机软件想要全天监测用户的日常对话内容,“技术上虽然可行,但全天候工作的耗电量会非常大”。

从技术的角度来说,手机软件想要监听用户谈话来以实现广告精准推送,无论是直接收集原始录音进行分析,还是对本地语音进行语音转换,做自然语言处理,或是提取关键字,都会发生明显持续的电量和流量消耗,非常影响手机的使用体验,这很难不被用户察觉。

从商业的角度来说,通过语音数据来记录、传输和保存所耗费的成本巨大;现实中用户直接对着麦克风进行语音转换,准确率都不一定高,更何况是像后台录音这样复杂而不可控的语音,其识别和分析的效果也有限。要从用户一天海量的谈话语音数据中识别出广告投放感兴趣的信息,与其他更容易获取的搜索、浏览、消费等数据相比,广告投放成本太高,性价比很低,而且与“窃取用户隐私”这样巨大的法律和道德风险相比,实在是得不偿失。

中国电子技术标准化研究院信息安全研究中心测评实验室副主任何延哲也明确表示,无论是从技术角度来看,还是从成本效率方面考量,数字广告用“偷听”的方式来获取数据,都是不大可能实现的一件事。

不过要解答用户对于广告推送过于精准的疑惑,还要从个性化广告的原理和机制谈起。

个性化广告,是广告系统按照广告主的需求,精准、及时、有效地将广告呈现在广告主希望覆盖的受众面前,以获得预期转化效果。在日常生活中,你可以直观地感受到个性化广告的存在,比如说淘宝的“千人千面”,即每个人打开淘宝页面看到的推荐商品都有可能不同;在微博、抖音等信息流推送中,你也可以看到与自己兴趣高度契合的广告。

个性化广告工作流程的第一步是用户授权下的数据收集,数据包括用户自己录入的信息,用户主动发布的内容,用户可授权访问的信息,利用算法自动记录的用户行为信息等等。除此之外,还可能包括一些第三方的合作数据。当然,一切数据的收集都要建立在合法、合规的法律前提下才能进行,同时企业也需要征得用户同意或者授权下才能收集和使用这些数据。

获得了足够的数据之后,就可以使用各种数据分析方法识别用户数据中呈现的不同模式,然后将他们划分在不同的用户群体,并构建对应的个性化模型。

在个性化广告的原理中,我们常常会听到一个名词叫“用户画像”。用户画像是用于描述用户的数据,是针对某一类符合特定特征的用户群体进行的定义和描述。值得注意的是,用户画像是对一类群体结合业务所做的数学模型,而不会呈现某一个用户的具体信息。它是一种用户的数字化描绘,通过标签化的方式,刻画出具有相同属性(比如兴趣点、购物偏好等)的某一个标签。每一个标签的背后,动辄都是成千上万的用户。

图片来源:视觉中国

因此广告主在推广某款产品的时候,就可以有针对性地选取几个标签(比如“一线城市”、“男性”、“游戏爱好者”等)进行投放,更精准和有价值地触达用户。而每次的广告投放,基本上都会覆盖到百万量级的用户群体。单独针对某一个具体用户(比如张三或是李四)投放单独一条广告的行为,从广告成本和实际需求来看,既是毫无必要的,也是不可能实现的。

而要弄明白“为什么在淘宝上浏览了商品,在微博上能看到相应广告”的问题,还要了解一下“程序化广告”的原理。

程序化广告实现的是广告购买流程的自动化,能在分析数据后根据用户的匹配程度,通过广告交易平台自动化完成广告的采买和投放,同时还能获取实时反馈与投放分析。

举个例子,某公司设计了一款含有沙漠探险加星空帐篷的迪拜旅游产品,该公司想要精准投放给目标群体,那么就要根据产品的路线特点,确定适宜某一年龄段喜欢旅游的用户。比如同一个用户近期曾经在一个订票网站打开过一个搜寻前往迪拜机票信息的网页,然后退出网页,访问小说网站。如果该订票网站、小说网站都属于该旅游产品互联网广告的投放网站,那么该用户就能在小说网站上看到该旅游产品的广告。这就是程序化广告的主要逻辑,也是用户在A平台浏览或搜索一些关键词,很快在B平台看到相关广告的原理。

事实上,这一流程根本不需要靠窃取用户隐私实现。

大数据与人工智能专家刘鹏也举例称,有人在淘宝上浏览了地漏产品,然后打开微博,发现微博上也看到了地漏的推送,那么会担心淘宝是不是把数据泄露给了微博?

“先给出一个明确的答案,绝对不可能。”刘鹏表示,因为数据对于每一个公司来说都是生命线,淘宝把数据直接给微博的操作,是不符合它的商业利益的。而淘宝与微博之间出现跨平台广告的问题,也正是通过程序化广告完成的。

这也是人们常常会觉得那些精准广告可以和自己“心有灵犀”的原因,很大程度上,它们来自于推荐算法,基于的是用户以前的点击、浏览、搜索、消费等大数据,被纳入到广告投放的用户画像里。用户怀疑是因为偷听才被推送的广告,一方面是巧合,另一方面可能源自于“幸存者偏差”的逻辑谬误——每天推送的广告有很多,大部分不感兴趣的被忽略,而一部分“准得吓人”的广告,才让人主动联想起曾经谈论过什么信息,并将二者联系起来。

我们该如何看待广告?

了解广告是如何诞生的、有哪些作用,以及互联网广告的运行机制,或许公众可以用更理性的视角去看待它,才不会因噎废食。

经过了40多年的高速发展和技术迭代,互联网广告,早已成为整个互联网经济模式的重要环节。

根据市场调查公司QuestMobile统计,2019年中国移动互联网广告占比已经接近90%。从全球范围看,2020年全球移动互联网广告市场有望超过2000亿美元。

对于互联网用户来说,其实需要比较明确的一点是,广告是互联网免费内容和服务的基础。

譬如你浏览短视频、发微博、听音乐、看小说、看电视剧和综艺,平台给用户提供免费的内容和服务,则平台就需要用广告收入来支付成本和盈利。

从更宏观的角度看,广告业也是国民经济必不可少的一环。通过广告,更多的消费者能了解到商品的信息,从而促进生产规模的扩大,而规模的提升又会反过来降低价格,只要广告通过扩大规模带来的降价效应超过了广告本身的支出,商品价格就会下降。

互联网市场是典型的双边市场经营模式,即在提供基本网络服务时向用户免费,同时利用网络服务发布商业广告进行盈利。

“‘免费+广告’是中国互联网产业发展最主要的商业模式之一,在这一模式之下用户无须支配成本即可享受免费服务,互联网企业通过广告的收益来抵消经营所需要的成本。”泰和泰律师事务所律师廖怀学表示,“广告收益其实是中国互联网生存的核心。如果广告消失,最终必然会影响到消费者的利益。”

而以数据为驱动、精准投放的个性化广告,则是可以提升社会效率的。通过广告把商品直接推送到感兴趣的消费者面前,可以缩减营销渠道,减少产品和服务的销售成本,消费者也相对减少了搜寻商品所需的时间和货币成本。

事实上,如果推荐的广告正好是用户需要的东西,它就不再是困扰,而是一种服务。在广告的总体数量不会减少的情况下,如果选择关闭广告标识符,比如苹果系统内“限制广告跟踪”功能,用户并不会收不到广告,而是广告相关性降低了——广告不会变少,只会让广告中对你有价值的信息变少。

隐私保护,绝不是纸上谈兵

那么接下来回到最初用户最关心的核心问题——隐私能够有效得到保护吗?

不可否认的是,在新的大数据环境下,人们对数据安全和个人信息保护的问题变得敏感,尤其是数据与隐私泄露的负面事件频现,大量网络黑灰产依然存在。而要解决这些问题,一是要靠法律法规制定最低标准,二是要靠平台方与广告主规范自身行为,做到行业自律。

廖怀学在谈到数字广告与个人信息保护时强调,在未来发展过程当中需要注意两个平衡,一是商业利益和用户体验之间的平衡,对用户不造成干扰,合理发展产业;二是广告产业需求和个人信息安全之间保护的平衡。

目前在国内的法律法规中,有一条关于个人信息的非常重要的原则是“最小够用”,或者称之为“最小必要”原则(minimum and necessary)。

《网络安全法》第四十一条规定,收集个人信息应当符合合法、正当和必要的原则,不得收集与业务无关的个人信息。民法典草案亦规定,不得过度收集、处理个人信息,个人信息的处理包括个人信息的使用、加工、传输、提供、公开等。在实践中应当做到,在满足实现APP功能所必需的个人信息的数量、种类应尽可能少,自动采集个人信息的频率也应当尽可能小,不以欺骗、误导或者强迫等方式收集个人信息,也不得超出目的范围收集个人信息,即在够用的基础上不收集其他非必要的个人信息。

图片来源:视觉中国

个人信息收集的最少必要原则是运营者在收集个人信息时的法定义务,不能通过用户协议或隐私政策中的格式条款对这个原则进行排除,更不能在收集个人信息时超越此原则的限度。

在国家层面,目前国内也在进行个人信息保护法的立法阶段,APP收集个人信息也将会有更严格的规范。

全国信息安全标准化技术委员会已经就推荐性国家标准《信息安全技术--移动互联网应用(App)收集个人信息基本规范(征求意见稿)》分别在2019年8月和2020年1月发布两版草案。

2020年5月28日,十三届全国人大三次会议表决通过的《民法典》在人格权编中设“隐私权和个人信息保护”专章强化个人隐私权的保护。

2020年10月21日《中华人民共和国个人信息保护法(草案)》正式公布,未来或将成为首部专门规定个人信息保护的法律,正式出台后,将成为个人信息保护领域的“基本法”。

与此同时,国内的互联网巨头公司在数据使用和个人信息保护方面持续做出技术探索,对于整个行业都有积极的意义。比如腾讯广告与南开大学联合发布的《隐私保护的多平台联合广告推荐业务》就获得了“2020年数据安全典型实践案例”,基于双方联合研制的算法,实现了在数据保密前提下,不同平台或企业之间的商业价值挖掘。

而腾讯广告的DMP(数据管理平台)就被授予了ISO/IEC 27001信息安全管理体系和ISO/IEC 29151个人身份信息保护两项国际认证。其中 ISO/IEC 27001信息安全管理体系认证是信息安全领域最权威、最被广泛接受和应用的国际标准。

最后需要强调的是,数字广告与个人信息保护问题,实际上还有相当大的公共讨论空间。

就比如,公众对于精准广告的真实态度,可能并不像网上吐槽的那么激烈。

中国电子技术标准化研究院信息安全研究中心测评实验室副主任何延哲分享了一份《App安全意识公众调查问卷报告》,针对App的精准推送广告行为,有近六成的受访者认为“可以接受”——其中43.3%的受访者认为“看情况,如果刚好满足需求未尝不可,但不希望太频繁”;有23%的受访者“希望App更懂我,推荐越精准越好”。

这个大多数受访者对精准广告可以接受的调查结果,看上去可能和你的印象有所不符——网络上对精准广告的讨伐可以说司空见惯了。但它恰恰说明了传播学理论上的“沉默的螺旋”,也就是说网络上的激烈言论,或许无法代表“真实的大多数”。何延哲对此作出解释称,人们往往倾向于对负面信息作出反馈,如果觉得一件事情好或者可以接受,不会专门表达态度,但如果觉得一件事情有不好的体验,则大概率会表态发声。这也是为什么,网络上充斥的都是对精准化广告吐槽的声音,而理解接受它的用户并不会专门表态支持。

这份调查也从另一个侧面说明,公众对精准广告的态度,需要在充分认识、权衡利弊之后理性判断。

总之,在数字经济的背景下,未来随着5G商业化应用的不断发展,利用大数据进行精准推送、个性化分发已成大势所趋,精准广告并非监听的产物,更不是洪水猛兽,精准广告与个人信息保护也并非“鱼和熊掌不可兼得”的关系。法律做好监管,企业做好“数据有度”,公众加深认识和理解,才能推动数字广告产业与个人信息保护多方共赢的局面。