独家报道-"柄尘入牦户白话文"-大模型厂柄尘入牦户白话文商们的“优化陷阱”_ZAKER新闻

柄尘入牦户白话文大模型厂柄尘入牦户白话文商们的“优化陷阱”_ZAKER新闻

大模型厂柄尘入牦户白话文商们的“优化陷阱”_ZAKER新闻

　　这一次李龙给自己定的目标是总分达到700分，考上顶尖的医学院。决心参加高考后，李龙将空闲时间都投入到追梦之中。李龙雷打不动地每日来到清华大学自习室内，在这里开始了他的备考之路。

文 | 科技新知，作者丨思原，编辑丨蕨影在 AI 时代，用户输入的信息不再仅仅属于个人隐私，而是成为了大模型进步的 " 垫脚石 "。" 帮我做一份 PPT"" 帮我做一版新春海报 "" 帮我总结一下文档内容 "，大模型火了以后，用 AI 工具提效已经成了白领们工作的日常，甚至不少人开始用 AI 叫外卖、订酒店。然而，这种数据收集和使用的方式也带来了巨大的隐私风险。很多用户忽视了数字化时代，使用数字化技术、工具的一个主要问题，就是透明度的缺失，他们不清楚这些 AI 工具的数据如何被收集、处理和存储，不确定数据是否被滥用或泄露。今年 3 月，OpenAI 承认 ChatGPT 存在漏洞，导致部分用户的历史聊天记录被泄露。此事件引发了公众对大模型数据安全和个人隐私保护的担忧。除了 ChatGPT 数据泄露事件，Meta 的 AI 模型也因侵犯版权而饱受争议。今年 4 月，美国作家、艺术家等组织指控 Meta 的 AI 模型盗用他们的作品进行训练，侵犯其版权。同样，在国内也发生了类似的事件。最近，爱奇艺与 " 大模型六小虎 " 之一的稀宇科技（MiniMax）因著作权纠纷引发关注。爱奇艺指控海螺 AI 未经许可使用其版权素材训练模型，此案为国内首例视频平台对 AI 视频大模型的侵权诉讼。这些事件引发了外界对大模型训练数据来源和版权问题的关注，说明 AI 技术的发展需要建立在用户隐私保护的基础之上。为了解当前国产大模型信息披露透明度情况，「科技新知」选取了豆包、文心一言、kimi、腾讯混元、星火大模型、通义千文、快手可灵这 7 款市面主流大模型产品作为样本，通过隐私政策和用户协议测评、产品功能设计体验等方式，进行了实测，发现不少产品在这方面做得并不出色，我们也清晰地看到了用户数据与 AI 产品之间的敏感关系。撤回权形同虚设首先，「科技新知」从登录页面可以明显看到，7 款国产大模型产品均沿袭了互联网 APP 的 " 标配 " 使用协议和隐私政策，并且均在隐私政策文本中设有不同章节，以向用户说明如何收集和使用个人信息。而这些产品的说法也基本一致，" 为了优化和改进服务体验，我们可能会结合用户对输出内容的反馈以及使用过程中遇到的问题来改进服务。在经过安全加密技术处理、严格去标识化的前提下，可能会将用户向 AI 输入的数据、发出的指令以及 AI 相应生成的回复、用户对产品的访问和使用情况进行分析并用于模型训练。"事实上，利用用户数据训练产品，再迭代更好产品供用户使用，似乎是一个正向循环，但用户关心的问题在于是否有权拒绝或撤回相关数据 " 投喂 "AI 训练。而「科技新知」在翻阅以及实测这 7 款 AI 产品后发现，只有豆包、讯飞、通义千问、可灵四家在隐私条款中提及了可以 " 改变授权产品继续收集个人信息的范围或撤回授权 "。其中，豆包主要是集中在语音信息的撤回授权。政策显示，" 如果您不希望您输入或提供的语音信息用于模型训练和优化，可以通过关闭 " 设置 "-" 账号设置 "-" 改进语音服务 " 来撤回您的授权 "；不过对于其他信息，则是需要通过公示的联系方式与官方联系，才能要求撤回使用数据用于模型训练和优化。在实际操作过程中，对于语音服务的授权关闭并不算难，但对于其他信息的撤回使用，「科技新知」在联系豆包官方后一直未能得到回复。通义千问与豆包类似，个人能操作的仅有对语音服务的授权撤回，而对于其他信息，也是需要联系通过披露的联系方式与官方联系，才能改变或者收回授权收集和处理个人信息的范围。可灵作为视频及图像生成平台，在人脸使用方面有着重表示，称不会将您的面部像素信息用于其他任何用途或共享给第三方。但如果想要取消授权，则需要发送邮件联系官方进行取消。相比豆包、通义千文以及可灵，讯飞星火的要求更为苛刻，按照条款，用户如果需要改变或撤回收集个人信息的范围，需要通过注销账号的方式才能实现。值得一提的是，腾讯元宝虽然没有在条款中提到如何改变信息授权，但在 APP 中我们可以看到 " 语音功能改进计划 " 的开关。而 Kimi 虽然在隐私条款中提到了可以撤销向第三方分享声纹信息，并且可以在 APP 中进行相应操作，但「科技新知」在摸索良久后并没有发现更改入口。至于其他文字类信息，也未找到相应条款。其实，从几款主流的大模型应用不难看出，各家对于用户声纹管理更为重视，豆包、通义千文等都能通过自主操作去取消授权，而对于地理位置、摄像头、麦克风等特定交互情况下的基础授权，也可以自主关闭，但对撤回 " 投喂 " 的数据，各家都不那么顺畅。值得一提的是，海外大模型在 " 用户数据退出 AI 训练机制 " 上，也有相似做法，谷歌的 Gemini 相关条款规定，" 如果你不想让我们审核将来的对话或使用相关对话来改进 Google 的机器学习技术，请关闭 Gemini 应用活动记录。"另外，Gemini 也提到，当删除自己的应用活动记录时，系统不会删除已经过人工审核员审核或批注的对话内容（以及语言、设备类型、位置信息或反馈等相关数据），因为这些内容是单独保存的，并且未与 Google 账号关联。这些内容最长会保留三年。ChatGPT 的规则有些模棱两可，称用户可能有权限制其处理个人数据，但在实际使用中发现，Plus 用户可以主动设置禁用数据用于训练，但对于免费用户，数据通常会被默认收集并用于训练，用户想要选择退出则需要给官方发件。其实，从这些大模型产品的条款我们不难看出，收集用户输入信息似乎已经成了共识，不过对于更为隐私的声纹、人脸等生物信息，仅有一些多模态平台略有表现。但是这并非经验不足，尤其是对于互联网大厂来说。比如，微信的隐私条款中就详尽地列举了每一项数据收集的具体场景、目的和范围，甚至明确承诺 " 不会收集用户的聊天记录 " 抖音也是如此，用户在抖音上上传的信息几乎都会在隐私条款中标准使用方式、使用目的等详细说明。互联网社交时代被严格管控的数据获取行为，如今在 AI 时代中却成了一种常态。用户输入的信息已经被大模型厂商们打着 " 训练语料 " 的口号随意获取，用户数据不再被认为是需要严格对待的个人隐私，而是模型进步的 " 垫脚石 "。除了用户数据外，对于大模型尝试来说，训练语料的透明也至关重要，这些语料是否合理合法，是否构成侵权，对于用户的使用来说是否存在潜在风险等都是问题。我们带着疑问对这 7 款大模型产品进行了深度挖掘、评测，结果也令我们大吃一惊。训练语料 " 投喂 " 隐患大模型的训练除了算力外，高质量的语料更为重要，然而这些语料往往存在一些受版权保护的文本、图片、视频等多样化作品，未经授权便使用显然会构成侵权。「科技新知」实测后发现，7 款大模型产品在协议中都未提及大模型训练数据的具体来源，更没有公开版权数据。至于大家都非常默契不公开训练语料的原因也很简单，一方面可能是因为数据使用不当很容易出现版权争端，而 AI 公司将版权产品用作训练语料是否合规合法，目前还未有相关规定；另一方面或与企业之间的竞争有关，企业公开训练语料就相当于食品公司将原材料告诉了同行，同行可以很快进行复刻，提高产品水平。值得一提的是，大多数模型的政策协议中都提到，会将用户和大模型的交互后所得到的信息用于模型和服务优化、相关研究、品牌推广与宣传、市场营销、用户调研等。坦白讲，因为用户数据的质量参差不齐，场景深度不够，边际效应存在等多方面原因，用户数据很难提高模型能力，甚至还可能带来额外的数据清洗成本。但即便如此，用户数据的价值仍然存在。只是它们不再是提升模型能力的关键，而是企业获取商业利益的新途径。通过分析用户对话，企业可以洞察用户行为、发掘变现场景、定制商业功能，甚至和广告商共享信息。而这些也恰巧都符合大模型产品的使用规则。不过，也需要注意的是，实时处理过程中产生的数据会上传到云端进行处理，也同样会被存储至云端，虽然大多数大模型在隐私协议中提到使用不低于行业同行的加密技术、匿名化处理及相关可行的手段保护个人信息，但这些措施的实际效果仍有担忧。例如，如果将用户输入的内容作为数据集，可能过段时间后当其他人向大模型提问相关的内容，会带来信息泄露的风险；另外，如果云端或者产品遭到攻击，是否仍可能通过关联或分析技术恢复原始信息，这一点也是隐患。欧洲数据保护委员会（EDPB）前不久发布了对人工智能模型处理个人数据的数据保护指导意见。该意见明确指出，AI 模型的匿名性并非一纸声明即可确立，而是必须经过严谨的技术验证和不懈的监控措施来确保。此外，意见还着重强调，企业不仅要证实数据处理活动的必要性，还必须展示其在处理过程中采用了对个人隐私侵入性最小的方法。所以，当大模型公司以 " 为了提升模型性能 " 而收集数据时，我们需要更警惕去思考，这是模型进步的必要条件，还是企业基于商业目的而对用户的数据滥用。数据安全模糊地带除了常规大模型应用外，智能体、端侧 AI 的应用带来的隐私泄漏风险更为复杂。相比聊天机器人等 AI 工具，智能体、端侧 AI 在使用时需要获取的个人信息会更详细且更具有价值。以往手机获取的信息主要包括用户设备及应用信息、日志信息、底层权限信息等；在端侧 AI 场景以及当前主要基于读屏录屏的技术方式，除上述全面的信息权限外，终端智能体往往还可以获取录屏的文件本身，并进一步通过模型分析，获取其所展现的身份、位置、支付等各类敏感信息。例如荣耀此前在发布会上演示的叫外卖场景，这样位置、支付、偏好等信息都会被 AI 应用悄无声息地读取与记录，增加了个人隐私泄露的风险。如 " 腾讯研究院 " 此前分析，在移动互联网生态中，直接面向消费者提供服务的 APP 一般均会被视为数据控制者，在如电商、社交、出行等服务场景中承担着相应的隐私保护与数据安全责任。然而，当端侧 AI 智能体基于 APP 的服务能力完成特定任务时，终端厂商与 APP 服务提供者在数据安全上的责任边界变得模糊。往往厂商会以提供更好服务来当作说辞，当放到整个行业量来看，这也并非 " 正当理由 "，Apple Intelligence 就明确表示其云端不会存储用户数据，并采用多种技术手段防止包括 Apple 自身在内的任何机构获取用户数据，赢得用户信任。毋庸置疑，当前主流大模型在透明度方面存在诸多亟待解决的问题。无论是用户数据撤回的艰难，还是训练语料来源的不透明，亦或是智能体、端侧 AI 带来的复杂隐私风险，都在不断侵蚀着用户对大模型的信任基石。大模型作为推动数字化进程的关键力量，其透明度的提升已刻不容缓。这不仅关乎用户个人信息安全与隐私保护，更是决定整个大模型行业能否健康、可持续发展的核心要素。未来，期待各大模型厂商能积极响应，主动优化产品设计与隐私政策，以更加开放、透明的姿态，向用户清晰阐释数据的来龙去脉，让用户能够放心地使用大模型技术。同时，监管部门也应加快完善相关法律法规，明确数据使用规范与责任边界，为大模型行业营造一个既充满创新活力又安全有序的发展环境，使大模型真正成为造福人类的强大工具。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:钱生禄

TOP1热点：2024年度华语地区最喜欢的歌曲TOP10！

　　也就是说，比之第一副总理来华来，乌克兰方面是总统出面去马尼拉邀请小马科斯——哪怕两人刚刚一起在新加坡开会，都不能显示其热络！。

　　瑟比加也谈到乌克兰方面珍视两国传统友谊，恪守一个中国原则，愿意进一步密切两国各层级交往，加强各领域合作，推动双边关系发展取得更多更好成果。

TOP2热点：耗时14天完成纯白的拼图—纯白地狱

　　受地震影响，途经昌福线运行的部分旅客列车晚点。铁路部门提醒广大旅客可通过12306铁路客服平台及车站广播、大屏、公告等方式，及时掌握列车运行情况，合理安排行程。

　　记者调查发现，受商业利益驱使，一些研学机构会将大凉山的孩子包装为“寻求支教老师的学生”，并借此推出“7天收费万元就能拿到志愿者公益证书、乡村助学研学报告”的研学项目。

TOP3热点：转发给兄弟然后什么也不说钙网

　　张军社认为，荷兰、澳大利亚和加拿大都做了对中方实施抵近侦察、滋事挑衅等动作。根据中国国防部发布的消息，澳大利亚指责中国“危险接近”的事实是其3次派舰载直升机对中方正常训练活动进行抵近侦察滋扰，中国军队对其喊话警告、外逼驱离，相关操作正当合理、专业安全。“无论是哪个国家意图不轨，为维护国家主权和安全，解放军都会采取必要的应对措施。” 张军社说。

　　2015年，杨慧调任贵州省疾病预防控制中心党委书记、副主任，2018年回到贵州省卫计委，任党组成员、副主任，当年11月任贵州省卫生健康委员会副主任，2020年8月任省卫健委党组书记，至此番任上被查。

TOP4热点：那些让人惊叹的动物视频！禁欲佛子的占有欲有多强

　　采访中，不少业内人士指出，公益支教需要双向奔赴，志愿者在具备专业技能的同时，也得契合受教地区的实际需求。一些个人或机构不合规甚至“卖惨式”售卖大凉山支教的行为，最终还是会导致花钱的志愿者、大凉山的孩子都成为“公益生意链”的受害者。此外，研学的重要性在于提升孩子素养，而非满足做公益的成就感，或是盲目跟风。

　　6月3日下午，湖南省委书记沈晓明在长沙会见古巴共产党中央政治局委员、阿特米萨省委第一书记马丁内斯率领的古巴共产党干部考察团。

TOP5热点：当时只道是寻常而今追忆自潸然水影的怀孕训练游戏

　　9月13日，顶端新闻记者以受害者家属的身份联系了儿慈会9958儿童紧急救助项目的工作人员，她表示柯某孝已经向警方自首，此事件是柯某孝是冒充儿慈会的名义行骗，属于柯某孝的个人行为，目前该案件已经立案，“案件是刑事案件，后面的细节还没透露呢，我们也不知道，我们也是受害者。”

　　在李龙心里，参加高考只为圆他的医学梦，“再次高考是想通过自己的努力改变人生轨迹，完成梦想。希望我所传递出的是一种永不止步、不断向前的积极态度。”李龙对上游新闻记者说。

TOP6热点：为了梦想，是要用一生来坚持！曾经全网爆火的小说，在被雪藏的这些年，他的作者是如何走过来的？为了梦想，会做出多大的事情来，执行力到底有多少？唐三阿银不亦乐乎网页版

　　“现在终于考完了，有种如释重负的感觉。”李龙说，“过去这三天精神压力很大，对体力和精神都是很大的挑战，通过这次考试对自己也有了新的认识。”

　　瑟比加来华之旅，回程之际，并没有中乌双方的联合声明之类。当然，这只是一次副部长级的会晤，是否有联合声明并非特别重要的一个外界观察指标。真正重要的问题在于，双方是否达成共识。

TOP7热点：耗时14天完成纯白的拼图—纯白地狱钙网

　　李龙说，目前不好预估最终的分数，只能等结果出来看，希望去顶尖几所医学院，目标是西医的临床方向或者中医的本博九年制。至于具体报考哪个专业，他计划根据考试发挥情况再决定。

　　他跑到新加坡参加香格里拉对话会，之后又访问菲律宾。而他向媒体吹风其前往菲律宾的理由，竟然是因为在新加坡香格里拉大酒店没有能够和菲律宾总统小马科斯坐下来进行双边会晤。

TOP8热点：当你看见淹在水里的“大象”请立刻离开！这动物园不正常!!禁欲佛子的占有欲有多强

　　李龙告诉记者，7日上午的语文考试考得并不理想，心态有点崩溃。他分析认为，由于准备不够充分，在之前的复习中，没有严格按照两个半小时的标准答卷，所以导致上了考场时间紧张，语文作文也没能写够800字。

　　面对如此重要的考试，同时又受到广泛关注，李龙的状态难免受到影响。考试前一天，抵达哈尔滨后，李龙身体稍感不适。李龙对上游新闻记者说，这次考试成绩如何关键在于语文，所以在考试前的复习重点仍放在语文上。

TOP9热点：《故事感》【2024画师年终总结】全新国产max485csa

　　财联社6月6日电，山东青岛胶州市推出房票安置、购房补贴、商品房团购、共有产权人才房等多项激励政策和举措，促进房地产市场高质量发展。参与商品房团购，还有多项优惠政策。一是年度最低价保障，确保团购池房源为2024年度内同等房源市场最低价，且为网签后半年内最低价。二是在此基础上，争取开发企业再让利5%~10%。三是购买家庭首套房且收入相对困难的，首付款可按50%缴纳，剩余50%首付款可缓交1~2年交齐。这意味着，胶州的政策更进一步，在15%首套房首付比例的基础上，可做到7.5%的最低首付比例。

TOP10热点：洛杉矶消防：打火警求救的都该怪自己，我们主要情感慰藉法国建立时间

　　改革开放以来，中国福利会立足上海、服务全国、走向世界，事业板块不断拓展，涵盖妇幼保健、学前教育、学校教育、校外教育、儿童戏剧、出版传媒、老年福利以及公益慈善等八大领域。

　　（1）微信朋友圈有“点赞”功能。有人关注“点赞”数量，有人热衷于给人“点赞”……对“点赞”现象，你有什么看法？请说明你的观点和理由。要求：观点明确，言之有理。

发布于：安仁县