
试水ChatGPT 切不可以身家试法
在之前的文章(《热度“狂飙”的ChatGPT,亟待“合规刹车”》)中我们讨论了当红风头正盛的ChatGPT,分析了它的技术本质、应用场景和法律风险初探。而在近期的《流浪地球》系列电影中,“虚拟数字人”的概念博人眼球。这不禁让我想起另一个红极一时的概念,“深度伪造(DeepFake)”、“AI换脸”。
深度合成技术
事实上,“虚拟数字人”的构建离不开包括伪造技术在内的深度合成技术,而ChatGPT是深度合成领域下的一类模型。数据深度合成(Deep Synthesis)本身是一个中性概念,泛指借助深度学习算法模型等智能化方案自动生成文本、图像、语音、视频等数据内容的一系列处理技术。其中文本因为其较强的字符特征,只需满足空间序上的合理性,与视频、音频类型数据的处理思路略有不同。
在ChatGPT一类的大型语言模型中,包含预训练和下游任务训练两个部分。在预训练阶段,模型从大量的数据中学习复杂的上下文联系,并将这种联系向量化。Next-token-prediction 和 masked-language-modeling 是用于预训练语言模型的核心技术。在第一种方法中,模型被给定一个词序列作为输入,并被要求预测序列中的下一个词,而在第二种方法中,其输入句子中的一些词被替换为特殊token,例如[MASK],模型被要求预测应该插入到[MASK]位置的正确的词。同时,在下游任务训练中,In-content Learning(语境学习)被提出以提升模型在各个场景任务下的表现能力。譬如标注者会给模型一个提示性的输入,让模型更加清楚的感知到应该输出的范式。
在图像、音频类深度伪造模型中,生成网络”(generative network)或“生成器”(generator)负责制作复制原始数据集特征的合成数据如图片、音频记录、视频等,并制作“深度合成物”;鉴别网络(discriminative network)或者说鉴别器(discriminator)则负责识别合成的数据,检测该视频是否为伪造。通过反复的“无监督学习”过程,“生成网络”制作并修改“深度合成物”,直到“鉴别网络”无法再检测出该合成物系经“深度合成”,最终形成高保真的信息内容。
总体而言,基于深度学习的数据合成技术随着算力的发展逐渐从研究型走向应用型,主要应用在文本合成、视觉合成、听觉合成等三大领域,因循数据收集、模型训练、伪造内容等核心步骤,创造虚拟数字人及其所处的生态环境。
相关戏仿性应用产品迅速迭代,一方面,数据深度合成的正向应用将创建的文本段落、虚拟角色、声音模拟、视频渲染等广泛应用到社交通讯、娱乐文化等众多场景之中,提升信息处理效率,增进临场体验。另一方面,深度合成内容难以精准及时地予以鉴识,部分主体传播虚假信息,操控受众反应,严重威胁整个社会的安全体系与保障机制,因此亟待构建和完善规模化的规制体系。
《互联网信息服务深度合成管理规定》解析
我国国家互联网信息办公室、中华人民共和国工业和信息化部、中华人民共和国公安部在2022年11月3日通过了《互联网信息服务深度合成管理规定》(下称“规定”),该规定基于深度合成应用的定性和风险的评估,从而提出包括内容标志、主体报备、用户实名制、内容审核机制、救济机制、个人信息保护和数据安全等方面的规制措施。
内容标志
深度合成服务提供者(下称“服务提供者”)对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的显著标识,从而防止公众混淆误认。
主体报备和用户实名制
具有舆论属性或者社会动员能力的服务提供者和技术支持者应当按照《互联网信息服务算法推荐管理规定》履行备案手续,并在网站、应用程序公示,同时按照国家有关规定开展安全评估(相关合规流程仍在摸索之中);服务提供商需要对深度合成服务使用者进行真实身份信息认证。飒姐团队认为之后会出台针对深度合成内容专门的备案手续。
内容审核机制和救济机制
服务提供者应当加强深度合成内容管理。采取技术或者人工方式对输入数据和合成结果进行审核,建立健全用于识别违法和不良信息的特征库,完善入库标准、规则和程序,记录并留存相关网络日志。
服务提供者应当建立健全辟谣机制。发现利用深度合成服务制作、复制、发布、传播虚假信息的,应当及时采取辟谣措施,保存有关记录,并向网信部门和有关主管部门报告。
个人信息保护和数据安全
服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全,若数据集中包含个人信息,则需遵循个保法相关规定和配套标准。
算法安全评估
规定要求合成服务提供者和技术支持者应当加强技术管理,定期审核、评估、验证生成合成类算法机制机理,强调了处理具有生物识别信息、可能涉及国家信息的模型、模板需要进行安全评估,相关审核、评估机制尚未明确要求。飒姐团队认为该类评估由于企业对核心技术披露的限制以及当前评估技术的局限性,困难重重。
写在最后
深度合成归根结底是人工智能技术,尤其是算力发展的产物,其独特的创造性注定会逐渐走入生产生活,因此监管体系和合规体系的构建是必然路径。
深度合成技术上的特殊性要求我们一方面做好深度合成配套法律法规、标准的制定和完善,企业逐步摸索出一条合规路径,另一方面投入到深度合成检测追踪技术的开发与应用,法律、技术双管齐下,为做优产业发展环境提供重要基石,最终促进整个行业的健康发展。
比推快讯
更多 >>- 贾跃亭:“加密飞轮”CXC10 将独立运营,法拉第未来的价值不会被稀释
- 分析:贝莱德 ETF 代币化是区块链结算的理想试验场,但仍面临技术和监管挑战
- 麻吉大哥在 4675 至 5000 美元区间挂单出售 6800 枚 ETH 以止盈
- 韩国交易员南石熙将山寨多单减至 42 个,MYX 多单浮亏 29 万美元
- pump.fun 已累计回购价值超 9200 万美元 PUMP 代币
- 币安 Alpha 空投将于今日 15:00 开放领取,门槛为 200 积分
- Mova 生态 DEX USD1Swap 启动创世之鹰计划,探索 DeFi 与 RWA 融合新路径
- 数据:因 “transferFrom” 漏洞导致 Base 链上出现约 9 万美元损失
- 特斯拉董事长为马斯克万亿薪酬方案辩护
- 过去 1 小时 UNI 爆仓达 223.25 万美元,同期 BTC 仅爆仓 71.01 万美元
- 易理华:币圈轮涨定律已开始,优质山寨季一定会爆发
- 欧洲央行管委:欧央行利率周期已近尾声
- Yala:黑客发动攻击但并未得逞,用户资金安全
- Yala:协议遭遇攻击未遂,YU 短暂脱锚,用户资产安全未受影响
- Tether 于以太坊网络增发 10 亿枚 USDT
- 加密恐慌与贪婪指数升至 55,市场重回贪婪区间
- pump.fun 于 Solana 生态发币平台的市场份额升至 84.1%
- 慢雾确认稳定币项目 Yala 遭遇攻击,正在协助调查分析
- Yala 疑遭黑客攻击,慢雾称已收到 Yala 官方求助
- RootData:OBT 将于一周后解锁价值约 137 万美元的代币
- 上海市委书记陈吉宁:依托区块链技术建立金融风险监测预警系统,引导更多金融机构上链用链
- Bagwork 上涨触及 0.035 USDT,12 H 涨幅 1066%
- Coinbase CEO:上币不会收取费用,均按照统一标准进行评估
- 数据:Tron 24 小时收入达 142 万美元,远超其他区块链位居第一
- 市场消息:Yala 协议疑似遭到黑客攻击,稳定币 YU 已脱锚
- 某巨鲸从币安提取 3.3 万枚 SOL 并存入 HyperLiquid 出售
- Galaxy Digital 于过去 5 小时内再次购入 325,000 枚 SOL
- 本周 NFT 交易额回升 5.69%至 1.066 亿美元,买卖双方数量骤降近 70%
- 一用户做空 PUMP 浮亏 3500 万美元,总亏损超 4410 万美元
- 以太坊基金会公布端到端隐私路线图,涵盖写入、读取与证明
- 数据:ETH 当前全网 8 小时平均资金费率为 0.0074%
- Derive 联创提议将 DRV 代币供应量增加 50%,现有持有者权益预计稀释 33%
- Shibarium 跨链桥遭到闪电贷攻击,损失超 240 万美元
- SharpLink Gaming 以太坊财库未实现利润达 9.76 亿美元
- Pump.fun 联创:直播流数量已超 Rumble,正加速抢占市场份额
- 两年前建仓 ETH 的鲸鱼向 OKX 转入 3000 枚,累计浮盈超 3700 万美元
- PUMP 涨破 0.0072 美元创历史新高,日内涨幅超 13%
- 数据:过去 24h Binance 净流入 2.01 亿 USDT
- 以太坊提币放缓,过去 24 小时 CEX 净流入 7627.44 枚 ETH
- 巴西金融科技公司 Meliuz 推出新策略以增持其比特币储备
- CryptoQuant 分析师:ETH 正处于最强周期之一
- 美联储 9 月降息 50 个基点概率为 6.6%
- USDH 竞标战况:Native Markets 当前获 71.18%质押份额支持,获胜概率升至 98.1%
- Balaner:MKR 迁移至 SKY 拟于 9 月 18 日截止,逾期或将引发损失
- X Layer 过去 24 小时链上交易量达 7745 万美元,环比上涨 116%
- Binance Alpha 新一期 ZEUS 空投单号收益约 48 美元
- USAT 官网声明:非美国法定货币,不受任何政府机构的保险保障
- 美国国会预算办公室下调美国今年经济增长预测
- Tether 新稳定币 USAT 计划于年底前推出
- 央行数研所所长:应该对数字人民币的计量框架进行升级
比推专栏
更多 >>观点
比推热门文章
- 韩国交易员南石熙将山寨多单减至 42 个,MYX 多单浮亏 29 万美元
- pump.fun 已累计回购价值超 9200 万美元 PUMP 代币
- 币安 Alpha 空投将于今日 15:00 开放领取,门槛为 200 积分
- Mova 生态 DEX USD1Swap 启动创世之鹰计划,探索 DeFi 与 RWA 融合新路径
- 数据:因 “transferFrom” 漏洞导致 Base 链上出现约 9 万美元损失
- 特斯拉董事长为马斯克万亿薪酬方案辩护
- 过去 1 小时 UNI 爆仓达 223.25 万美元,同期 BTC 仅爆仓 71.01 万美元
- 易理华:币圈轮涨定律已开始,优质山寨季一定会爆发
- 欧洲央行管委:欧央行利率周期已近尾声
- Yala:黑客发动攻击但并未得逞,用户资金安全