摘要
数据训练是保证人工智能应用高质量落地的核心。随着生成式人工智能大模型产品的广泛应用,数据训练过程关涉用户基本数据、各主体行为轨迹及多元主体复杂的权益变动,这可能对市场竞争、企业创新甚或国家安全产生负面影响。基此,需确保数据来源的合法性,提升数据质量的可信度,遵循数据来源合法—数据质量可信—数据价值释放的基本要求对标数据训练的不同阶段。在数据计算与应用阶段,应注意深度合成技术带来的训练数据污染和运行数据异常问题;在数据开放和共享阶段,应全面准确审视个人信息保护风险和知识产权侵权风险,遵循科技发展的规律,平衡技术可及性、实践可行性以及价值正当性之间的关系,在夯实安全发展的基础上为创新发展预留空间。为此,生成式人工智能的数据训练应以安全为底线,在优化协同监管架构及方法的同时促进创新发展,并兼顾多元主体的正当权益。
关键词
生成式人工智能 /
数据训练 /
数据质量 /
安全发展 /
创新发展 /
规范发展
陈 兵, 傅小鸥.
生成式人工智能数据训练的法治基调及展开[J]. 辽宁师范大学学报(社会科学版). 2024, 47(3): 1-10 https://doi.org/10.16216/j.cnki.lsxbwk.202403001
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}