生成式人工智能数据训练的法治基调及展开

doi:10.16216/j.cnki.lsxbwk.202403001

PDF(1373 KB)

辽宁师范大学学报（社会科学版） ›› 2024, Vol. 47 ›› Issue (3) : 1-10. DOI: 10.16216/j.cnki.lsxbwk.202403001

法学前沿·数据法治研究

生成式人工智能数据训练的法治基调及展开

作者信息 +

文章历史 +

摘要

数据训练是保证人工智能应用高质量落地的核心。随着生成式人工智能大模型产品的广泛应用,数据训练过程关涉用户基本数据、各主体行为轨迹及多元主体复杂的权益变动,这可能对市场竞争、企业创新甚或国家安全产生负面影响。基此,需确保数据来源的合法性,提升数据质量的可信度,遵循数据来源合法—数据质量可信—数据价值释放的基本要求对标数据训练的不同阶段。在数据计算与应用阶段,应注意深度合成技术带来的训练数据污染和运行数据异常问题;在数据开放和共享阶段,应全面准确审视个人信息保护风险和知识产权侵权风险,遵循科技发展的规律,平衡技术可及性、实践可行性以及价值正当性之间的关系,在夯实安全发展的基础上为创新发展预留空间。为此,生成式人工智能的数据训练应以安全为底线,在优化协同监管架构及方法的同时促进创新发展,并兼顾多元主体的正当权益。