摘要: [目的/意义]以“科学数据安全”为具体切入点,系统分析了GAI训练数据的法律风险问题,并提出了规制法律风险的具体措施,以期为GAI高质量发展提供理论依据和实践指导。\[方法/过程\]立足于法学、信息资源管理等多学科理论视角,运用文献调研、网络调研、案例分析等方法,基于生成式人工智能训练数据中科学数据的特征,理清了GAI训练科学数据的法律风险类型,最后提出了法律风险疏解策略。\[结果/结论\]科学数据具有生成过程的特定性与规范化、价值构成的高密度性与知识专业性、权利结构的复杂性与公共性等特征,基于其典型特征,识别出科学数据在获取阶段的著作权、数据财产权、个人信息权的侵权风险,在处理阶段的科学数据滥用与合成风险,以及在管理阶段的数据泄露与模型技术偏见风险。建议构建“前置防控—过程规制—责任化解—系统预防”疏解机制,通过权属确权、技术规范、责任划分等措施,平衡科学数据安全与GAI技术创新。