生成式人工智能訓練數據風險的規制路徑研究
網絡安全與數據治理
邢露元1,沈心怡2,王嘉怡3
1 南京大學 法學院,江蘇南京210046;2 倫敦政治經濟學院法學院,英國倫敦WC2A 2AE; 3 東北農業大學文理學院,黑龍江哈爾濱150030
摘要: 探討了生成式人工智能如ChatGPT在訓練數據方面的法律風險與規制問題。首先分析了生成式人工智能在數據來源、歧視傾向、數據質量以及安全風險等方面的問題,通過對中歐法律體系的比較研究,建議明確界定治理原則,并針對數據合規性制定完善路徑。最后,從具體措施層面,對中國現行的法律規制提出了具體的完善建議,為生成式人工智能的健康發展與法律規制提供有益參考。
中圖分類號:DF9文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2024.01.002
引用格式:邢露元,沈心怡,王嘉怡.生成式人工智能訓練數據風險的規制路徑研究[J].網絡安全與數據治理,2024,43(1):10-18.
引用格式:邢露元,沈心怡,王嘉怡.生成式人工智能訓練數據風險的規制路徑研究[J].網絡安全與數據治理,2024,43(1):10-18.
Legal regulation and enhancement path for mitigating risks in training
Xing Luyuan1,Shen Xinyi2,Wang Jiayi3
1 School of Law, Nanjing University, Nanjing 210046, China; 2 School of Law, London School of Economics and Political Science, London WC2A 2AE, England;3 School of Arts and Sciences, Northeast Agricultural University, Harbin 150030, China
Abstract: This article discusses the legal risks and regulatory issues of generative artificial intelligence such as ChatGPT in training data. It begins by analyzing issues related to the sources of data, tendencies towards discrimination, data quality, and security risks in generative AI. Subsequently, the article undertakes a comparative study of Chinese and European legal systems, proposing the clear definition of governance principles and the development of comprehensive pathways for data compliance. Finally, the article offers specific recommendations from a practical standpoint for the improvement of the current legal regulations in China. These suggestions are intended to serve as proper references for the healthy development and legal regulation of generative artificial intelligence.
Key words : generative AI; artificial intelligence act; training data risks; data compliance
生成式人工智能中的訓練數據風險不同于以往僅能進行分類、預測或實現特定功能的模型,生成式人工智能大模型(Large Generative AI Models,LGAIMs)經過訓練可生成新的文本、圖像或音頻等內容,且具有強大的涌現特性和泛化能力[1]。訓練數據表示為概率分布,LGAIMs可以實現自行學習訓練數據中的模式和關系,可以生成訓練數據集之外的內容[2]。同時,LGAIMs與用戶之間進行人機交互所產生的數據還會被用于大模型的迭代訓練。LGAIMs的開發者往往需要使用互聯網上公開的數據以及和用戶的交互數據作為訓練數據,而這些數據可能存在諸多合規風險,例如數據來源風險、歧視風險和質量風險。
作者信息:
邢露元1,沈心怡2,王嘉怡3
(1 南京大學 法學院,江蘇南京210046;2 倫敦政治經濟學院法學院,英國倫敦WC2A 2AE;
3 東北農業大學文理學院,黑龍江哈爾濱150030)
文章下載地址:http://m.viuna.cn/resource/share/2000005886
此內容為AET網站原創,未經授權禁止轉載。