融泰资讯 | 吴子芳主任、吴凡律师出席北京知识产权法研究会第三届会员大会第三次会议暨2024年会

首页    新闻资讯    融泰要闻    融泰资讯 | 吴子芳主任、吴凡律师出席北京知识产权法研究会第三届会员大会第三次会议暨2024年会

近日,北京知识产权法研究会第三届会员大会第三次会议暨2024年会在京顺利举办。会议以“知识产权助力高质量发展”为主题,共设置一场主题报告及五个分论坛,同时举办了北京知识产权法研究会第三届会员大会第三次会议。两百余位知识产权界的知名专家、学者、法官、律师以及企业、产业代表齐聚一堂,共襄盛会。

 

北京知识产权法研究会第三届常务理事会第四次会议、第三届会员大会第三次会议、第三届理事会第三次会议、第三届监事会第三次会议分别由研究会常务副会长孙国瑞、研究会常务副会长兼秘书长杨华权、研究会会长曲三强、研究会监事长张广良主持。会议听取、审议了《2023年工作报告与2024年工作计划》等内容,吴子芳副会长兼执行秘书长介绍会员申请入会名单、拟增选理事名单,并介绍了拟增选常务理事、副会长名单,并由会议表决通过

本次年会共设置了五个分论坛,各分论坛议题分别为“数据的知识产权保护”“人工智能挑战与著作权法变革”“人工智能挑战与商标法变革”“人工智能挑战与专利法变革”“人工智能挑战与竞争法变革”,分论坛议题设置视野全面,聚焦人工智能在知识产权领域的热点、难点等前沿性问题。

北京知识产权法研究会信息网络与数据法委员会副秘书长、北京市融泰律师事务所管理合伙人吴凡律师受邀以《人工智能模型训练阶段的著作权法之辩》为题,在“人工智能挑战与著作权法变革”分论坛发表演讲。

 

 

下附演讲全文:

 

在人工智能时代,随着机器创作能力的不断提升,著作权法面临着前所未有的挑战。生成式人工智能的运转,从数据输入、数据输出的维度可以大致划分为模型训练、成果产出两个阶段。本次我将围绕着“人工智能模型训练阶段的著作权问题”进行汇报。

选择“人工智能模型训练阶段的著作权问题”主题,一方面是因为国内外均存在着作者起诉人工智能服务提供者未经授权使用其原创作品进行模型训练的案件,例如《纽约时报》起诉微软和OpenAI公司等;另一方面,人工智能模型训练内容的获取和使用的合法性,是AIGC为我们提出的首要问题,也是判断AIGC合法性的逻辑起点。人工智能模型训练是合法使用还是侵权使用,决定了后续的创作、输出等行为是否正当。正如我国《生成式人工智能服务管理暂行办法》规定,生成式人工智能服务提供者开展训练数据处理活动时,不得侵害他人依法享有的知识产权。

人工智能模型训练阶段实际上是一系列行为的组合,需要逐一讨论。在人工智能模型训练阶段,一般需要把相应内容进行数据转化,同时进行结构化或非结构化处理,对数据进行转码、标记、清洗、整理等。技术实现路径分为代码编译、数据训练两大类。在大数据时代的初期,通过代码编译将人类的思维结构赋予机器是路径之一,比如通过代码编译让机器掌握语言的主谓宾定状补,固定词语搭配,逐步掌握人类的语言结构,理解词语之间的搭配、语法规则等,从而实现对语言的理解和生成。数据训练离不开人工智能发展的三大要素,即数据、算法和算力。数据训练可以理解为机器学习,是基于海量数据和数据建模而来的。以文本数据训练为例,机器快速阅读形成专题模板后再通过语言模型进行加工,使得模型能够逐渐适应各种复杂场景。同时,除了文字作品以外,凡是能够转换为数据的作品均可能用于人工智能模型训练,例如音乐、美术、视听等等。具体的应用场景决定了人工智能的应用落地和效果,文学艺术领域的人工智能丰富了我们的文化生活,也为艺术家和创作者提供了更多的灵感。在当下人工智能应用实践中,机器生成内容的实现多是兼采代码定义和数据训练两种方法。

人工智能模型训练阶段数据的质量、数量和多样性都至关重要。不言自明的是,人工智能模型训练所使用之数据不乏大量他人享有权利的数据。作品形式的转变可能涉及到的著作权权项是复制权、翻译权、改编权、修改权、保护作品完整权等。但是,在人工智能模型训练阶段,将原作品转换为机器可读作品的过程中,作品的表达形式并没有发生实质性的改变,其目的并非是为了创作新的作品,而是为了对原作品的转换和分析,故而可能侵犯复制权而非改编权。当然在人工智能模型实际应用之时,其产出成果符合了作品的外在特征,仍需考虑改编权的问题。至于修改权、保护作品完整权等著作人身权,构成侵权的前提是修改之后的内容在传播之时能够让人意识到修改后的内容是与原作品连结的,但由于对作品进行转码、标记、整理的过程通常是隐蔽,没有进行传播,因此也不涉及此类问题。在模型训练结尾会对算法进行测试及同行校验,可能会涉及信息网络传播权等向公众传播的权利。

站在前人的肩膀上进行创作,借鉴已有的内容产生智力成果是常态。为了解决人工智能模型训练阶段的著作权问题,有三种思路,分别是授权许可使用、法定许可使用和合理使用。

人工智能需要海量数据作为训练基础,如要求对每一作品都要取得授权,那交易成本未免过于高昂,难以满足现实需要。人工智能模型训练阶段,不同于“人类中心主义”的情况,作品并非用于欣赏性、阅读性使用,而是作为模型训练的养料。同时,人工智能未对原作或转码、标记、整理的内容进行传播,范围可控。因此,人工智能模型训练过程中对作品的使用,具有被作为权利例外的基础。需要综合考虑,法定许可制度与合理使用制度。

法定许可制度主要涉及著作权人与邻接权人的关系,例如制作录音制品法定许可,广播电台、电视台的法定许可等,制度设计的目的在于简化作品使用过程的同时,保证著作权人的经济利益。法定许可的优势是一定程度上实现了利益平衡。但海量数据必然会产生高额报酬,难以控制人工智能模型训练阶段的成本;模型训练阶段的隐蔽性使用,也将使得法定许可制度难以落地;再加之,当前科技全球竞争的背景,应当给予新型的人工智能行业更为宽松的欢迎,因此,我认为,合理使用制度更为适合解决人工智能模型训练阶段的著作权问题。

我国现行著作权法的合理使用制度采用了封闭式的规定,列举了具体情形,虽然规定了“法律、行政法规规定的其他情形”,但由于立法的空白,合理使用制度仍是限于十二项具体情形。合理使用制度规定的“为个人学习、研究或者欣赏,使用他人已经发表的作品”,虽然对数量等没有限制,但限于“个人”。以个人为中心创设的合理使用制度,目前还难以扩大解释到“机器人”乃至“机器人”背后的机构。合理使用制度列举的以科研为目的使用,能够豁免复制权的侵权,但是“少量复制”的要求难以适配人工智能领域。文化遗产机构等对内容的复制则是限于陈列或者保存版本的需要,亦不符合人工智能模型训练的需要。

合理使用制度是解决人工智能模型训练阶段的著作权问题是合理路径,但通过我国著作权的合理使用制度解决当前人工智能模型训练阶段的法律问题还是存在一定不足。“转换性使用”理论强调使用目的是否符合促进知识、鼓励创作的目标,不受制于作品的数量;侧重判断“转换性”程度,和商业性使用并没有明确的互斥关系,能够与人工智能批量化、自动化的使用方式相适应,因此可以考虑对“转换性使用”理论的一些优势和优点进行吸收和借鉴。我国或许可以考虑在合理使用制度的基础之上,增加相应条款来解决当前的问题,以实现技术和法律的良性互动、协同发展。

 

 

2024年4月22日 18:05
浏览量:0
收藏