如何向 AI 公司授权您的内容:权利、付款与交易结构
了解如何向 AI 公司授权内容,理解支付结构、授权权利,以及通过谈判策略最大化您的创意资产收益。

正式协议,规范AI系统在训练、推理和输出生成过程中如何使用、引用和展示受版权保护的内容。这些许可框架建立了对AI访问受保护作品的合同控制,界定允许的用途,并确保创作者因其知识产权获得报酬。
正式协议,规范AI系统在训练、推理和输出生成过程中如何使用、引用和展示受版权保护的内容。这些许可框架建立了对AI访问受保护作品的合同控制,界定允许的用途,并确保创作者因其知识产权获得报酬。
AI内容许可指的是正式的法律协议,用于规范人工智能系统在训练、推理和输出生成过程中,如何访问、使用、引用和展示受版权保护的内容。这些协议标志着生成式AI发展早期“未获授权即训练”时代向结构化许可制度的根本转变,内容创作者和权利人能够控制其知识产权。AI内容许可通过建立明确的合同框架,解决了未经授权使用的问题,界定了AI系统可以如何、在何种条件下使用受保护作品,并规定了原始创作者获得的补偿。
AI内容许可的出现回应了生成式AI时代的一个普遍问题:大型AI公司在未经许可或补偿的情况下,使用了数十亿受版权保护的作品(包括书籍、文章、图片和代码)训练模型。这种未经授权的使用对版权持有人产生了深远影响——从个人作者和摄影师到大型媒体机构,都发现自己的毕生创作被纳入了AI系统,而这些系统如今反过来与原创作品竞争。许可的重要性在于,它恢复了“创作者应当控制作品使用方式并获得合理报酬”的基本版权原则,同时也为AI公司提供法律确定性和高质量训练数据的获取途径。该问题的严重性体现在针对AI公司的众多诉讼中,包括美国作家协会对OpenAI和Anthropic的集体诉讼,以及Getty Images对Stability AI的案件——核心争议均在于“未经许可训练是否构成侵权”。
| 方面 | 许可前 | 许可后 |
|---|---|---|
| 创作者控制 | 极少;作品被无授权使用 | 对使用条款有完全控制权 |
| 补偿 | 无;创作者未获得任何收益 | 直接付款或版税收入 |
| 法律地位 | 有争议;易引发诉讼 | 合同明确、可执行 |
| AI公司风险 | 高法律风险 | 通过协议降低责任 |
| 数据质量 | 注重数量;无差别抓取 | 注重质量;精选许可内容 |
AI内容许可协议主要有几种不同形式,各自规范对受版权保护材料的不同用途:
仅限训练许可:仅允许AI公司将受版权保护内容用于训练机器学习模型,并限制训练后模型的部署或商业化方式。这类协议通常禁止AI公司将许可内容用于模型开发之外的其他用途。
检索增强生成(RAG)许可:允许AI系统实时访问和检索许可内容,以支撑回答并提供引用,但不将内容纳入模型权重。RAG许可受到出版商欢迎,因为能精确控制哪些内容出现在AI输出中,并确保获得归属。
输出使用许可:明确规定受版权保护内容是否及如何出现在AI生成的输出中,包括AI是否可生成与许可作品相似或衍生的内容。这类协议通常对含有许可材料的输出商业用途加以限制。
衍生作品许可:规定AI系统是否可基于许可内容生成衍生作品(如摘要、翻译或改编),以及这些衍生物可在何种条件下使用或分发。
有效的AI内容许可协议包含若干关键要素,保护创作者和AI开发者双方利益。使用范围明确AI公司可以对内容做什么(仅限训练、实时检索、输出生成或组合使用),以及哪些AI模型或产品可访问许可材料。补偿模式多样,包括一次性费用、按使用次数计费或分成,重大协议金额每年在500万至6000万美元不等,视内容体量与独占性而定。数据保留与删除条款规定AI公司可保存许可内容的时长,以及合同终止后是否需删除内容,尤其适合关注内容被永久使用的创作者。输出限制规范许可内容在AI生成结果中的呈现方式,包括归属要求、商业用途禁令或禁止生成相似内容。审计权允许创作者核查AI公司的合规性,例如检查训练数据、监控输出及查看使用记录。赔偿条款则通过明确若许可内容侵犯第三方权利或AI公司违反协议时的法律责任分配,保护双方权益。

鉴于单独协商许可协议的复杂性,多个平台应运而生,促进AI内容许可的规模化。Created by Humans作为许可平台,创作者可针对每部作品单独选择AI权利,精细设置训练、检索、输出和衍生作品许可。Calliope Networks则连接作者与出版商和AI平台,让创作者获得版税,AI公司则能访问许可内容。Dataset Providers Alliance倡导自由市场许可,支持创作者与AI公司直接谈判,反对政府强制集体许可。除了这些平台,重大许可协议正重塑AI格局:Reddit与Google达成每年6000万美元的内容许可协议,News Corp将内容许可给OpenAI,Getty Images在起诉Stability AI后达成许可。这些案例表明,集体许可(组织代表多位创作者集体谈判)可实现规模和效率,但个人许可依然重要,便于创作者对作品实施细致控制。
尽管许可框架逐步建立,AI内容许可大规模落地仍面临诸多挑战。合理补偿的确定极为复杂,因为训练数据价值难以量化——当个人作品只是数十亿文档之一时,创作者该获得多少报酬?规模和碎片化带来实际障碍,许可成千上万创作者和作品需依赖复杂基础设施和协调机制,而现有体系尚不完善。执行机制也不成熟,核查AI公司是否履行许可需具备训练数据审计、输出监控和使用追踪技术,这些技术仍在发展中。国际法律差异方面,各国在版权、合理使用和AI监管上规定不同,令全球许可策略更为复杂。技术实施难题还包括如何防止内容被违规使用、如何确保AI输出中正确归属、如何在合同到期后彻底删除内容等。
虽然该领域相关诉讼仍在进行,但“合理使用”与许可要求之间存在关键区别。合理使用是一项法律原则,允许在批评、评论、教育和研究等目的下有限度地使用受版权保护材料,且无需许可,但法院尚未明确定义训练AI模型是否属于合理使用。在2025年11月英国高等法院裁决的Getty Images诉Stability AI案中,法院认定Stability AI未经授权复制数百万张Getty图片以训练AI很可能属于侵权,这说明合理使用可能无法为AI训练提供保护。同样,美国作家协会对OpenAI和Anthropic的诉讼认为,未经许可训练AI使用受版权保护书籍不属于合理使用,而Bartz诉Anthropic案则对合理使用在生成式AI中的适用性做出了折中裁定。关键区别在于,许可是创作者明确授予许可并获得报酬的合同安排,而合理使用是在特定情形下无需许可的法律抗辩。即使法院最终认定某些AI训练属于合理使用,许可依然重要,因为它允许创作者自愿参与、协商条款并获得直接补偿——这是合理使用原则无法提供的权利。
内容创作者在应对AI内容许可时,应采取多种策略以保护自身利益。许可决策应有针对性和选择性:创作者无需将所有作品许可给所有AI公司,可以只许可特定作品、特定公司或特定用途(训练、检索、输出生成)。谈判策略要聚焦于理解自己内容对AI公司的真正价值——热门、高质量或专业内容能获得更高许可费,并应在协议中明确范围、补偿和审计权。权利管理需详细记录哪些内容已许可、给谁、在何种条款和期限下许可,便于执行合同、预防内容被滥用。逐条作品许可(如Created by Humans平台提供)让创作者能精准掌控,既可许可部分作品,也可选择性地拒绝AI使用其他作品,特别适合不希望作品被用于训练竞争者或被不认可方式改编的创作者。创作者还应关注协议中是否包含未来收益分成条款,以便在AI公司利用其内容创造重大收入时获得补偿。

AI内容许可的监管与技术环境正迅速变化。欧盟AI法案于2024年生效,要求AI公司遵守版权法并在使用受保护内容前获得权利人授权,实际上要求欧盟AI开发必须获许可,并推动全球类似规范出台。美国版权局发布的指导意见也指出,用受版权保护作品训练AI模型可能构成表面侵权,责任正逐步转向AI公司,需其证明合理使用或获得许可。许可协议标准正在行业自律和法律判例推动下逐步形成,如Dataset Providers Alliance和Copyright Alliance等组织正协助建立补偿、范围及执行等最佳实践。技术解决方案也在不断发展,包括基于区块链的许可注册、自动追踪AI输出中许可内容的归属系统,以及防止内容被未经授权使用的技术机制。随着监管、合同和技术体系的成熟,AI内容许可将从例外逐步成为常态,彻底重塑AI公司获取训练数据的方式,并让创作者更好地参与并受益于AI经济。
合理使用是一项法律原则,允许在批评和教育等目的下有限制地使用受版权保护的材料,无需获得许可,但法院尚未明确定义训练AI模型是否属于合理使用。AI内容许可则是一种合同安排,创作者明确授予许可并获得报酬。许可赋予创作者控制权和直接报酬,而合理使用是在特定情形下无需许可的法律抗辩。
报酬因内容类型、数量、独占性以及AI公司的盈利模式而差异很大。大型协议每年金额在500万至6000万美元不等。许可平台采用计量模型根据使用量和市场因素推荐定价。个人创作者通常按使用次数获得版税或一次性费用,具体数额取决于内容价值和协商条款。
可以,大多数许可平台和协议支持逐条标题许可决策。创作者可以选择将特定作品许可给特定公司或特定用途(训练、检索或输出生成)。这种细致的控制允许创作者根据自身商业利益和创作偏好实施选择性许可策略。
主要类型包括:仅限训练许可(仅用于模型开发)、检索增强生成(RAG)许可(用于实时内容检索并带有引用)、输出使用许可(界定内容如何在AI输出中出现)、衍生作品许可(允许AI生成摘要、翻译或改编)。每种类型有不同的限制和补偿模式。
主要许可协议包括:Reddit与Google每年6000万美元的协议、News Corp与OpenAI的合作、Getty Images在对Stability AI提起诉讼后达成的许可协议、以及美联社与OpenAI的协议。这些案例表明成熟内容所有者能够为AI公司许可作品争取到可观的报酬。
关键组成部分包括:使用范围(AI公司可以如何使用内容)、补偿模式(费用、版税或分成)、数据保留与删除条款、输出限制(内容如何在AI结果中出现)、审计权(核查合规能力)、以及赔偿条款(责任分配)。这些要素的明确定义可保护创作者和AI公司双方权益。
有,多个平台为个人创作者提供AI内容许可服务。Created by Humans允许创作者逐条设定许可条款。Calliope Networks将作者和出版商与AI平台连接。Dataset Providers Alliance倡导自由市场许可。这些平台聚合内容并代为谈判,使不直接与大型AI公司谈判的创作者也能参与许可。
欧盟AI法案要求AI公司遵守版权法,并在使用受版权保护内容前获得权利人授权。美国版权局表示,用受版权保护作品训练AI模型可能构成表面侵权。这些监管动态正将责任转向AI公司,要求其证明合理使用或获得许可,使许可逐步成为行业常态。
了解如何向 AI 公司授权内容,理解支付结构、授权权利,以及通过谈判策略最大化您的创意资产收益。
了解新闻出版商如何为AI模型提供训练数据、协商许可协议,并通过内容合作与归属标准影响AI搜索引擎。
探索AI内容权利不断演变的格局,包括版权保护、合理使用原则、许可框架以及全球监管方法,这些因素共同塑造着创作者报酬和AI发展的未来。...