弁護士 石田 優一
目次
第1章 はじめに
第2章 ユーザー提供データ
1 ベンダーがユーザーに対して求めたいこと
2 知的財産法を踏まえた検討
3 ユーザーとどのように交渉すべきか
第3章 学習用データセット
1 ベンダーがユーザーに対して求めたいこと
2 知的財産法を踏まえた検討
3 ユーザーとどのように交渉すべきか
第4章 学習用プログラムと学習済みモデル
1 ベンダーがユーザーに対して求めたいこと
2 学習用プログラムの知的財産としての保護
3 学習済みモデルの知的財産としての保護
4 ユーザーとどのように交渉すべきか
第5章 おわりに
第1章 はじめに
AI開発プロジェクトにおいて、ユーザーとの交渉が難航しがちなのが、データや成果物の知的財産にからんだ問題です。知的財産の問題は、AIを企画する段階から、PoCの段階、AI開発契約を締結する段階に至るまで、常に意識しておかなければなりません。
今回のコラムでは、(1)ユーザーが提供したデータ(ユーザー提供データ)やそのデータを学習に適した形に加工して作成したデータセット(学習用データセット)、(2)AIの学習に利用するプログラム(学習用プログラム)、(3)学習用データセットを学習用プログラムに入力してパラメーターを調整しながら学習を完了させた学習用プログラムとパラメーターとのセット(学習済みモデル)の順に、知的財産としての保護や利用条件の問題を取り上げます。
知的財産としての保護や利用条件についてユーザーと交渉して取り決めたことは、主に、AI開発契約書の中に明記することになります。AI開発契約書については、AIの開発を受託する前に学びたい法律知識3-開発編で取り上げていますので、そちらをお読みください。
第2章 ユーザー提供データ
1 ベンダーがユーザーに対して求めたいこと
AIのプロジェクトを成功に導けるかどうかの重要なポイントは、学習に適した質と量を備えたデータを確保することです。ただ、そのようなデータを確保することは、必ずしも容易ではありません。そのため、ベンダーは、他の案件で提供を受けたデータを転用したいと思うことがあります。
また、このような課題は、AI開発に携わる多くのベンダーに共通のものです。そこで、この課題を相互に解消するために、ベンダー同士などで保有するユーザー提供データを共有したいと考えるケースがあります。
では、ユーザー提供データの転用行為や第三者提供をユーザーからの承諾を得ずに実施することは、法律的に可能なのでしょうか。また、仮にユーザーからの承諾が必要なのであれば、どのようなスタンスで交渉を行えばよいのでしょうか。
2 知的財産法を踏まえた検討
(1) 著作権法によってベンダーの汎用的な利用は制限されるか
ア ユーザー提供データは著作物か
ユーザー提供データには、写真や動画、文章などの著作物が含まれるケースがあります。また、ユーザー提供データを構成する個々の要素が著作物とはいえない場合(製造ラインのセンサーの計測結果や顧客の購入履歴といった創作的表現ではない場合)でも、ユーザー提供データがすでに構造化されている場合(ただし、構造化について独自の工夫があるような場合に限ります。)には、データベースの著作物として扱うべき場合があります。
では、ベンダーが、ある案件の(著作物と評価される)ユーザー提供データを、別の案件でも利用したいと考えた場合に、ユーザーからあらかじめ著作権を譲り受けておくか、別案件での利用について許諾を受けておかなければ、著作権法違反となってしまうのでしょうか。
イ ユーザー提供データを構成する個々の写真や動画、文章などを汎用的に利用できるか
AI開発プロジェクトにおいては、目標を達成するために必要な質と量とを備えた学習用データセットを用意することに苦労するケースが多々あります。そのため、ベンダーが、他の案件で別のユーザーから提供された個々の写真や動画、文章などの著作物を、学習用データセットの作成に転用したいと考えることは、珍しくはありません。
では、ある案件で提供を受けた個々の写真や動画、文章などの著作物を、著作権の譲渡や利用許諾を受けることなく別の案件で汎用的に利用することはできるのでしょうか。
ここで、この問題を考えるうえで重要な著作権法の規定を紹介します。
著作権法
(著作物に表現された思想又は感情の享受を目的としない利用)
第30条の4 著作物は、次に掲げる場合・・・には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
・・・(中略)・・・
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。・・・)の用に供する場合
著作権法第30条の4は、平成30年の著作権法改正で整備された条文です。この条文の第2号には、著作物を情報解析の用に供する場合には、原則として、必要と認められる限度において利用することができると定められています。ただし、著作物の種類・用途・利用態様に照らして著作権者の利益を不当に害することとなる場合は、例外的に利用が認められないことになっています。
AIの学習に利用する目的で著作物を利用する行為は、著作物を情報解析の用に供する場合に該当します。そのため、ある案件で提供を受けた個々の写真や動画、文章などの著作物を、著作権の譲渡や利用許諾を受けることなく別の案件で汎用的に利用することは、原則として著作権法第30条の4を根拠に認められると考えられます。
なお、著作物の種類・用途・利用態様に照らして著作権者の利益を不当に害することとなる場合には、例外的に利用が認められないことへの留意は必要です。もっとも、ユーザー提供データに含まれる著作物を他の案件に転用したからといって、著作権者の利益を不当に害するようなことは、ほとんど想定されないように思われます。
結論としては、ユーザー提供データを構成する個々の写真や動画、文章などをAI開発のために汎用的に利用することは、基本的に著作権法違反とはならないものと考えられます。
ただし、ユーザー・ベンダー間の合意によってユーザー提供データを他の案件に転用してはならないことを定めている場合には、そのような転用行為が著作権者の利益を不当に害すると判断される可能性が高いことに留意しなければなりません。
ウ 構造化されているデータを汎用的に利用できるか
AI開発においては、ユーザーから提供された個々の写真や動画、文章などの範囲を超えて、データベースとして構造化されたデータを汎用的に利用したいというケースがありえます。このような汎用的な利用が認められるかどうかについても、著作権法第30条の4の観点から検討することができます。
構造化されたデータをAIの学習に利用することは、著作物を情報解析の用に供する場合に該当します。ただ、このような利用が、著作物の種類・用途・利用態様に照らして著作権者の利益を不当に害することとならないかが、問題になります。
例えば、ユーザー提供データが、学習用データセットに容易に加工しうる程度に構造化されたものであった場合には、他の案件に汎用的に利用することで著作権者の利益を不当に害する可能性があります。特に、データの構造化に対してユーザーが資金や労力を費やしている場合には、ユーザーの利益を不当に害するものと評価される可能性が高くなると考えられます。
もっとも、たとえ構造化されたデータであったとしても、構造化の手法に対して人が独自の工夫を凝らした事情がなければ、そもそもデータベースの著作物ではありません。例えば、顧客の購入履歴情報を、顧客ID、顧客年齢、商品名、商品ジャンル、金額といったありきたりの項目分けによってリスト化したものは、独自の工夫を凝らしたものではありませんので、データベースの著作物とは認められないように考えられます。
また、たとえ構造化の手法に対して人が独自の工夫を凝らした事情があったとしても、ユーザーの利益を不当に害する場合とは、学習用データセットへの加工の際にその工夫を活かして作業を実施したケースや、AIの学習過程でその工夫が活かされたものと評価しえるケースに限られるものと考えられます。
結論としては、ユーザー提供データが構造化されていたとしても、著作権法第30条の4を根拠に、他の案件への汎用的に利用することが認められるケースは多いと考えられます。
ただし、ユーザー・ベンダー間の合意によってユーザー提供データを他の案件に転用してはならないことを定めている場合には、そのような転用行為が著作権者の利益を不当に害すると判断される可能性が高いことに留意しなければなりません。
エ ユーザー提供データを第三者に提供することはできるか
ベンダーは、ユーザー提供データを自社で利用するだけではなく、他のベンダーに提供したいと考えるケースがあります。ユーザーからの著作権の譲渡や利用許諾なしで、このような販売行為を適法に実施することはできるのでしょうか。
この問題も、著作権法第30条の4を適用することができるケースかどうかという観点で検討することができます。ただし、第三者への提供行為は、自社利用と比較して「著作物の種類・用途・利用態様に照らして著作権者の利益を不当に害する」場合に該当しやすいことに注意が必要です。
特に、ユーザーが資金や労力を費やしてAI学習に利用しやすいように構造化した大量のデータを、AI開発に利用させる目的で他のベンダーに提供する行為は、「著作物の種類・用途・利用態様に照らして著作権者の利益を不当に害する」可能性が高いものと考えられます。なぜなら、このようなケースにおいて仮にベンダーが提供行為をしなければ、ユーザーが自ら提供行為をしてコストを回収することができたと考えられるからです。
このように、他のベンダーにユーザー提供データを提供することについては、慎重な検討が必要です。
なお、ユーザー・ベンダー間の合意によってユーザー提供データを第三者に提供してはならないことを定めている場合には、そのような提供行為が著作権者の利益を不当に害すると判断される可能性が高くなることに留意しなければなりません。
(2) 営業秘密として保護されるか
不正競争防止法
(定義)
第2条 この法律において「不正競争」とは、次に掲げるものをいう。
・・・(中略)・・・
七 営業秘密を保有する事業者(以下「営業秘密保有者」という。)からその営業秘密を示された場合において、不正の利益を得る目的で、又はその営業秘密保有者に損害を加える目的で、その営業秘密を使用し、又は開示する行為
・・・(中略)・・・
6 この法律において「営業秘密」とは、秘密として管理されている生産方法、販売方法その他の事業活動に有用な技術上又は営業上の情報であって、公然と知られていないものをいう。
ユーザー提供データが営業秘密として提供されたものである場合、ベンダーは、不正の利益を得る目的やユーザーに損害を加える目的でユーザー提供データを使用したり、開示したりすることができなくなります。
例えば、営業秘密であるユーザー提供データをユーザーの意図に反して他の案件に転用することは、不正の利益を得る目的やユーザーに損害を加える目的でユーザー提供データを使用・開示したことに該当する可能性があります。特に、ユーザーの競合企業の案件への転用や、ユーザー・ベンダー間での合意内容に違反する転用は、不正の利益を得る目的やユーザーに損害を加える目的が認められる可能性が高いと考えられます。
ユーザー提供データは、ユーザー・ベンダー間での秘密保持契約を前提に開示されることが多く、一般に公開していない状態で管理されていることが多いため、ユーザーが営業秘密であることを明示していれば、営業秘密として不正競争防止法の保護対象になることが一般的であると考えられます。
ユーザー提供データを他の案件に転用したり、第三者に提供したりする場合には、前述した著作権法上の検討に加えて、不正の利益を得る目的やユーザーに損害を加える目的によるものであると評価されないかどうか、慎重な検討が必要になります。
3 ユーザーとどのように交渉すべきか
(1) 他のAI開発案件に汎用的に利用したい場合
もし、ユーザー提供データを他の案件にも汎用的に利用したい場合には、ユーザーに対してそのような利用を認めるように契約段階できちんと交渉して、明確に合意すべきです。なぜなら、汎用的な利用が不正競争防止法違反になる場合・ならない場合の明確な線引きは難しいからです。契約段階でこの点を曖昧にしていると、後になって、ユーザーから汎用的な利用が不正競争防止法に違反するとの主張を受けて、トラブルになってしまうおそれがあります。
ユーザーとの交渉において意識すべき点の1つが、著作権法や不正競争防止法との関係です。これまで検討したように、ユーザー提供データの利用条件についてベンダー・ユーザー間に何ら合意がない場合には、(1)ユーザーの利益を不当に害する場合(著作権法)、(2)不正の利益を得る目的やユーザーに損害を加える目的がある場合(不正競争防止法)に限り、ユーザー提供データの汎用的な利用が違法なものとなります。つまり、知的財産法の原則的な考え方によれば、ベンダーがユーザー提供データを汎用的に利用することによってもたらされる利益が正当なもので、かつ、それによってユーザーが不利益を負うのでなければ、ベンダーによるユーザー提供データの汎用的な利用を認めてよいことになります。
このような観点から、ベンダーは、ユーザーに対して、(1)ユーザー提供データの汎用的な利用によってベンダーにもたらされる利益が正当なものであり、(2)ユーザー提供データの汎用的な利用によってユーザーに不利益を与えることにはならない点を根拠に、ユーザー提供データの汎用的な利用を認める旨の合意をするように交渉することが考えられます。
ユーザー提供データをAIの学習に利用したとしても、その結果として得られる学習済みモデルからユーザー提供データの中身を推測することは困難です。そのため、多くのケースにおいて、ユーザー提供データの汎用的な利用によってユーザーが不利益を負うことはないものと考えられます。
一方で、ユーザー提供データがAIの学習にとって利用価値が高いものであれば、AIの発展という観点から、それが他の案件に汎用的に利用されることでもたらされる利益は正当なものであると考えられます。
以上の観点を踏まえて、ユーザー提供データを他の案件に汎用的に利用することができるようにユーザーに合意を求めることが、交渉スタンスとして適切であるものと考えます。
(2) ユーザー提供データを第三者に提供する場合
もし、ユーザー提供データを第三者に提供したいのであれば、ユーザーに対してそのような提供を認めるように契約段階できちんと交渉して、明確に合意すべきです。なぜなら、第三者提供が著作権法違反や不正競争防止法違反になる場合・ならない場合の明確な線引きは難しいからです。契約段階でこの点を曖昧にしていると、後になって、ユーザーから第三者提供が著作権法や不正競争防止法に違反するとの主張を受けて、トラブルになってしまうおそれがあります。
基本的には、汎用的な利用の場合と同様に、(1)ユーザー提供データの第三者提供によってベンダーにもたらされる利益が正当なものであり、(2)ユーザー提供データの第三者提供によってユーザーに不利益を与えることにはならない点を根拠の出発点とすることが理想的です。
ただ、第三者提供の場合、ユーザー提供データが一般に流通してしまうおそれがある点や、ユーザーが自らユーザー提供データを販売する機会を阻害してしまう点で、ユーザーの不利益が全く生じないと説明することにはハードルがあります。そこで、現実的には、(1)ユーザーの不利益を最小限にとどめるために第三者提供ができるケースを制限することや、(2)ユーザーの不利益を考慮して委託料を通常よりも安価に設定することなど、ユーザーが納得しない条件を提示することができるように臨機応変な工夫が必要になります。
ユーザーの不利益を最小限にとどめるための制限について、具体的には、例えば次のような方法が考えられます。
・ユーザー提供データから(ユーザーが第三者提供を避けたい情報を除いて)一部のデータを抜粋した新たなデータベースを作成して、そのデータベースに限って第三者提供を認めること
・ユーザー提供データを提供することができる第三者から競合企業などの一定の企業を除外すること
・ユーザー提供データを第三者提供する際に利用目的を限定すること
(3) まとめ
ユーザー提供データの汎用的な利用や第三者提供をユーザーに認めてもらえるように的確な交渉するためには、やみくもに交渉に応じるように主張するのではなく、知的財産法に関する考え方を踏まえて、ユーザーが納得しやすい説明を心がけることが重要です。
ユーザーと的確・円滑に交渉を進めていくためには、AI法務に対して理解のある弁護士の協力が不可欠です。ユーザーとの交渉に困った際には、すぐにそのような弁護士にサポートを求めることをおすすめいたします。
第3章 学習用データセット
1 ベンダーがユーザーに対して求めたいこと
ベンダーは、ユーザー提供データから学習用データセットを作成する際に、AIのノウハウと労力を費やすことが一般的です。そのため、ベンダーにとって、ユーザーが学習用データセットを他の案件に転用したり、第三者に提供したりすることは、好ましくありません。また、ユーザーとの契約関係を継続するために、ユーザーが自ら学習用データセットを利用して追加学習(再利用モデルの生成)をすることを制限したいケースもあります。
では、このような行為をユーザーとの合意なく制限することは、法律的に可能なのでしょうか。また、仮にユーザーからの承諾が必要なのであれば、どのようなスタンスで交渉を行えばよいのでしょうか。
2 知的財産法を踏まえた検討
(1) 著作権法によって保護されるか
学習用データセットは、ベンダーが中心となってユーザー提供データを加工して作成することが通常です。
学習用データセットを作成するステップについては、AIの開発を受託する前に学びたい法律知識2-PoC編において詳しく説明しました。学習用データセットを作成するためには、ユーザー提供データを分析してAIの学習に適した形に加工したり、AIに適したデータを選別したりすることが必要です。このような作業には、AI開発に関する専門的知見が必要になります。
著作権法
(データベースの著作物)
第12条の2 データベースでその情報の選択又は体系的な構成によつて創作性を有するものは、著作物として保護する。
2 ・・・(省略)・・・
学習用データセットが、ベンダーがユーザー提供データの選択や体系的な構成によって創作性を有するデータベースになったと評価される場合には、データベースの著作物として著作権法によって保護されます。
ユーザー提供データに含まれる個々のデータを取捨選択して学習用データセットを作成した結果、その学習用データセットに含まれるデータの項目に独自の工夫があらわれていると評価される場合は、その学習用データセットは、データベースの著作物に該当します。たとえ取捨選択の手法に独自の工夫を凝らしていたとしても、完成した学習用データセットに含まれるデータの項目に独自の工夫があらわれていると評価することができなければ、データベースの著作物には該当しません。
また、構造化されていないデータの構造化や、その他の整形といった加工作業を実施した結果、学習用データセットが体系的な構成によって創作性を有するデータベースになったものと評価される場合には、その学習用データセットは、データベースの著作物に該当します。たとえ加工作業に独自の工夫を凝らした手法が採用されていたとしても、完成した学習用データセットに含まれるデータの項目の体系に独自の工夫があらわれていると評価することができなければ、データベースの著作物には該当しません。
学習用データセットを作成するためのデータの取捨選択や加工作業は、高度な知識と相応の労力を要することが一般的です。しかし、完成した学習用データセットがデータベースの著作物に該当するケースは、限定されるものと考えられます。なぜなら、適切なプロジェクトマネジメントを実施しながら必要なデータの取捨選択や加工作業を行えば、必然的に学習用データセットに含まれる項目やその体系がありきたりのものになりがちであるためです。
また、ユーザー提供データと同様に、学習用データセットをAIの学習に利用する行為に対しては、著作権法第30条の4を根拠に著作権の行使が制限されます。そのような点でも、学習用データセットに対する著作権を根拠にユーザーや第三者による自由利用を制限することができるケースは、限定的なものであると考えられます。
ベンダーとしては、学習用データセットに対する著作権を主張することにはハードルがあることを前提に、ユーザーとの交渉方法を検討する必要があります。
(2) 限定提供データとして保護されるか
不正競争防止法
(定義)
第2条 この法律において「不正競争」とは、次に掲げるものをいう。
・・・(中略)・・・
十四 限定提供データを保有する事業者(以下「限定提供データ保有者」という。)からその限定提供データを示された場合において、不正の利益を得る目的で、又はその限定提供データ保有者に損害を加える目的で、その限定提供データを使用する行為(その限定提供データの管理に係る任務に違反して行うものに限る。)又は開示する行為
・・・(中略)・・・
7 この法律において「限定提供データ」とは、業として特定の者に提供する情報として電磁的方法(電子的方法、磁気的方法その他人の知覚によっては認識することができない方法をいう。次項において同じ。)により相当量蓄積され、及び管理されている技術上又は営業上の情報(秘密として管理されているものを除く。)をいう。
ア 学習用データセットは限定提供データか
学習用データセットは、ベンダーからユーザーに提供される際に営業秘密として扱われることは一般的ではありません。ただ、営業秘密として扱われていなくても、限定提供データとして不正競争防止法による保護を受けることがあります。
学習用データセットが限定提供データとして提供されたものである場合、ベンダーは、不正の利益を得る目的やユーザーに損害を加える目的でユーザー提供データを管理任務に違反して使用したり、開示したりすることができなくなります。
学習用データセットは、相当量の情報が蓄積されているものであり、かつ、一般に公開されているものでなければ、ほとんどのケースにおいて限定提供データに該当するものと考えられます。また、AIの学習に適する程度の十分な量の情報で構成される学習用データセットは、相当量の情報が蓄積されていると評価される可能性が高いと考えられます。これらのことから、学習用データセットは、限定提供データとして不正競争防止法による保護の対象になるケースが多いと考えられます。
イ 学習用データセットの他案件への転用について不正競争防止法違反を問える場合は
ユーザーが他の案件に学習用データセットを他案件に転用することについては、ユーザーとベンダーとの間で学習用データセットの転用を禁止する旨の合意がなければ、不正競争防止法違反に問うことは難しいものと考えられます。なぜなら、そのような合意がないにもかかわらず、ユーザーがベンダーのために学習用データセットの管理任務を負っていたとは考えにくいからです。
ウ 学習用データセットの第三者提供について不正競争防止法違反を問える場合は
一方で、ユーザーが学習用データセットを第三者に提供することについては、ユーザーとベンダーとの間で学習用データセットの第三者提供を禁止する旨の合意がなかったとしても、不正競争防止法違反を問う余地があります。なぜなら、限定提供データを第三者に開示する行為については、管理任務違反が要件とはなっていないからです。
ユーザーが学習用データセットを第三者に提供することが不正競争防止法違反となるためには、その行為が不正の利益を得る目的やベンダーに損害を加える目的によるものであったことが認められなければなりません。不正の利益を得る目的やベンダーに損害を加える目的があったことは、ベンダーが学習用データセットの作成に相応の労力やノウハウを費やしていた場合に認められやすいと考えられます。なぜなら、相応の労力やノウハウを費やして作成された学習用データセットが第三者に提供されることによって、ベンダーがその第三者から同種の案件を受注する機会を失うことになるからです。
3 ユーザーとどのように交渉すべきか
(1) ユーザーが学習用データセットを社内の他案件に転用することを制限したい場合
ユーザーが学習用データセットを社内の他案件に転用することを制限したい場合には、ユーザーに対してそのような制限を課することを契約段階できちんと交渉して、明確に合意しなければなりません。ここまで説明したことを踏まえれば、そのような合意がない限り、ユーザーによる転用行為が違法であることを主張するのは難しいものと思われます。
知的財産法の考え方を踏まえると、ユーザーが学習用データセットを他案件に転用することは基本的に自由に認められるべきで、むやみにユーザーによる転用行為を制限しようとすると、ユーザーからの反感につながってしまいます。ユーザーによる転用行為を制限する必要があるならば、その理由をユーザーが受け入れやすいように説明して、理解を求めることが必要です。
あまりユーザーによる転用行為を制限する方向性に固執すると、ユーザーの不満につながってしまいます。ベンダーとしては、特に必要性がない限り、ユーザーによる転用行為については自由に認める方向性を検討することが、ユーザーとの信頼関係の維持の観点から望ましい対応であると考えます。
ただ、ユーザーによる転用行為がベンダーにもたらすデメリットとして、ユーザーが学習用データセットを利用してそのベンダーに依頼せずに他の案件を進めるケースが想定されます。仮に、学習用データセットの作成に当たってベンダー独自のノウハウが用いられていれば、ユーザーによる転用行為は、ベンダーにとって痛手となります。なぜなら、そのベンダーにとっては、ユーザーから新たな案件を受注する機会を失うことになるからです。
このように、学習用データセットの作成に当たってベンダー独自のノウハウが用いられているケースにおいては、ベンダーは、ユーザーによる転用行為を制限する必要性があることを説明して、ユーザーの理解を求める必要があります。ユーザーがベンダーの提示条件を受け入れやすいように、ユーザーによる転用行為を制限する場合と制限しない場合とで、委託料の額に格差を設けることも考えられます。
(2) ユーザーが学習用データセットを第三者に提供することを制限したい場合
ユーザーが学習用データセットを第三者に提供する行為は、ベンダーがその第三者に学習用データセットを提供する機会を失わせる点で、単なる社内での転用行為と比べてベンダーへの不利益が大きいものです。特に、ベンダーは、学習用データセットの作成に相応の労力やノウハウを費やしていた場合には、ユーザーが学習用データセットを第三者に提供する行為を制限したいと考えます。
ベンダーは、ユーザーが学習用データセットを第三者に提供する行為を制限したいのであれば、ユーザーと契約段階できちんと交渉して、その点を明確に合意すべきです。なぜなら、第三者提供が不正競争防止法違反になる場合・ならない場合の明確な線引きは難しいからです。
ユーザーとの交渉において意識すべき点の1つが、不正競争防止法との関係です。これまで検討したように、学習用データセットの第三者提供については、ユーザーに不正の利益を得る目的やベンダーに損害を加える目的があったことが認められれば、多くのケースにおいて不正競争防止法違反を問うことができると考えられます。ベンダーが学習用データセットの作成に相応の労力やノウハウを費やしていた場合には、不正の利益を得る目的やベンダーに損害を加える目的が認められやすいと考えられます。
このような観点から、ベンダーは、ユーザーに対して、学習用データセットの作成に相応の労力やノウハウを費やしたことを説明したうえで、学習用データセットの第三者提供を制限する旨の合意をするように交渉することが考えられます。
(3) 学習用データセットによるユーザーの追加学習を認めるか
以上のほか、ユーザーが学習用データセットを利用して追加学習をすることを認めるかどうかという問題があります。
ユーザーに自由な追加学習を認めることは、ベンダーにとってはユーザーから追加学習の委託を受ける機会を失う問題があります。ただ、多くのAIは、実際に運用しながら精度を調整していくことが一般的であり、ベンダーの承諾なく追加学習を一切できないという条件は、ユーザーにベンダーとの関係維持を事実上強いる結果になりえます。
あまりユーザーによる追加学習を制限する方向性に固執すると、ユーザーの不満につながってしまいます。ベンダーとしては、特に必要性がない限り、学習用データセットを利用したユーザーの追加学習については自由に認める方向性を検討することが、ユーザーとの信頼関係の維持の観点から望ましい対応であると考えます。
もっとも、ベンダーとしては、ユーザーによる追加学習を自由に認めるのであれば、それを考慮した委託料を設定せざるをえません。ただ、ユーザーからは、「追加学習を自由にできない条件でもよいので委託料を減額してほしい」というニーズがありえます。その点は、ユーザーの意向を踏まえながら適切な調整を図っていくことが望ましい対応です。
(4) まとめ
学習用データセットのユーザーによる転用や第三者提供を制限する方向で的確な交渉するためには、やみくもに交渉に応じるように主張するのではなく、知的財産法に関する考え方を踏まえて、ユーザーが納得しやすい説明を心がけることが重要です。
ユーザーと的確・円滑に交渉を進めていくためには、AI法務に対して理解のある弁護士の協力が不可欠です。ユーザーとの交渉に困った際には、すぐにそのような弁護士にサポートを求めることをおすすめいたします。
(5) 補足-ベンダー側が汎用的に利用したり第三者に提供したりしたい場合
学習用データセットをベンダーが汎用的に利用したり第三者に提供したりしたい場合の交渉については、第2章で取り上げたユーザー提供データの考え方を活かすことができます。
なお、学習用データセットの場合は、ユーザー提供データとは異なり、ベンダーが労力やノウハウを費やして作成されたものであることが一般的です。交渉においては、この点をユーザーに説明して、ベンダーに汎用的な利用や第三者提供を認める方向性への理解を求めることが考えられます。
第4章 学習用プログラムと学習済みモデル
1 ベンダーがユーザーに対して求めたいこと
学習用プログラムや学習済みモデルには、ベンダーの労力やノウハウが費やされて完成することが一般的です。そのため、多くのベンダーは、学習用プログラムや学習済みモデルについて、知的財産権の帰属を主張したり、ベンダー側に有利な利用条件を提示したりしたいと考えます。
利用条件について、ユーザー側には、できる限り、学習用プログラムや学習済みモデルの他案件への転用や第三者提供を認めたくないと考えることが一般的です。一方で、ベンダー側の利用条件については、できる限り制約をなくしたいと考えることが一般的です。
それでは、学習用プログラムや学習済みモデルに関する知的財産法の考え方を検討したうえで、ユーザーとの有利な交渉を進めるためにどのようなスタンスで臨めばよいかについて考えたいと思います。
2 学習用プログラムの知的財産としての保護
(1) 著作権法による保護
著作権法
(著作物の例示)
第10条 この法律にいう著作物を例示すると、おおむね次のとおりである。
・・・(中略)・・・
九 プログラムの著作物
・・・(中略)・・・
3 第1項第9号に掲げる著作物に対するこの法律による保護は、その著作物を作成するために用いるプログラム言語、規約及び解法に及ばない。この場合において、これらの用語の意義は、次の各号に定めるところによる。
一 プログラム言語 プログラムを表現する手段としての文字その他の記号及びその体系をいう。
二 規約 特定のプログラムにおける前号のプログラム言語の用法についての特別の約束をいう。
三 解法 プログラムにおける電子計算機に対する指令の組合せの方法をいう。
一般に、プログラムの場合、意図するとおりの挙動をさせるために合理的な記述をすると、記述内容が似通ったものになりがちです。だれしも似通ったものになるような記述自体は、創作的表現とはいえないことから、著作物とは認められません。また、プログラムが著作物として著作権法によって保護される範囲からは、プログラム言語、プロトコル(規約)、アルゴリズム(解法)が除外されています。つまり、プログラムが著作物として保護される範囲は、だれしも似通ったものになるような記述や、プログラム言語、プロトコル、アルゴリズム以外の部分です。
AIの場合、学習済みモデルを生成するための中核的なプログラム部分は、記述内容が似通ったものになるか、あるいはアルゴリズムなどに該当することから、多くのケースで著作権法の保護が及ばないものと考えられます。もっとも、このような中核的なプログラム部分は、実務的にはTensorFlowやPyTorchといった一般的なライブラリを利用して端的に記述することが多いため、著作権法によって保護されないことでベンダーに与える影響はあまり大きくはありません。
一方で、AIの学習や利用のために必要な設定をするユーザーインターフェースやデータベースとの連携などの機能にかかわるプログラム部分は、実務的に利用しうる程度に複雑なシステムであれば個性があらわれることが一般的ですので、多くの場合、著作権法によって保護されるものと考えられます。
以上のとおり、学習用プログラムは、学習済みモデルを生成するための中核的な部分については著作権法の保護対象から除外されるものの、その大部分がベンダーの著作物として著作権法の保護を受けられるものと考えられます。
(2) 特許法による保護
学習用プログラムについては、著作権法による保護が及ばない部分を含めて、物の発明又は方法の発明として特許法による保護を受けられる可能性があります。特許法による保護の対象とされるためには、(1)公然に知られたり実施されたりした発明ではないこと(新規性)に加えて、(2)その発明の属する技術の分野における通常の知識を有する者が新規性のない発明に基づいて容易に発明をすることができたものではないこと(進歩性)が必要です。
例えば、これまでになかった高精度のニューラルネットワークの構造を発案したとしても、すでに存在する発想を単純に組み合わせただけであったり、AIの専門的な知識があれば既存の技術の置き換えによって容易に思いつくような発案であったりした場合には、進歩性は認められません。一方で、このようなレベルを超えた斬新な発案であれば、進歩性が認められ、特許の対象となりえます。
特許法による保護については、そもそも特許として認められるために高いハードルがありますが、ベンダーとしては、特許の対象となりそうな発案については、積極的に特許出願を検討すべきです。
3 学習済みモデルの知的財産としての保護
(1) 著作権法による保護
学習済みモデルは、学習用プログラムとパラメーターが一体となったものです。このうち、学習用プログラムの部分については、大部分がベンダーの著作物として著作権法による保護を受けられることを説明しました。では、パラメーターの部分については、著作権法による保護の対象となりうるのでしょうか。
結論としては、パラメーターが著作物として著作権法によって保護されるかどうかについては争いがあります。この問題は、そもそも著作物とは何かに立ち返って考える必要があります。
著作権法
(定義)
第2条 この法律において、次の各号に掲げる用語の意義は、当該各号に定めるところによる。
一 著作物 思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するものをいう。
ア 思想又は感情を表現したものか
パラメーターは、学習用データセットをもとに学習用プログラムによる学習を実施して、出力の精度が向上するように自動的に調整されることで得られるものです。パラメーターを決めるのはあくまでも学習用プログラムであって、人ではありません。この点を重視すると、パラメーターは思想又は感情を表現したものではないという発想につながります。
一方、パラメーターを決定するプロセスにおいては、アルゴリズムや学習手法の選択に人の意思が介在され、その選択いかんが、決定されるパラメーターに大いに影響を与えます。写真は、撮影対象やアングルなどを決定するのが撮影者であることを理由に著作物性が認められますが、それとパラレルに考えると、パラメーターは思想又は感情を表現したものであるという発想につながります。ただし、パラメーターの場合は、設定者が意図したとおりの結果になるかどうかを予想することができない点で、写真とは異なっています。そのため、本当に写真とパラレルな問題と考えてよいのかという問題があります。
イ 創作的に表現したものか
仮に、パラメーターが思想又は感情を表現したものであるとしても、さらに、その表現が創作的なものでなければなりません。創作的なものであるかどうかは、アルゴリズムや学習手法の選択がありふれたものではないか、選択の幅があったかといった観点から判断されます。AIの専門的知見に基づいて合理的な判断をすると、アルゴリズムや学習手法の選択の幅は必然的に小さくなってしまうことから、創作的に表現したものであると認められるには一定のハードルがあるものと考えられます。
ウ パラメーターの著作物性が否定される場合
以上のとおり、パラメーターが著作物であることが認められるにはハードルがあります。仮に、パラメーターの著作物性が否定された場合、一般に、学習済みモデルには、著作権法による保護が及ぶ部分と及ばない部分とが生じることになります。
学習済みモデルは、AIの推論にかかわる中核的なプログラム部分と、パラメーターの部分、ユーザーインターフェースやデータベースとの連携などの機能にかかわるプログラム部分によって構成されると理解することができます。そのうち、AIの推論にかかわる中核的なプログラム部分は、学習済みモデルを生成するための中核的なプログラム部分と共通しています。
そうすると、学習済みモデルの根幹部分(AIの推論にかかわる中核的なプログラム部分とパラメーターの部分)には少なくとも著作権法による保護が及ばないことになります。つまり、第三者が学習済みモデルの根幹部分を模倣したAIを作成したり利用したりすることを、著作権法によって阻止することはできません。
ベンダーは、学習済みモデルの根幹部分には著作権法による保護が及ばない可能性があることを前提に、ユーザーとの交渉方法を検討する必要があります。
(2) 特許法による保護
学習済みモデルについても、学習用プログラムの部分について特許の対象となりうることは、すでに説明したとおりです。また、パラメーターの部分についても、ニューラルネットワークの構造の一部として特許の対象と認められる余地があります。
特許法による保護については、そもそも特許として認められるために高いハードルがありますが、ベンダーとしては、特許の対象となりそうな発案については、積極的に特許出願を検討すべきです。
4 ユーザーとどのように交渉すべきか
(1) 著作権や特許権の権利帰属
ここまで説明したとおり、学習用プログラムや学習済みモデルが著作権法による保護を受けられる理由は、プログラムの記述やアルゴリズム・学習手法の選択に人の意思が介在し、個性があらわれていることにあります。また、学習用プログラムや学習済みモデルが特許法による保護を受けられる理由は、これまでになかった斬新なニューラルネットワークの構造やアルゴリズムなどを発案したことにあります。
プログラムの記述やアルゴリズム・学習手法の選択、ニューラルネットワークの構造やアルゴリズムなどの発案は、ベンダーが担うことが通常です。ですから、これらに特にユーザーが介在していたのでない限り、ベンダーとしては、学習用プログラムや学習済みモデルの著作権・特許権はベンダーのみに帰属することを主張することが適切であると考えます。
そのうえで、ユーザーの意向を踏まえて、ユーザーとの間で学習用プログラムや学習済みモデルへの適切な利用条件を合意しておくことが、望ましい対応です。
また、すでに説明したとおり、学習用プログラムや学習済みモデルのうち、AIの学習・推論にかかわる中核的なプログラムの部分やパラメーターの部分には、著作権法の保護が及ばないことが通常です。そのため、ベンダーは、ユーザーが学習用プログラムや学習済みモデルを第三者に提供することを、著作権を根拠に防ぐことはできません。ですから、学習用プログラムや学習済みモデルの第三者提供を認めるかどうかについては、ユーザーと明確に合意しておくことが必要です。
(2) ユーザーについての学習用プログラムや学習済みモデルの利用条件
学習用プログラムや学習済みモデルの利用条件については、基本的には、ユーザーに対して学習用データセットの汎用的な利用をどこまで認めるかとパラレルに考えられます。なぜなら、学習用データセットの追加学習や汎用的な利用をユーザーが求めているのであれば、ユーザーにとって学習用プログラムや学習済みモデルを利用したいニーズも生じやすく、一方で、学習用データセットの追加学習や汎用的な利用をユーザーが求めていないのであれば、ユーザーにとって学習用プログラムや学習済みモデルを利用したいニーズも生じにくいからです。
ただ、実際に利用条件を交渉する際には、個別のケースに応じた詳細な検討が必要です。
例えば、ユーザーに対して追加学習のみを認めるのであれば、それ以外の目的では学習用プログラムや学習済みモデルの利用を認めない旨を条件に含めることが考えられます。
(3) ユーザーについての学習用プログラムや学習済みモデルの第三者提供
ユーザーが学習用プログラムや学習済みモデルを第三者に提供することについては、基本的には認めない方向で交渉することが望ましい対応です。なぜなら、著作権法や特許法の考え方を踏まえると、学習用プログラムや学習済みモデルは、一般的に、主にベンダーの貢献によって知的財産としての価値が生じていると考えられるからです。
ただし、ベンダーが提供する学習用プログラムが一般的な水準のものである一方、学習済みモデルの生成に利用したユーザー提供データに希少価値がある場合には、少なくとも学習済みモデルについては、主にユーザーの貢献によって知的財産としての価値が生じているものと考えられます。そこで、このようなケースにおいては、学習済みモデルに限って第三者提供を認め、その代わりに第三者提供先にリバースエンジニアリングを禁止することを必須とするような条件提示が考えられます。
(4) ベンダーについての学習済みモデルの利用条件や第三者提供
学習済みモデルの知的財産としての価値は、主にベンダーの貢献によって生じていると考えられることが一般的です。まずは、このようなことを根拠に、ユーザーに対して、ベンダーによる学習済みモデルの汎用的な利用や第三者提供を認める方向で交渉することが望ましい対応です。
ただ、ベンダーが提供する学習用プログラムが一般的な水準のものである一方、学習済みモデルの生成に利用したユーザー提供データに希少価値がある場合には、少なくとも学習済みモデルについては、主にユーザーの貢献によって知的財産としての価値が生じているものと考えられます。そこで、このようなケースにおいては、ユーザーの意向を踏まえた譲歩を意識しつつ、ベンダーの意向をできる限り実現しうる方向性で交渉することが必要です。
(5) まとめ
学習用プログラムや学習済みモデルの権利帰属や利用条件をめぐる交渉においては、知的財産法に関する考え方を踏まえて、ユーザーが納得しやすい説明を心がけることが重要です。
ユーザーと的確・円滑に交渉を進めていくためには、AI法務に対して理解のある弁護士の協力が不可欠です。ユーザーとの交渉に困った際には、すぐにそのような弁護士にサポートを求めることをおすすめいたします。
第5章 おわりに
今回のコラムでは、AI開発プロジェクトにおいてユーザーとの交渉に難航しがちな知的財産の問題について、独自の切り口から考察しました。もっとも、実際の交渉においては、ユーザー・ベンダーそれぞれの意向を踏まえた臨機応変な対応が求められます。
そこで、AI開発プロジェクトを進める際には、ユーザーとの交渉に困ったときに気軽に相談することができる弁護士を見つけておくことをおすすめいたします。AI法務については、まだまだ取り扱っている弁護士数が少ないのが実情です。Web Lawyersでは、AI法務にも積極的に取り組み、全国のベンダー様をオンラインでサポートするサービスを展開しております。詳しくは、AI・ビッグデータの法務のサービス案内ページをご覧ください。