NYタイムズがMSやopen AIを提訴

2023年12月27日、米紙ニューヨーク・タイムズはマイクロソフトとopen AI(関連組織含む)を提訴した。その訴状の中で、マイクロソフトやopen AIは大量かつ組織的に、同社の記事を“ただ乗り(フリーライド)”し、AI(人工知能)の学習を行ったとしている。損害は数十億ドル(数千億円)に達するとも述べている。大手報道機関によるAI企業の提訴は、今回が初めてだ。

これはxの内容です。詳細はそちらでご確認いただけます。

ニューヨーク・タイムズは、多くのジャーナリストや記者を雇い、コストをかけニュースやコラムを発信している。そして購読者は、料金を負担して記事などを読んでいる。無料記事であっても、そのコストは広告主などが負担する仕組みだ。同社は、そうした「知的財産をタダ同然でAI企業が利用した」と主張する。

今回の提訴をきっかけに、AI学習のために記事やデータなどを利用する組織や企業は、相応のコストを負担すべきだとの論調になるかもしれない。今回の提訴がどう進展するか、AIを巡るルール策定の第一歩、さらにはAI時代の道標づくりとして大いに注目される。

提訴に至った経緯と訴状の詳細

ニューヨーク・タイムズは提出した訴状の冒頭で、自社のビジネスモデルについて記している。過去170年以上、その価値観を磨くために同社は政治や経済などを深く掘り下げ、見解を世界に提供し続けてきた。

当然のことながら、専門的な知見を持つ記者の獲得や育成にはコストがかかる。時にリスクを冒して特派員を送り、紛争の現場を取材することもある。そうした費用や危険性の負担は、世界の真実をより公正に伝えるために欠かせないことだ。

「マイクロソフトやオープンaiはタダ乗りしている」nyタイムズが提訴に踏み切ったワケ
Rob Tringali//Getty Images
※写真はイメージです。

訴状によると、マイクロソフトやopen AIは、ニューヨーク・タイムズが配信した数百万もの記事を“違法に利用(unlawful use)”し、ジェネラティブAIの学習を強化した。Open AIなどが用いたのは、ニュース記事、特定のトピックを深く考察したコラム、商品レビューなど多岐にわたるという。いずれも、著作権はニューヨーク・タイムズに帰属する。

違法な利用と表現した真意は、他の購読者と比較した場合、AI企業のコスト負担は著しく軽いということだろう。訴状の2ページ目には、「マイクロソフトやopen AIはニューヨーク・タイムズが行ったジャーナリズム強化のための投資の成果を、許可と相応の対価の支払いなく“ただ乗り”しようとした」との記述もある。

AI企業が、記事内容などをチャットボットの学習やサービス強化に利用しているとの主張は、それなりの説得力を持つ。ニューヨーク・タイムズはすでに23年4月、知的財産(ニュース記事やコラムなど)の利用に関する懸念を伝えていた。その時点では、友好的な解決策を目指して協議を呼びかけたという。これを受けて9月、マイクロソフトは一般的な対応指針として、著作権等に関する利害対立が起きた場合には損失や訴訟の費用を補償する考えを示していた。

「マイクロソフトやオープンaiはタダ乗りしている」nyタイムズが提訴に踏み切ったワケ
Peter Dazeley//Getty Images
※写真はイメージです。

報道機関とAI企業、双方の見解

ただ、ニューヨーク・タイムズにとってそれは十分なものではなかったから、今回の提訴に踏み切った。主たる要因として、利用に応じたコスト負担が見逃されると、報道機関としてのビジネスモデルが成り立たなくなるとの危機感は強いはずだ。

近年、ニューヨーク・タイムズは製品レビューを行うサイトの運営企業を買収するなど、読者により有益なコンテンツを提供できるよう、体制を強化してきた。利用者側は、読みたい記事や利用したいサービスによって、支払う料金が増える仕組みだ。

こうした事業運営の基本を踏まえると、膨大な記事やコラムのテキストデータを組織立ってAIに記憶、学習させる場合、利用水準に応じた料金を支払うのは当然といえるだろう。AI企業側も情報の内容、出所の正確性を担保する必要がある。訴状にある“ただ乗り”の表現は、AI企業のコスト負担が小さかったことを示したかったとみられる。

これはxの内容です。詳細はそちらでご確認いただけます。

一方、open AIの主張は異なり、「交渉は建設的に進んでおり、提訴に驚きと失望を禁じ得ない」との声明を出した。open AIは、急激な生成AI利用の増加が生み出す社会的な付加価値やメリットは、社会全体にとって非常に大きいと考えているようだ。こうした開発サイドの価値観に基づき、AI学習に新聞記事や小説などを大量に用いることは“公正”と考えているのだろう。

また、AI関連企業に出資する大手投資ファンドも、深層学習のためのテキスト、画像など著作権のあるデータの組織的かつ大量利用が難しくなれば、生成AIの普及ペースは鈍化するとの懸念を表明した。特に、学習に必要なデータの取得コストが増大すれば、経済・社会全体としての付加価値創出のスピードは鈍化し、経済運営の効率性も高まりにくくなるとの主張がある。23年4月以降の両者の交渉の中で、こうした見解の相違は、簡単には埋まらなかった。

AI企業はコスト負担すべきか、社会の要請は?

今後、社会の要請として、「AI開発を進める企業は相応のコストを負担し、必要なデータを利用すべきだ」ということになるかもしれない。AI利用の増加に伴い、学習用データの対象、範囲は急速に拡大している。学術論文、写真、絵画、音楽、文学作品、各種の入学・資格試験の問題など実に幅広い。

これはxの内容です。詳細はそちらでご確認いただけます。

23年7月には、米国の著名コメディアンが、メタ・プラットフォームズとオープンAIに損害賠償を求める裁判を起こしてもいる。ニューヨーク・タイムズの提訴と共通するのは、自らがコストをかけて生み出した作品などを無断かつ大量にAI企業に使われれば、ビジネスとして成り立たなくなるという危機感だ。

コスト負担以外にも大きな懸念がある。訴状は、オープンAIのチャットボットが、実際はニューヨーク・タイムズの報道ではないにもかかわらず、出どころをニューヨーク・タイムズと明記したケースがあったと記している。仮に、事実と異なる情報の発信を報道機関がしたとなると、その報道機関に対する社会の信頼は低下し、死活問題になる。

他にも事例がある。IT企業が配信するニュースに関してカナダ政府は、検索結果として表示するニュースの利用料を支払うよう法律を定めた。そして23年11月、グーグルはニュース利用の対価を支払うことでカナダ政府と合意した。

wooden blocks and wooden judge gavel on the table, concept of copyright or intellectual property patent protection of copyright infringement proprietary declaration legitimate innovations
Thanakorn Lappattaranan//Getty Images
※写真はイメージです。

今回のニューヨーク・タイムズの提訴をきっかけに、他の企業や個人も、同様に動き出す可能性はある。つまり、AI企業やIT企業に対して、自ら生み出したコンテンツやデータを利用する際は相応のコスト負担を求めるということだ。となると、今般の双方の主張は、今後のAI利用を取り巻く国際的なルール策定にも大きく影響するだろう。

経済・社会の変革を勢いづける文明の利器として、これからもジェネラティブAIの進化は加速するはずだ。これに伴い、学習材料としてのテキストデータなどの需要は増える。コスト負担などのルールを、早めに社会全体で作ることが望ましい。その第一歩として、今回の訴訟の動向は24年に注目すべき一大テーマに値する。

ダイヤモンドオンラインのロゴ
DIAMOND online