「我々の生成AI戦略の方向性はオープンな『リナックス』型だ」

KDDIの高橋誠社長は3月18日、生成AI(人工知能)開発のスタートアップであるELYZA(イライザ、東京・文京)との資本業務提携を正式発表した記者会見で、このように語った。

KDDIが子会社化したイライザは、日本を代表するAI研究者である東京大学・松尾豊教授の研究室からスピンアウトして誕生したスタートアップ企業だ。早くから生成AIのコア技術である大規模言語モデル(LLM)の研究開発を進め、高い日本語性能で定評があった。主に米メタのLLM「Llama(ラマ)」シリーズの日本語版カスタマイズに注力しており、3月半ばには700億パラメーターと国内では大規模なLLMを公開して話題を集めた。KDDIグループは数十億円を投じてイライザの株式の53.4%を取得し、子会社化する。

高橋社長が生成AI戦略について基本ソフト(OS)のリナックスに例える理由は、KDDIとイライザがゼロからLLMを開発する計画がないからだ。両社は、メタのような巨大テック企業が開発する設計情報が公開されたオープンソースのLLMをベースに、日本語版としてカスタマイズして商材とすることで開発費や時間を削減する「他力戦略」を取る。LLMを最初にトレーニングする段階をスキップできるため、ゼロベースで開発するLLMと比べて「2〜4倍ほど開発が早くなる」とイライザの曽根岡侑也最高経営責任者(CEO)は強調する。

KDDIはイライザに計算基盤や営業体制などを提供して支援する。特に生成AI開発に必要な画像処理半導体(GPU)などの計算基盤の確保には多額の資金が必要で、スタートアップ企業がまかなうのは難しい。KDDIは中期的に1000億円規模の資金を生成AI開発の計算基盤に投じる計画を明らかにした。

今後はイライザの開発力を生かし、企業や業界ごとにカスタマイズされたLLMを提供する予定だ。まずはKDDIグループでコールセンター大手のアルティウスリンク(東京・新宿)とともに、コールセンター特化のLLM開発を想定する。

通信各社の生成AI戦略分かれる

オープンソースをカスタマイズする生成AI戦略を取るKDDIに対し、ライバルとなるNTTやソフトバンクは、ゼロベースでLLMをつくる戦略だ。

ソフトバンクは巨大なLLMの独自開発を進めている。パラメーター数3900億のLLM構築を目指し、将来的には1兆パラメーターまで見据える。ただし巨大なモデルを使い続けるわけではない。高性能な巨大モデルをつくってから、その出力を活用し、小さく軽量なモデルを効率よくつくる「蒸留」という手法を用い、目的にあったサイズまで最適化を進める方針だ。

NTTは小型で電力消費を抑えられる独自LLMの構築を進める。同社が開発したLLM「tsuzumi(つづみ)」の主力モデルは70億パラメーターと小さい。将来的には、小型なモデルを複数組み合わせて高性能化させる「AIコンステレーション」も視野に入れる。

LLMは現状では、米オープンAIのChat(チャット)GPTのように設計情報が非公開のクローズドモデルの方がオープンソースベースのモデルよりも高い性能を持つ傾向にある。クローズドモデルによる独自LLMは、多額の資金や時間が必要になるものの、自社でノウハウを独占できるという利点がある。

ただここに来て、オープンソースベースのLLMが徐々にクローズドモデルの性能に近づいている。

例えばフランスのAIスタートアップ企業、ミストラルAI(Mistral AI)が2023年末に公開したオープンソースベースのLLM「Mixtral 8x7B」は、複数の指標でオープンAIの「GPT-3.5」を上回った。米投資ファンドのアーク・インベストメント・マネジメントが公開しているリポートによると、24年内にはオープンソースベースのLLMが平均的なクローズドモデルのLLMの性能を上回る可能性があると指摘している。

オープンソースベースのLLMの性能向上は、独自LLMをつくらない選択をしたKDDIにとっては追い風だ。自社でつくらずとも高性能なモデルがあるのなら、それらをベースにカスタマイズの技術開発に注力する方がスピード感で有利になる。

ただし開発のスピード競争となれば、圧倒的な資金力を持つ海外の巨大テック企業に立ち向かうのは難しい。メタや米マイクロソフトなどは23年夏、わずか3カ月の間に数十億から100億米ドル規模をデータセンターなどの設備投資に費やしたという。

GPUの数も日本とは桁違いだ。メタのマーク・ザッカーバーグCEOは1月、米エヌビディアの高性能なAI用GPUを24年末までに35万基追加で配備する計画を発表した。一方の日本は、国内最大級のAI向けの計算基盤でもGPU数千基程度にとどまる。

さらなるスタートアップとの提携も

KDDIの高橋社長は「生成AIの動きは激しい。何が正解なのかはまだ見えていない」と打ち明ける。その上で「スタートアップの力とオープンソースを活用すれば、スピード感が上がる」と続け、同社の選択こそ現時点での勝ち筋に近いという認識を示す。

一方、現状明らかになっているKDDIの生成AI戦略が、言語モデルにとどまっているのは気になる点だ。イライザは基本的に言語主軸のAI開発に注力してきた。今後は画像や音声も同時に扱える「マルチモーダル」生成AIが競争の軸になると見られる。実際、NTTは既に自社の生成AI「tsuzumi」に画像認識を組み込み、図やグラフをAIに読み込ませる機能を開発。ソフトバンクもマルチモーダル化を進めているという。

KDDIの生成AI戦略は、イライザの子会社化にとどまらない様子だ。高橋社長は「いろいろと触手を伸ばしている」と話す。今後は画像や音声認識で強いスタートアップ企業との提携が発表される可能性がある。

(日経ビジネス 杉山翔吾)

[日経ビジネス電子版 2024年3月25日の記事を再構成]

日経ビジネス電子版

週刊経済誌「日経ビジネス」と「日経ビジネス電子版」の記事をスマートフォン、タブレット、パソコンでお読みいただけます。日経読者なら割引料金でご利用いただけます。

詳細・お申し込みはこちら
https://info.nikkei.com/nb/subscription-nk/

鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。