経済情報特化の生成AI、日経が開発　40年分の記事学習

日本経済新聞社は24日、経済情報に特化した生成AI（人工知能）の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。

大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」が130億と700億の2種類がある。日本経済新聞社の研究開発組織である日経イノベーション・ラボが開発した。

パラメーター数が最大130億のモデルについては一般に公開されている既存のモデルをベースとせず、日経が独自に構築した。日経グループが著作権や使用権を持つデータのみを学習させた。

具体的には日本経済新聞や電子版のほか、日経MJなどの専門紙、日経BPが発行する各媒体の約4500万本の記事を学習用のデータに使った。現在は開発したモデルの性能の検証に取り組んでいる。

パラメーター数が700億のモデルは米メタが2023年7月に公開した大規模言語モデル「Llama（ラマ）2」をベースに、「ファインチューニング（追加学習）」と呼ぶ手法を使って開発した。ラマ2は外部の企業や開発者による改良が広く認められている。

開発したモデルは最新ニュースに関する知識を備え、記事の要約などで性能を発揮することを確認した。現在はメタが4月に公開した最新版の「ラマ3」をベースに、パラメーター数が80億のモデルの学習にも着手している。

日経イノベーション・ラボは19年に言語モデルの研究を始め、著作権上の課題やAIがもっともらしく噓をつくハルシネーション（幻覚）の問題に対処する方法を探ってきた。

日経は「責任ある報道は人が担う」との方針を対外的に公表し、新聞記事の作成や編集に生成AIを用いていない。23年11月に創刊したデジタル新媒体「Minutes by NIKKEI」では記事の要約や再構成にAIの技術を活用しているが、誇張や誤解が含まれないかを編集者が確認している。

【関連記事】

鄭重声明：本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。

関連: