性能の指標となる「パラメーター数」が130億と700億の2種類を開発した

日本経済新聞社は24日、経済情報に特化した生成AI(人工知能)の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。

大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」が130億と700億の2種類がある。日本経済新聞社の研究開発組織である日経イノベーション・ラボが開発した。

パラメーター数が最大130億のモデルについては一般に公開されている既存のモデルをベースとせず、日経が独自に構築した。日経グループが著作権や使用権を持つデータのみを学習させた。

具体的には日本経済新聞や電子版のほか、日経MJなどの専門紙、日経BPが発行する各媒体の約4500万本の記事を学習用のデータに使った。現在は開発したモデルの性能の検証に取り組んでいる。

パラメーター数が700億のモデルは米メタが2023年7月に公開した大規模言語モデル「Llama(ラマ)2」をベースに、「ファインチューニング(追加学習)」と呼ぶ手法を使って開発した。ラマ2は外部の企業や開発者による改良が広く認められている。

開発したモデルは最新ニュースに関する知識を備え、記事の要約などで性能を発揮することを確認した。現在はメタが4月に公開した最新版の「ラマ3」をベースに、パラメーター数が80億のモデルの学習にも着手している。

日経イノベーション・ラボは19年に言語モデルの研究を始め、著作権上の課題やAIがもっともらしく噓をつくハルシネーション(幻覚)の問題に対処する方法を探ってきた。

日経は「責任ある報道は人が担う」との方針を対外的に公表し、新聞記事の作成や編集に生成AIを用いていない。23年11月に創刊したデジタル新媒体「Minutes by NIKKEI」では記事の要約や再構成にAIの技術を活用しているが、誇張や誤解が含まれないかを編集者が確認している。

【関連記事】

  • ・AIの報道利用、日経はこう考えます
  • ・1日3分で世界がわかる「Minutes by NIKKEI」11月創刊

鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。