Published: 2024-04-24 15:02

日経新聞、経済情報特化の大規模言語モデル「NiLM」開発

日本経済新聞社は、経済情報特化した大規模言語モデル「NIKKEI Language Model(NiLM・にるむ)」を開発した。

【この記事関する別の画像を見る】

インターネット上の公開情報は利用せず、40年分の日本経済新聞や日経産業新聞日経MJ、日経ヴェリタス、NIKKEI Prime、日経BP媒体など、日本経済新聞社グループが著作権使用権を持つ記事のみ使用し、日本の経済情報専門特化した言語モデルとなる。

4月時点では、一般公開されているモデルを起点としない独自事前学習完了最大で130億パラメーターのモデルを構築して性能検証している。

また、最大700億パラメーターのモデルをファインチューニングした大規模言語モデル(LLM)の開発完了記事要約最新ユースに関する知識など、社内独自タスクにおい性能改善確認した。また、MetaのLlama 2の700億パラメーターモデルやLlama 3の80億パラメーターモデルなどをベースにデータを追加学習させている。

現在学習に利用している記事のみでも、WikipediaやCommon Crawlなどのデータセットを用いず、日本語コーパスのトークン1億規模となり、「日本経済新聞社グループにしかできない最高品質大規模言語モデル」としている。

今回開発したモデルは、日経イノベーション・ラボによるAIプロダクト研究開発などでの利用を検討。経済に専門特化したLLMを今後様々研究開発で利用する。

# 言葉 意味
5 にっけい (日経) : Nikkei (newspaper, share index)
4 げんご (言語) : language
4 きじ (記事) : article; news story; report; account
3 にほんけいざいしんぶんしゃ (日本経済新聞社) : Nihon Keizai Shimbun (Japanese newspaper company) (company)
3 とっか (特化) : specialization; specialisation
3 だいきぼ (大規模) : large-scale
3 かいはつ (開発) : development; exploitation
3 がくしゅう (学習) : study; learning; tutorial
2 じょうほう (情報) : 1. information; news; intelligence; advices 2. information; data contained in characters, signals, code, etc.
2 かんする (関する) : to concern; to be related
2 やく (約) : 1. approximately; about 2. promise; appointment; engagement
2 にほん (日本) : Japan
2 のみ : only; nothing but
2 せんもん (専門) : speciality; specialty; subject of study; expert; area of expertise
2 どくじ (独自) : 1. original; unique; distinctive; characteristic; peculiar 2. independent; one's own; personal
2 かんりょう (完了) : 1. completion; conclusion 2. perfect (tense, form, aspect)
2 さいだい (最大) : biggest; greatest; largest; maximum
2 せいのう (性能) : ability; performance; efficiency
2 けんきゅうかいはつ (研究開発) : research and development; R&D
1 がぞう (画像) : image; picture; portrait
1 さんぎょう (産業) : 1. industry 2. livelihood; occupation
1 しんぶん (新聞) : newspaper
1 えいこくせきゆ (英国石油) : British Petroleum; BP
1 かく (各) : each; every; all
1 ばいたい (媒体) : medium; media
1 ちょさくけん (著作権) : copyright
1 しようけん (使用権) : use; right to use
1 しよう (使用) : use; application; employment; utilization; utilisation
1 じてん (時点) : point in time; occasion
1 いっぱんこうかい (一般公開) : 1. opening to the public (e.g. garden, etc.) 2. read permission: anybody
1 きてん (起点) : starting point; origin
1 じぜん (事前) : prior; beforehand; in advance; before the fact; ex ante
1 こうちく (構築) : construction; building; putting up; erecting; creation; formulation; architecture (systems, agreement, etc.)
1 けんしょう (検証) : verification; inspection
1 ようやく (要約) : summary; digest
1 さいしん (最新) : latest; newest; late-breaking (news)
1 ちしき (知識) : knowledge; information
1 しゃない (社内) : 1. within a company; in-house 2. within a shrine; shrine precincts
1 おく (奥) : inner part; inside; interior; depths (e.g. of a forest); back (of a house, drawer, etc.); bottom (e.g. of one's heart); recesses; heart
1 かいぜん (改善) : 1. betterment; improvement 2. kaizen (Japanese business philosophy of continuous improvement)
1 かくにん (確認) : confirmation; verification; validation; review; check; affirmation; identification
1 ついか (追加) : addition; supplement; appending; appendix
1 げんざい (現在) : now; current; present; present time; as of
1 もちいる (用いる) : to use; to make use of; to utilize; to utilise
1 にほんご (日本語) : Japanese (language)
1 りょう (量) : 1. quantity; amount; volume; capacity; portion (of food) 2. generosity; magnanimity; tolerance
1 きぼ (規模) : scale; scope; plan; structure
1 さいこう (最高) : 1. most; highest; maximum; uppermost; supreme 2. best; wonderful; finest
1 ひんしつ (品質) : quality (of a product or a service)
1 こんかい (今回) : this time; now
1 ぐん (群) : 1. group; bunch; crowd; throng; swarm; band 2. group
1 けんとう (検討) : consideration; examination; investigation; study; scrutiny; discussion; analysis; review
1 こんご (今後) : from now on; hereafter
1 さまざま (様々) : various; varied; diverse; all sorts of