河本研究室
(時系列データ解析研究室)

ミッション:世界最先端の時系列データ分析の研究拠点を目指す

 

 

大規模な時系列データセットを対象に、新たな分析手法開発とビジネス活用に取組みます。

製造現場では、センサーや通信コストの低下に伴い、IoT(Internet of Things)という言葉の流行に象徴されるように、製造設備から出荷品まであらゆるモノの動きがデータ化されています。小売では、eコマースの発展とともに、商品検索から購買まであらゆるヒトの動きがデータ化されています。

これらデータの多くは、「時系列データ」です。時系列データは、ビジネスに大きなベネフィットをもたらします。例えば、需要予測を高精度にすることで売切れを防げます。例えば、故障の予兆を検知することで突発故障を防げます。例えば、販売量変化の要因を分析することでその対策を見出せます。

一方で、時系列データ解析は、基本的な教科書はあるものの、その応用や最新手法の追及については各企業で個別に取り組んでおり、非効率な状況です。日本企業がデータ時代も勝ち残るには、得意の現場力にデータを融合しなければならず、それには時系列データ解析力を高めなければなりません。

 

そこで、本研究室では、企業と連携して共同研究を進めるとともに、新手法の開発やサーベイを行い、我が国の時系列データ解析の研究と応用の核心的な場を目指したいと思います。

学生の方へ:卒業後も自らの実績として語れる研究テーマに挑みませんか? ※期待する能力=数学力+コーディング力+やり抜く力

企業の方へ:産学で力を併せ、我が国の「時系列データ解析力」をグローバルトップにしませんか? ※期待する協力=共同研究 or 寄付

 

ビジネスにおける時系列データの活用例

 

大規模時系列データについて解釈可能なデータ解析は難しい

IT革新により、ビジネスにおいては大規模な時系列データを蓄積できるようになりました。

 

このようなデータの分析手法は、記述統計と機械学習に大別されます。しかしながら、記述統計では大規模データを充分に解釈できませんし、機械学習では予測や異常検知はできても解釈には至りません。

 

  記述統計 ⇒ 全サンプル平均や一部サンプルの時系列パターンしか解釈できない。

 

  機械学習 ⇒ 将来予測や異常検知には使えるが、解釈は難しい。

 

 

基礎研究「モデルベース時系列クラスタリング手法の開発」

大規模時系列データを解釈する分析手法には、以下の2つが求められると考えました。

 1. 全体を似ているグループに分けて解釈できる。

 2. 分析結果から時系列変化のメカニズムを解釈できる。

そこで注目したのが、「モデルベース時系列クラスタリング」です。時系列クラスタリングとは、下図のように、時系列データを変化パターンの類似性に基づいて分類する手法です。

時系列クラスタリングには、「形状ベースアプローチ」「特徴ベースアプローチ」「モデルベースアプローチ」の3通りあります。このうち「形状」や「特徴」によるクラスタリングでは、時間変化のメカニズムは解釈できません。「モデルベース時系列クラスタリング」だからこそ、全体を類似パターンごとに分類し、さらに各グループごとに時間変化のメカニズムを解釈することができるのです。

モデルベース時系列クラスタリングを用いれば、複数の時系列データ(以下、時系列群)に対して、グループ分けやグループ毎の時系列予測を可能にするだけでなく、下記のような応用もできます。

・時系列群からの異常時系列の発見

・時系列群の合計値予測の精度向上

・長さの異なる時系列群のグループ分け

・欠損値を含む時系列群のグループ分け

・時系列群を類似系列ごとにグループ分けした変動要因分析

 

例えば、サンプル合計の将来予測をしたい場合、合計値の時系列データから予測モデルを作るよりも、モデルベース時系列クラスタリングを用いて類似サンプルごとに予測モデルを作ったものを合計する方が、予測精度は高まります。予測精度だけならば深層学習に劣後するかもしれませんが、解釈可能であることは実務面で大きなメリットです

本研究室では、モデルベース時系列クラスタリングにおいて、状態空間モデルを用いるアルゴリズムを初めて開発し、AI系のトップジャーナルに採択されました。従来は、ARモデルなどシンプルなモデルベース時系列クラスタリングにとどまっていました。本研究により状態空間モデルという表現力の高いモデルを用いてクラスタリングできるようになり、ビジネスにおける活用が期待できるようになりました。

 

発表論文:Time Series Clustering with an EM algorithm for Mixtures of Linear Gaussian State Space Models(Pattern Recognition)

 

 

応用研究①「電力需要予測に対するモデルベース時系列クラスタリングの応用

電力ビジネスでは、高精度な電力需要予測が求められる。予測方法として、1)顧客ごとの予測モデルを合計して全体需要を予測する方法と、2)全顧客合計の需要パターンから予測モデルを作る方法が考えられるが、前者はパターンにランダム性が高く予測困難であり、後者は顧客ごとの需要パターンの特徴が平準化されてしまい予測精度が上らない。

そこで、需要パターンが類似した顧客ごとにクラスタリングし、各クラスターごとに予測モデルを作り、クラスターごとに需要予測を行い、全クラスターの合計により全体需要予測をする方法を研究している。手法には、モデルベース時系列クラスタリングを用いる。既に、自己回帰モデルおよび状態空間モデルを用いたモデルベース時系列クラスタリングによる予測を行い、上述の1)および2)と比べて精度向上することを確認している。

 

コンテンツ作成中(図などの掲載許可を確認中)

応用研究②「風力発電設備に対する運転条件に依らない異常検知手法の検討」

風力発電において、一定の運転条件(例:定格運転)における異常検知が主眼とされてきた。しかし、自然風により運転条件は変わるめ、従来手法では継続的な異常検知は困難である。本研究では様々な運転条件の振動データから作成した特徴量を用いて、畳み込み層を用いた変分オートエンコーダ(VAE)による教師なし学習を行い、運転条件に依らない異常検知手法の開発を目指す。

発表論文:「風力発電設備に対する負荷条件に依存しない異常検知手法の開発を目的としたオートエンコーダベース異常検知モデルの
      提案と考察」(情報処理学会 第85回全国大会)※学生奨励賞受賞

     「風力発電設備に対する運転条件に依らない異常検知手法の検討」(2022人工知能学会全国大会)

 

応用研究③「連続晶析における粒度分布遷移過程の状態空間モデルによる分析」

晶析とは、化合物の生成方法の一種です。生成した結晶の大きさ(粒径)を制御したいのですが、製造条件の変化による影響は解明されていません。本研究においては,下図のような晶析実験装置を用いて様々な製造条件で生成し、粒径分布の時間推移をデータ化し、状態空間モデルを用いて粒度分布の遷移過程をモデル化します。要求される粒度分布に合致する製造条件の発見や,晶析メカニズム解明への手がかりとなることが期待されます。

 

 

本研究室で取組んでいるテーマ

研究室の体制(2024年4月)

教員 河本薫

客員研究員 馬谷遼平、石塚諒一

特に時系列データ解析や粉体粒径分布に関わる研究分野では、今井講師を副指導教員に迎えて、共同で指導にあたります。

 

※修了生の修士論文題目

2021年3月卒業 「連続晶析における粒度分布遷移過程の状態空間モデルによる分析」

2022年3月卒業 「ロバストな電力需要予測に向けたモデルベース時系列クラスタリングの応用」

        「連続晶析における粒度分布遷移過程の状態空間モデルによる表現」

        「金融機関口座入出金記録分析による不正口座の検知」

2023年3月卒業 「風力発電設備の増速機に対する負荷条件などに依存しない異常検知手法の提案と実データを用いた評価」

        「線形ガウス状態空間モデルに基づく時系列クラスタリングアルゴリズムの開発と電力需要予測への応用」

        「仮説検証型アプローチによる圧延銅箔めっき工程の不良原因追求」

2024年3月卒業 「粒子径分布を出力とする粉砕機の実験計画へのMulti Output Gaussian Process 回帰を用いたベイズ最適化の応用」

        「金種別の現金需要予測と現金管理オペレーションの効率化」

        「線形ガウス状態空間モデルに基づく時系列クラスタリング法と従来手法との需要予測における精度比較」

 

 

※大学院生の就職先(*は企業派遣大学院生)

2021年3月卒業 ダイキン工業

2022年3月卒業 classi[教育系AIベンチャー]、東京エレクトロン、トヨタファイナンス、国税庁*

2023年3月卒業 マイクロンメモリ、日立造船*、X金属*

2024年3月卒業 アクセンチュア、ホソカワミクロン*、グローリー*

 

※大学院生の受賞

2023年3月 石塚諒一さんが情報処理学会第85回全国大会で学生奨励賞を受賞