e.g.掲載日: 2020年1月30日16:51
最先端アルゴリズムを開発し欠損値を多く含む製造データでも品質低下などの要因を解析可能に
- 製造、
- 品質管理、研究開発/サービス開発、
- 異常検知、
- 実施企業
- 共同開発
- 技術提供
- 株式会社東芝
- 大学共同利用機関法人 情報・システム研究機構 統計数理研究所
- 目的
- 工場・プラントなど製造現場の生産性・歩留・信頼性の向上
- 概要
- 株式会社東芝と大学共同利用機関法人情報・システム研究機構統計数理研究所は、最先端の機械学習アルゴリズムを共同開発し、これまで活用の難しかった欠損値を多く含む製造データでも高速・高精度な要因解析を可能にした
- 効果
- 欠損率が高いデータでも高精度に回帰モデルを構築可能に,計算時間を短縮,推定誤差を約41%削減
- 課題/背景
- 工場などの製造現場では、製造物の品質値や加工条件、設備の温度や圧力、設備稼働などに関するデータが日々大量に蓄積されており、これらのデータは品質や歩留が悪化する要因を特定する回帰モデルを構築に役立つ。しかし、実際に収集されるデータには測定ミスや通信エラーによる欠損が多く、さらに抜き取り検査による品質確認が多いため、1割程度しかデータを収集できない場合もある。そのため、予め欠損値を計算・補完してから解析するのが一般的であるが、欠損値が多いと膨大な計算が必要となり、要因解析の高速化・高精度化は困難であった。
- 実施内容
- 株式会社東芝と大学共同利用機関法人情報・システム研究機構統計数理研究所は、製造データに多くの欠損値が含まれている場合でも、品質低下や歩留悪化などの要因を高速・高精度に特定する機械学習アルゴリズム「HMLasso (Least absolute shrinkage and selection operator with High Missing rate)」を共同開発した。この「HMLasso」は欠損率が高い場合でも高精度に回帰モデルを構築可能である。また、欠損値の補完プロセスを省略することで全体の計算時間を短縮し、多くのデータ項目から品質や歩留への影響度の高い重要な項目だけを絞り込むことも可能である。
- 結果
- 理論解析では、欠損率を活用することで誤差限界が最適になり、従来のアルゴリズムよりも優れていることを検証。数値実験では、平均欠損率50%でデータ項目によっては欠損率が90%以上となる人工データでベンチマークし、最先端のアルゴリズム「CoCoLasso」と比べて推定誤差を約41%削減することに成功。この技術を用いることで、大量の欠損を含むデータであっても、高い精度での要因解析が可能となった。
- e.g.掲載日 2020年1月30日16:51
- 事例情報はe.g 登録時点のものになります。
- 掲載内容の更新や削除についてはこちらまでご連絡ください。