製造業で活躍するデータサイエンティストのスキルとは
(画像=Zapp2Photo/shutterstock.com)

データの活用や分析スキルを生かし、ビジネスの優位性を獲得するプロフェッショナル「データサイエンティスト」に注目が集まっています。さまざまな業界でデータサイエンティストの人材が求められており、製造業でもその需要は高まっています。

デジタルトランスフォーメーション(DX)を産官学が進める中で、製造業におけるデータサイエンティストは、どのようなスキルを持っているべきなのでしょうか。その役割、職務、活躍事例について紹介し、製造業のデータサイエンティストへの道や将来について考えます。

目次

  1. データサイエンティストとは
  2. 製造業におけるデータサイエンティストの役割
  3. データサイエンティストの職務
  4. データサイエンティストが使うツール
  5. 製造業におけるデータ活用・データサイエンティスト活躍事例
  6. データサイエンティストになるには
  7. データサイエンティストの将来

データサイエンティストとは

データサイエンティストとは、「データサイエンス」の手法を用いて、データからビジネス上の課題を解決する手法を編み出す人材のことです。データサイエンスとは、統計やアルゴリズムなど情報科学の力を活用してデータを分析し、役立つ知見を導き出す手法です。

データサイエンティスト

データサイエンティストはこれから急速に需要が高まり、人材が不足していくと考えられており、政府もその育成につとめているところです。2022年12月21日にIPA(独立行政法人情報処理推進機構)より発表された「デジタルスキル標準」における「DX推進スキル標準」でも、ソフトウエアエンジニアやサイバーセキュリティ―と並んで重要な人材類型の1つとして位置づけられています。

▽DX推進スキル標準

いわゆる「サイエンス」は世の中にあるさまざまな現象の中に法則を見いだし、これを公式にする、すなわち「モデル」を作成します。理科の時間に、「#### #### の法則」などというものを習ったことがあると思いますが、人間の研究者がその専門分野について長年の研究をし、ようやく導き出すものです。

データサイエンスでは、すでにあるデータを元に統計や機械学習を用いてモデルを作成します。人間では処理不可能なほど大量のデータを処理することによって、得られる答えの精度は著しく向上します。これまで人間の力では不可能だったデータに基づいたモデルを得られるのです。

現代の製造業ではIoT(Internet of Things)の技術的な発展と普及によって、おびただしい数のデータが蓄積されています。それらの蓄積されたデータをデータサイエンティストの手によって整理、分析することで、製造業におけるさまざまな課題を解決できるようになってきました。

例えば、製造用機械の稼働状況や温度、音、振動などのデータから、それが故障する時期を予測するなど、職人の勘にたよっていたようなことを、データから導き出せるようになります。

ただ単にデータを分析してその結果を提示するだけなら、職人の勘にとって代わることはありません。テクノロジーの発展によって大量に取得できるようになったデータから、従来得られなかったような新たな知見を導き出し、経験則をも打ち破って、新しい道を切り開くことが期待されているのです。

製造業におけるデータサイエンティストの役割

製造業におけるデータサイエンティストの役割には大きく分けて2つあります。1つは「課題解決」、もう1つは「新たな価値創造」です。

製造業の課題解決にはいろいろなケースが考えられます。品質分析、故障検知、製造に必要な条件の最適化、時間短縮、従業員の働き方改革にいたるまで、次から次へと発生しその種は尽きません。これら課題を解決するには、製造現場の担当者の知見や経験はもちろんのこと、データサイエンティストがそこで生成して蓄積されるデータを分析する必要があります。

一方で新たな価値創造とは、課題解決を目的とするデータ活用によって生まれてくる副次的な効果です。おびただしい量と種類のデータを分析可能な形に取捨選択、並べ替えて、そこから法則を発見できるように仕向けるのがデータサイエンティストの役割でもあります。製造現場のデータから新しいモデルを生成できれば、これまで不可能と思われていたことが可能となり、関係者を大いに驚かせることになります。

無料eBook

  • 製造業DXの教科書
    図版と事例でわかる|製造業DXの教科書

    世界市場での競争の激化や労働人口の減少などが進む今、日本の製造業においてDX(デジタル・トランスフォーメーション)の推進は不可欠です。 このeBookでは、製造業のDXの全体像について詳しく解説します。 DXに必要な技術を製造プロセスごとに紹介するほか、具体的な活用事例、製造業DXの今後の展望まで幅広く理解できる内容になっています。


データサイエンティストの職務

データサイエンティストの職務は、具体的に以下の通りです。

データ分析基盤の構築と運用

製造業では多くのシステムが稼働していますが、これらのシステムから生成されるデータやログを収集し、適切な形に編集・保管する環境を整備していく作業があります。

分析の対象になるデータにはさまざまな種類があります。きれいに整った数値データもあれば、ログのような端的なテキストデータ、非定型の音声や画像も必要かもしれません。これらを分析しやすいように収集するバッチを作って運用します。収集するだけではなく後で扱いやすく統一した形式にそろえるなどの工夫が必要になります。

データが収集できるようになったら蓄積するための環境を作ります。目的やデータの量、種類に合ったデータベース環境を選択して構築しますが、データベースの機能や特徴、使い勝手などをよく考慮する必要があります。

データベースができたら、次は取り出す環境を作ります。BI(Business Intelligence)ツールなどを整備し、スムーズにデータを取り出せる環境を構築します。データベースにかかる負荷を考慮してツールを選択したり、一度に高い負荷がかからないようにしたりする設計も重要になります。操作環境の出来は、次に紹介する分析環境に大きく影響します。

データ分析とレポーティング

蓄積されたデータを取り出せるところまで作成したら、次はそれを“見やすく”提供します。データ分析は、課題解決と価値創造のための経営上の意思決定を行うのに必要なデータを提供するのが目的なので可視化する、あるいは「見える化」すると言ったりします。

例えば、「製品の不良率を低減させたいもしくは歩留まりを改善したい」という要望がある場合、まずは機械の稼働データから、どの工程で、どんな条件で、どれだけ不良が発生しているのかについて分析します。

気温など季節的な問題だとしたら、最適な加工条件を導き出す必要があります。機械の調整や故障率の問題が明らかになる場合もありますし、画像判定など新しい仕組みを入れることが想定される場合もあります。

データサイエンティストは、データ分析の後、このような原因と対策が見えるようにレポーティングします。

レポーティングする際は、注視していかなければならない経営上の判断に重要となる数字「KPI(Key performance indicator)」を見やすく提供します。KPIとしてどの数字を可視化し、意思決定者に見せるのかは非常に重要です。

データサイエンティスト

データサイエンティストが使うツール

ここからは、データサイエンティストたちは、どのようなツールを使って作業を行っているのか紹介しましょう。

データ管理

データ管理はデータベースで行います。これまでのITエンジニアたちにもおなじみのデータベースを使うことが多いでしょう。Oracle、SQL Server、MySQL、PostgreSQL、Apache Hadoopなどが挙げられます。データ操作環境をどのように作りこんでいくかによって扱いやすさが異なるので、ベンダーのサービスや設計時の思想によって選択されるでしょう。

データ分析

データ分析は、Pythonに代表されるプログラミング言語、機械学習モデルを構築する際に使用するオープンソース機械学習ライブラリのscikit-learnや、ディープラーニングのフレームワーク、TensorFlow/Keras、PyTorchを使います。

これらは、言語を用いてプログラミングする手法の1つですが、コードを記述せずにGUI環境でデータ分析を行うためのツールもあります。SAS、SPSS、MATLABなどが該当します。

アプリケーション開発

JavaScript、PHP、Visual Basic(Visual Basic .NET)、C#、HTML/CSS、などなじみのあるプログラミング言語で作成します。アプリケーションはデータ分析の結果を見る人(意思決定者)が扱う場合も多いので、できるだけわかりやすく作る必要があります。言語によって特性もあるので適切に選ぶことが必要になります。

製造業におけるデータ活用・データサイエンティスト活躍事例

では、データサイエンティストは製造業でどのように活躍しているのでしょうか。いくつか事例を紹介しましょう。

Intel(アメリカ)

プロセッサーの大手、Intel(以下、インテル)は、早くからそのプロセッサーの製造にデータサイエンティストによってビッグデータを活用することを実行しています。インテルも製造業ですので、製造するすべてのチップについてテストを行わなければなりませんが、そのテストの項目は1万9,000にも及ぶといいます。

まず、本当にそんな数のテストが必要なのかという見直しをするために、製造上のデータを分析し、製品の品質を保証するために、最低限必要なテストの数を絞ることに成功しました。この結果製造コストは大幅に削減されたといいます。

インテルでは今後もビッグデータを活用し、同様の効果が期待できる項目を探して実行することで、新たに30億円のコスト削減ができると見込んでいるとのことです。

サムスン電子(韓国)

サムスン電子では、製造ライン各所に設置されたセンサーから集まるデータをもとに品質低下の原因となる箇所の不具合をいち早く特定しています。故障する可能性が高いのであればその箇所を事前に修理するなどの措置をとって、稼働率を高めています。

サムスン電子では自社で開発したこの製造業向けビッグデータソリューションを他社向けにも販売しています。

ファーストリテイリング(日本)

衣料品ブランド「ユニクロ」を展開するファーストリテイリングでも、データサイエンティストによる製造プロセスの改善に取り組んでいます。アパレルメーカーの場合、流行や好みの変化をリードする上で、何をどれだけ作ればいいか決める判断はなかなか難しいものがあります。

顧客の声などのリサーチがベースになるのですが、企画してから生地を調達するなど、それらがまとまるのを待っていては製造開始に間に合いません。そこで、ビッグデータを活用して予測を行うことにしました。ここから出てくるデータに基づいて、ユニクロのサプライチェーンが自発的にアクションを起こせるようにし、商品開発工程を並行して進められるように構築をしています。

ホンダ(日本)

ホンダはIBMと協働してデータ活用による製造プロセス改善を行っています。電気自動車のバッテリーの性能は、いまだ発展途上であり継続的な品質改善が必要な状態です。この品質改善に、ビッグデータが活用されています。バッテリーにセンサーを搭載し、それから送信されるデータを収集しています。

あらゆる環境下での使用状況と、その時のパフォーマンスのデータを集めてバッテリーの性能向上を目指します。

富士フイルムビジネスイノベーション(日本)

富士フイルムビジネスイノベーション(旧富士ゼロックス)は、オフィス用の複合機製造が中心事業です。コピー機のメンテナンスは従来、ユーザーからの電話を受けて作業員が派遣されるという仕組みでした。

ユーザーは機械に詳しくないため、「コピーできない」「印刷がおかしい」などの言葉で修理を依頼してきます。これだけではどの部位が不具合を起こしているのか判別できません。そこで、機器のデータを送信できる複合機を開発しました。これによりサービス担当者はあらかじめどの部位が不具合を起こしているのかを知れるようになり、サービス提供時間の短縮につながったのです。

また、発生した故障のデータが集まることによって製造工程や製品の改善に役立てられるため、性能向上のスピードも上がっていくことでしょう。

データサイエンティストになるには

紹介してきたように、製造業のデータサイエンティストはDXを推進していくうえで中心的な役割を担っており、その需要は高まっています。データサイエンティストを目指すビジネスマンや、学生も多くなってきていることでしょう。

では、データサイエンティストになるにはどのようなことを学習し、どのようなことを経験していけばよいのでしょうか。ここに考えられる道筋の一例を紹介しましょう。

一般社団法人データサイエンティスト協会によると、データサイエンティストには次の3つのスキルが必要であるといわれています。

・ビジネス力
・データサイエンス力
・データエンジニアリング力

この3つのスキルを、短期間で同時に身につけることは簡単なことではありません。また、データサイエンティスト自体の認知度が低く、十分に育成体制や学習カリキュラムが整備されているとは言えません。しかし、わずかではありますが該当のコースを設けている大学もあります。

国公立大学では、滋賀大学と横浜市立大学の「データサイエンス学部」、東京大学の「数理・データサイエンス教育プログラム」があります。

一方で、前述の通りデータサイエンティストには、ビジネス力すなわち製造業などその業界に関する知見が必要となります。全くの未経験者が、すぐに就業するという状況は考えにくいでしょう。

IT関係のエンジニア職として経験があるのであれば、データベースを扱うなどして、データ処理について実務経験が生きてくるはずです。後は業界の知識は仕事をしながら覚えていくのがよいでしょう。

ただし、仕事をしながらビジネス全般の知識、統計学などのサイエンスなどを補強し、「データサイエンス力」を身に着けるための学習は必要です。データ分析基盤の構築やツールを使った統計解析なども手掛ける機会をつくり、「データエンジニアリング力」がつけられればなおよいでしょう。

このように、データサイエンティストには、多岐にわたる知見が必要になります。身近に触れられる機会があれば積極的に体験しながら、一方では基礎的な知識も勉強していくことが近道といえるでしょう。

データサイエンティストの将来

今後も一定の割合で需要が伸びていくと予想されているデータサイエンティストですが、最近のAIの登場により、将来的な需要に懐疑的な声も聞こえてきています。

例えば、「AutoML」と呼ばれる機械学習を自動化するツールがすでに登場しており、ユーザーは機械学習の仕組みに精通しなくてもAIを利用できるようになってきているからです。

しかし、ツールがあるからといってデータサイエンティストと同じような働きができるわけではありませんし、データサイエンティストに必要なスキルは間違いなくビジネスや研究開発の世界で必要なスキルであり、不要になることは考えにくいでしょう。

機械学習の自動化ツールの登場によって、データサイエンティストは以下の2つの方向に2極分化していくのではないかと予想する向きもあります。

・ビジネスに特化したデータサイエンティスト
・エンジニアに特化したデータサイエンティスト

データサイエンティストは統計学や機械学習理論の知識を携えていますが、ビジネス分野に特化したデータサイエンティストではそれに重きを置かず、ビジネスコンサルタント的な役割を担うこととなるでしょう。

逆に、エンジニアリングに特化したデータサイエンティストは統計学や機械学習理論に重きを置き、長期的目線でデータ活用をすることにより、世の中を変えてしまうような発見や発明を担うようになるでしょう。

この理論特化型のデータサイエンティストは、研究所などに属しておりアメリカの企業などでは提携して各分野で画期的な研究開発を進めることが行われていますが、日本ではまだ事例がないようです。

データサイエンティストはデータを用いてビジネスに付加価値をもたらす人としてこれからも重宝され、将来は明るいといえそうです。ビジネスに特化するかエンジニアに特化するか方向性を決めて進んでいくとよいでしょう。

【こんな記事も読まれています】
国内製造業の再生を狙うINDUSTRIAL-Xが推進する[ESG×DX]時代の戦い方
製造業における購買・調達業務とは?課題の解決方法も紹介
サプライチェーン排出量はなぜ注目される?算定方法も含めて紹介