企業の競争力強化や持続的な成長の実現にむけて、デジタル技術の進化と共に膨大かつ多様なビッグデータの活用が進んでいます。しかし、デジタル技術の進化が著しいからこそ、分析・活用経験が少ない方やビッグデータそのものについて把握しきれていない方も多いのではないでしょうか。
この記事では、ビッグデータの概要をはじめ、注目を集める理由や活用するメリットについて解説します。
目次
ビッグデータとは
ここではビッグデータに関する基礎知識として、ビッグデータの定義と5つの要素、具体的な種類について解説します。
参考:総務省|ビッグデータの活用に関する アドホックグループの検討状況
定義
今のところビッグデータに明確な定義はありません。総務省の資料では「事業に役立つ知見を導出するためのデータ」としつつも、ビッグデータの種別に関する分類によってはさまざまな考え方ができるとし、以下4項目を使って分類しています。
種類 |
概要 |
オープンデータ |
・国・地方公共団体が提供するデータ ・ビッグデータとして先行している分野 |
知のデジタル化 |
・農業・インフラ管理からビジネスに至る産業・企業が持ちうるパーソナルデータ以外のデータ ・多様な分野・作業・身の回りに存在する人間の「知」に迫るさまざまなノウハウ・蓄積がデジタル化すると想定されている |
M2Mデータ (Machine to Machine) |
・工場などの生産現場におけるIoT危機から収集されるデータ、橋梁に設置されたIoT機器からのセンシングデータなどが該当する ・総務省では「知のデータ」と「M2Mデータ」をあわせて「産業データ」としている |
パーソナルデータ |
・個人・属性にかかわるデータ ・個人の属性情報、移動・行動・購買履歴などから収集された個人情報が含まれる |
この定義については認知度がまだまだ低く、一般的には大量かつ多様な種類・形式が含まれたデータ群を定義化しています。
ビッグデータと見聞きすると単に膨大な量を集積したデータをイメージするかもしれませんが、総務省の資料ではソーシャルメディアやWebサイトなどに含まれる文章や画像、動画、音声、スマートフォンから得た位置情報など、さまざまなデータが含まれるとしています。
参考:総務省|平成29年版 情報通信白書|ビッグデータの定義及び範囲
5つの要素
近年ではビッグデータの要素を5つの特徴を表す英単語を使い「5V特性」と呼ばれることも多いです。
特徴 |
概要 |
Volume(データ量) |
・MicrosoftOfficeの「Excel」では処理しきれないほどの膨大なデータ量である |
Velocity(入出力・処理の速度) |
・さまざまなデータを用い精密な分析ができる |
Variety(データの多様性) |
・絶え間なくデータ生成が行われ、かつ高頻度でデータベースが更新されている |
Veracity(正確性) |
・データに含まれる不確実な内容を管理し、正確性向上を図る |
Value(価値) |
・ビジネス・企業にプラスの影響をもたらすこと |
目的や特徴などでカテゴライズすると、ビッグデータの定義を難しくしていることが理解できるでしょう。
種類
ビッグデータはその構造や利用目的によって多様な種類に分けることができます。一般的に認知が広まっている種類は下記の通りです。
構造化データ
構造化データは、ExcelやCSVファイルのように「行」や「列」の概念を持つデータです。その名の通り構造化していることから、検索や集計などが円滑に進み、データ解析や分析に適した構造です。
非構造化データ
非構造化データは、構造化とは異なり、構造定義のないデータです。データベース化できない特徴から、画像や動画、音声など日常で生み出されるさまざまなデータが該当します。データそのものに意味を持つため、発生頻度が高いデータとして認識されています。
半構造化データ
半構造化データは、非構造化データに含まれるものの、ある程度の構造が決まっているデータを指します。XMLなどが該当し、整理すれば構造化データに変換可能なデータも存在します。また非構造化データと比べて効率的に検索・分析できる特徴もあります。
ビッグデータが注目される理由
従来のデータとは特徴が異なるビッグデータですが、インターネットが使われるようになった頃からデータは利活用されてきました。では、なぜ今になってビッグデータが注目を集めるようになったのでしょうか。
取り扱うデータ量の増加
注目される理由のひとつとして、世界規模で取り扱うデータ量が増加したことが挙げられます。インターネットが使われはじめたころからデータの利活用はありましたが、近年ではスマートフォンやタブレットなど、PC以外の端末からも場所を問わずインターネットができるなど、さらに普及しています。
利便性に優れ、いつでも好きな時間に情報収集ができるという特徴から、インターネット利用人口が爆発的に増加し、それと同時に情報通信技術も発展しました。今では日々膨大な量のデータが利活用されていることから、ビッグデータの持つ能力が注目を集めるきっかけになりました。
PCをはじめとする端末の進化
PCをはじめとする端末の技術進化もビッグデータが注目される理由です。世の中にある膨大なデータをビジネスや日常生活に役立てたいと思っても、迅速に収集し正確に処理できる技術がなくては利活用はできません。
スーパーコンピューターを筆頭にPC性能はめまぐるしく進化し、現在では膨大な量のデータであっても少ないコストで処理できるようにまで変化しています。
AIの進化
ビッグデータが注目される理由にはAIの進化も深く関わっています。動画・音声をはじめとした非構造データの分析精度と処理スピードが機械学習のひとつであるディープラーニング技術によって飛躍的に向上したためです。
ディープラーニング技術の精度が向上したことで、企業内に蓄積されていたビッグデータが効率的に分析できるようになりました。AI技術はまだまだ発展し続けていることから、それと同時にビッグデータへの注目度も高まり続けているのです。
ビッグデータを活用するメリット
ビッグデータを活用すると、どのようなメリットがあるのでしょうか。具体的には下記の通りです。
データに基づく意思決定の実現
ビッグデータの活用によってデータに基づく意思決定が実現します。仮に個人的な主観や従来の勘で企業方針を変えると、企業方針を変えたいと思った具体的な理由や目的を組織全体に伝えられない場合があります。
誰かを納得させるためには主観ではなく根拠を示すデータが必要です。ビッグデータを活用し自社課題を見つけられれば、企業方針を変えなければならない理由と必要性、変えたことでみられる効果をデータを使って説得力のある説明につながり、意思決定が実現しやすくなります。
業務プロセスやコスト効率の最適化
ビッグデータの活用によって、業務プロセスやコスト効率の最適化を図ることもできます。例えば製造業の場合、生産ラインにおける各工程から収集されるセンサーデータの分析を通じて生産効率や品質管理の精度の向上を実現しています。
GPSや天候のデータを組み合わせれば、状況に応じた配送ルートの算出につながり、燃料コストの削減や配送時間の短縮も実現できます。
新たな価値の創造
ビッグデータの活用によって、今まででは見つけられなかった傾向・パターンが明らかになることが多いです。そのため、抽出されたデータをうまく活用することで、新製品やサービスの開発に役立てることもできます。
例えば金融業界の場合、これまでの財務データにあわせてSNSデータや位置情報を取り入れ、従来よりも高精度な信用評価モデルの構築を実現しています。
ビジネスチャンスの広域化
多種多様なビッグデータが存在することから、上手に活用することでビジネスチャンスの広域化も実現可能でしょう。あらゆる情報源からデータが収集される特徴により、既存製品・サービスに対する消費者からの評価をはじめ、趣味・思考・競合他社の動向など、必要に応じて幅広い情報を収集することができるからです。
自社に有効な戦略を策定できることから、今までとは異なる市場での発展・活躍も期待できます。
ビッグデータ分析の手法
ビッグデータを使ってさまざまな情報を分析する場合、どのような手法が用いられるのでしょうか。代表的な手法は下記の通りです。
- アソシエーション分析
- 回帰分析
- クロス集計
- クラスター分析
- 決定木分析
- 主成分分析
ここではこれらの概要について解説します。
アソシエーション分析
アソシエーション分析は、ビッグデータを分析対象に設定し「AならBだろう」といった因果関係を見つけようとする手法です。
マーケティング分野では顧客の行動からパターンを見つけるために用いられてきたもので、一例としてはドラッグストアを対象とした「ビールとおむつの関係性」があります。
おむつを購入する男性の多くがビールも一緒に購入している事実が判明したことから、それぞれを近い場所に陳列し、売上アップを実現した事例です。具体的には、下記の手順に沿ってアソシエーションルールを生成することができます。
- 3つの指標を洗い出す
- 一定の支持度で線引きする
- 信頼度・リフト値で絞る
- 正しいことなのか、現場で活用できるのかを確認する
例えばAmazonをはじめとしたECサイトで見かける「この商品を購入した人はこの商品も購入しています」といったレコメンドも、アソシエーション分析が用いられています。
回帰分析
回帰分析は、ある結果と関連する要因が結果にどの程度の影響があるかを分析する手法です。結果を意味する「目的変数」と結果に関する要因を「説明変数」と呼び、どのような説明変数が目的変数につながるかを把握できるようになれば、有効なマーケティング施策を打ち出すことができます。
クロス集計
クロス集計は、多様なデータを属性で分け、傾向を明らかにする手法です。例えばアンケート調査において2つ以上の質問を投げかけ、得た回答から回答者の属性で分けた後、傾向を判断するなどです。
クロス集計には「属性クロス集計」と呼ばれる顧客属性から傾向を分析する手法と、設問の回答結果に基づいて分析する「設問クロス集計」の2つありますが、Excelやスプレッドシートを使えば容易に実行できる特徴から、分析手法のなかでは活用しやすい部類に含まれます。
クラスター分析
クラスター分析は、データにある類似性に基づき分析する手法です。マーケティング部門のなかでも顧客セグメントを分類する際に使われます。例えばアンケート結果に記載された顧客の年齢層や家族構成を軸に既存顧客をグループ化し、グループ別で製品の売れ行きや人気のない製品などを分析するなどです。
データをグループ化することでアプローチする必要がある年齢層や改善が必要な製品についての仮説を立てることができます。
決定木分析
決定木分析は「はい」「いいえ」のどちらかで答えられるアンケートに近い分岐を与えて、この問題に対する答えを繰り返して幅広い予測につなげる手法です。この場合は顧客にアンケートを実施するケースが一般的で、例えば「どのような条件だと製品を使いたいと思うか」といったアンケートの実施によって、顧客属性や割引の必要性など、購買行動の奥にある因果関係を探ることができます。
主成分分析
主成分分析は、ビッグデータ分析に用いるデータに複数の変数がある際に用いられます。分析対象とする変数を絞ることで、シンプルな分析を実現できます。可視化が難しいとされていた分析結果であっても、グラフを用いて表すことも可能です。
ビッグデータ分析を成功させるコツ
ビッグデータ分析を成功させるため、ここでは成功につながる3つのコツについて解説します。
利用目的の明確化
ビッグデータ分析を成功させるためには、何を目的として分析したいのか、さらには分析結果からどのような知見を得たいのかを明らかにすることです。ビッグデータ分析で取り扱うデータは従来のものとは異なり多種多様です。目的を明らかにすることで、目的に沿ったデータを用意することができます。
管理体制の整備・強化
膨大なデータ量だからこそ、ビッグデータ分析を実施することを前提としたデータウェアハウス(DWH)というサービスの活用が一般化しつつあります。データウェアハウスはビッグデータ分析に対応した形式に最適化し、その上で安全に管理できる仕組みを指します。
多くのデータウェアハウスにはサイバー攻撃を防ぐ仕組みやセキュリティ向上に役立つ機能が整っています。膨大かつ貴重なデータを取り扱う以上は、データウェアハウスを中心とした管理体制の整備・強化も実施しましょう。
データクレンジングの実施
利活用したビッグデータは、そのままの状態で保管すると欠損・ノイズが生じる恐れがあります。データに不備があれば分析できないことから、定期的にデータクレンジングを実施し、ビッグデータは適切な形に整えることも心がけましょう。
なお上述したデータウェアハウスのなかには、データクレンジング機能が備わった製品もあるので、気になる製品が見つかったときは機能詳細を確認してみるとよいでしょう。
ビッグデータの活用事例
ビッグデータは今では多様な業界で利活用されています。ここでは、6つの業界に絞り、ビッグデータの活用事例について解説します。
医療・福祉業界
医療業界では、ビッグデータを活用した新薬の開発プロセスの速度向上に成功しています。多様なデータを使うことでどの成分によってより効果的な治療法となるかが見つけやすくなるためです。新薬の候補物質を速やかに特定できることにより、従来と比べて短期間で有用となり得る薬剤の発見・開発につながっています。
また福祉業界ではビッグデータの活用によって患者の健康に関する問題の早期発見につなげ、本格的な介護を必要とする前段階で食生活・運動習慣の見直す対策が実現しました。
関連記事:医療DXとは?概要やメリット、詳しい手順や事例を解説
運輸業
運輸業では業界全体が抱えている問題解決を視野にビッグデータを活用しており、交通系ICカードの利用で収集されたデータを電車運行の本数・頻度の調整などに役立てられています。荷物配達の場面においても、出荷状況や気象条件などのデータを基にコストパフォーマンスの高い配送経路選択の実現など、細部にわたって有効活用されています。
教育業界
教育業界でもビッグデータ活用は加速しています。例えば九州大学では学生・教職員約27,000人に電子教科書を導入しました。単に利便性が上がっただけでなく、ユーザー利用ログをはじめとしたさまざまなデータをビッグデータとして収集・分析し、関連資料レコメンド機能や授業内容改善に活用する取り組みが行われています。
参考:ITmedia NEWS|九大、全学で電子教科書導入 ビッグデータ収集、教育に活用
小売業
小売業のビッグデータ活用のなかで代表的なものとしては、AmazonをはじめとしたECサイトのレコメンドがあります。サイトを閲覧するユーザーに対して過去の購入履歴や閲覧履歴、クリック履歴などのデータをもとにおすすめ商品を表示する機能ですが、この部分にもビッグデータが活用されています。
ビッグデータを活用し、顧客に最適もしくは求めているであろう商品を的確におすすめとして紹介できることで、売上アップや利便性向上に成功しています。
関連記事:小売DXとは?推進の理由やメリット、取り組み事例を解説
製造業
製造業でも多様なシーンでビッグデータが活用されています。例えばヤマハ発動機では、製造工程での生産ロスを削減し歩留まり率の改善を実現しています。不良品が発生しやすい鋳造工程には属人化が進行しており、改善を図るためビッグデータ分析を実施しました。生産ロス削減につながる最適解を見つけ、大幅なコスト削減につながっています。
関連記事:製造業DXとは?必要性やメリット、手順や成功のポイントを解説
農業
農業でもビッグデータの活用が増えています。一例としては、収穫適期の作物を自動収穫するロボットです。AI技術のなかでも画像解析を有効活用していることから、作物の間を自動走行させ、発見した作物が収穫適期かどうかを自動判別して収穫につなげます。
画像解析には作物の画像や生育状態などのビッグデータが使用されているため、経験で養った人間の知識に近い判断で適期の収穫実現を果たしています。
関連記事:農業DXとは?スマート農業との違いやメリット、課題や事例を解説
ビッグデータ活用の壁を乗り越える|課題と対策
ビッグデータの活用には大きなメリットや可能性がある一方、いくつかの課題があるのも事実です。多様なデータを取り扱うからこそ、高度なセキュリティの確保やデータ管理の方法、個人情報を取り扱う場合には信頼性の確保などが欠かせません。
そのため、匿名化や暗号化技術、アクセス制御などの対策を中心に、ビッグデータとAI技術を併用するのであれば、法令遵守や倫理的配慮などにも対応できる人材確保が必要になるでしょう。
- プライバシー・データセキュリティ
- 品質管理
- 信頼性
- 法令・倫理に関する知識
ビッグデータの利活用にあたっては、上記項目に対する対策の策定が必要です。早期に対応できない場合には、ビッグデータの使用を諦めるのではなく、デジタル技術に精通した外部パートナーの活用をおすすめします。
まとめ
ビッグデータはビジネスから日常生活まであらゆるシーンでイノベーティブな変化をもたらす存在であることから、活用によって従来よりも緻密な意思決定や業務プロセスの効率化、新たな創造の実現につなげます。
しかし、多様なデータであるゆえに、取り扱いには十分に注意が必要であるほか、改訂を続ける法規制に迅速に対応できる人材確保が求められます。
データの取り扱いや管理、法令・倫理に対応できる人材を速やかに確保したいときは、PeacefulMorning社の「DX Boost」をおすすめします。DX BoostはDX推進に求められる知識・技術を有する人材を紹介するサービスです。専属エージェントが貴社の希望を丁寧にヒアリングし、その内容を基に最適な人材を最短即日でご提案いたします。
コメントを残す