ビッグデータ

ビッグデータとは?を改めて認識しよう

2010年頃からちらほらと聞こえ始め、2013~2014年にはバズワードとなり話題となったのが”ビッグデータ”です。
現在はその傾向も下火となり「ビッグデータもただの流行り廃りだったか?」という印象を持っている方も多いでしょうが、実際はそうではありません。

バズワードとして爆発的に浸透した時代を経て、現在では各企業における活用に注目が集まっています。

しかし中には「ビッグデータって結局なに?」と、ビッグデータについて詳しく知らない方もまだまだ多いでしょう。

ここでは、そもそもビッグデータとは何なのか?そしてビッグデータを取り巻く環境や活用ポイントなどを解説していきます。

ビッグデータとは

ビッグデータとは読んで字のごとく、膨大な量のデータを指す言葉です。
では、データならばどんなものでもいいか?まずは何がビッグデータなのかを定義していきましょう。

ビッグデータの定義

ビッグデータ活用を推進している総務省のホームページでは、ビッグデータを以下のように定義しています。

“事業に役立つ知見を導き出すためのデータ”

引用:http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html

「え、これだけ?」と何だか肩すかしをくらった気分ですが、そもそもビッグデータとは業界業種、または企業によって多種多様です。
このため定義することがなかなか難しい、というよりそもそも明確に定義する必要がないという特徴があります。

ビッグデータとほぼ時期を同じくしてバズワードとなったのが “クラウド”ですが、この2つを比較するとわかりやすいと思います。

後述しますがクラウドには3つの形態が存在し、いずれもサービスとして提供され調達する対象であると考えられます。
だからこそIaaSやPaaSといった形態を明確に定義し、提供する必要があるのです。

一方ビッグデータとは小さなデータ群が集まったものであり、データ単体を調達の対象とすることはありません。
それよりも「データをどう分析しどう活用するのか?」ということの方が重要なため、そもそも定義する必要性が薄いのです。

3つのV

「どんなデータがビッグデータなのか?」という定義はありませんが、総務省の定義よりもう少し掘り下げた定義を提唱しているのが米調査会社のガートナーです。
その定義とは”3つのV”と呼ばれており、「Volume:データ量」「Velocity:データ速度」「Variety:データバラエティ」の3つの頭文字から成っています。

Volume:データ量

データ量は当然、多ければ多いほど定量的・定性的な分析をする上で有用な情報を導き出すことができます。
このためビッグデータの言葉通りデータ量は膨大なものが前提とされています。

しかし、必ずしも膨大な量のデータが最適かと言われればそうではありません。
むしろ最近では「余計なデータはそぎ落としたスモールデータに着目しよう」という声も聞こえてきています。

ですので、ビッグデータを活用する際はデータ量に囚われないことが大切でしょう。

Velocity:データ速度

ビッグデータとは日々蓄積されていくデータであり、高い更新頻度(つまりデータ速度)を持ち合わせています。
営業日報一つとっても毎日複数人の営業マンから打ちあがってくるので、データ速度は十分と言えますね。

そしてそんなデータがあっという間に膨大な量となり、ビッグデータを形成していくのです。

Variety:データバラエティ

現代ビジネスにおいて私たちが取得できるデータは実にバラエティに富んでいます。そしてそのバラエティも、ビッグデータの”3つのV”を構成する要素の一つです。

例えば、Googleアナリティクスなどのアクセス解析で取得できるデータはバラエティの宝庫と言えます。
ページ閲覧数、訪問者数、サイト滞在時間、離脱率などなど、さらに何倍ものデータ種類をいとも簡単に取得できます。

そしてこれらのデータは単体で見るのではなく、総合的に分析して初めてビジネスに有用な知見を見出すことができるのです。
だからこそ、ビッグデータの定義にデータバラエティは欠かせないと言えますね。

第三のプラットフォーム

皆さんは”第三のプラットフォーム”という言葉をご存知でしょうか?

IT業界における重要なプラットフォームは10~20年周期で変化しています。
第一のプラットフォームが「メインフレームと端末」であり、汎用機といったコンピュータが爆発的に普及したことで多くのシステムが誕生しました。

第二のプラットフォームが「サーバ/クライアントシステム」です。
ソフトウェアやデータベースなどをサーバが集中管理し、それをクライアントが利用するというネットワーク環境を指します。

そして第三のプラットフォームとは「モバイル」「ソーシャル」「クラウド」「ビッグデータ」の4つで構成されています。
これは米調査会社のIDCが提唱する概念であり、他にもいくつか類似したものがありますがいずれも言わんとしていることは同じです。

モバイル

モバイルと聞けばまず思う浮かぶのがスマートフォンかと思いますが、事実モバイルとはスマートフォンを指している言葉です。
少々古いデータですが2014年の世界スマートフォン人口は16億3,900万人であり、当時の世界人口である72億4,400万人から計算すると約4人に1人がスマートフォンを利用していることになります。

また国内では2015年のスマートフォン人口が49.7%であり、2人に1人が所持している計算になります。

こういった傾向からスマートフォンはビジネスを展開する上で無視できない存在となっています。

ソーシャル

ソーシャルとはFacebookやTwitterといったSNS(ソーシャルネットワーキングサービス)を指します。

各SNSのグローバルユーザー数

Facebook:16億5,000万人
Instagram:4億人
Twitter:3億2,000万人
LINE:2億1,500万人

以上の数字を見て分かるように、各SNSを利用しているユーザーはスマートフォン人口に匹敵しています。
こうしたソーシャルを活用したプロモーションなどは既に各業界で盛んであり、モバイル同様に無視できないプラットフォームとなっていますね。

ちなみに国内のユーザー数は以下のようになっています。

各SNSの国内ユーザー数

Facebook:2,400万人
Instagram:800万人
Twitter:3,500万人
LINE:5,800万人

TwitterとLINEのユーザー数が圧倒的ですね。
しかしLINEはマーケティングプラットフォームとして不向きな傾向にあるので、企業がソーシャルマーケティングを展開する場合はTwitterかFacebookのどちらかを選択(あるいはどちらも)することになるでしょう。

クラウド

クラウドにはIaaS/PaaS/SaaSという3つの形態が存在します。

IaaS (Infrastructure as a Service)

システム開発や構築といった際にはまず、サーバといったインフラを調達する必要があります。
細かく言えば必要なのはサーバのCPUやメモリ、ストレージなどですね。
IaaSはこれらのインフラをインターネット経由で提供するサービスであり、ユーザーはCPUやメモリなどを好きに増減できることが特徴です。

代表的なサービスはAWS(Amazon Web Service)やGoogle Compute Engineですね。

PaaS (Platform as a Service)

PaaSはインフラを提供するIaaSに対し、インフラや開発環境を含めたプラットフォームを提供するサービスです。
つまり、サーバ上にWindowsやLinuxといったOSが既にインストールされた状態とイメージすると分かりやすいと思います。

代表的なサービスはMicrosoft azureです。

SaaS (Software as a Service)

SaaSは簡単に言えば、IaaSやPaaS以外で提供されている全てのWebサービスやWebアプリケーションです。
システム開発に携わる人間でなくても身近な存在であり、GmailなどのフリーメールやYahoo!といった検索エンジンなどもSaaSに該当します。

つまり、SaaSとは手元にシステム環境がなくてもインターネット経由で利用できるサービスやアプリケーションのことです。

代表的なサービスはGoogle AppsやSalesforceとったサービスですね。

以上の「モバイル」「ソーシャル」「クラウド」に加え「ビッグデータ」を加えたものが第三のプラットフォームであり、現代ビジネスにおいてこれら4つを上手く活用することが企業成長を握る鍵だと言われています。

また、それぞれの要素は密接に絡み合い複雑なネットワークを形成しているので、活用は必ずしも簡単なものではありません。

まとめ

バズワードという黎明期を経てビッグデータは今、成熟期へと突入しています。
つまり、ビッグデータの意味をしっかりと捉え適切に活用した企業こそが、次にステージへと昇っていくと言ってもいいでしょう。

今後ビッグデータを活用したい企業が取るべき行動は、まず「自社にとってのビッグデータとは何か?」を独自に定義すると共に「果たしてビッグデータである必要はあるのか?」を明確にすることではないでしょうか。

ビッグデータについて定義した上で必要なデータについて考えることで、ビジネスに有用な情報を導き出すためのデータを絞り込むことができます。

また、ビッグデータ活用は必ずしも「金脈を掘り当てる」ではなく、むしろ「ガラクタの山から使えそうな情報を見つけ出す」という作業に近いことを忘れないでください。

ODIP Enterprise Solution

ODIP Enterprise Solution
ODIP(オーディップ)は、複雑な大規模バッチ処理を、簡単なGUIで、いとも簡単に開発します。

コスト増や開発遅延は皆無で、大幅な高生産性、見える化、100%品質維持を実現した革命的ソリューションです。

ダウンロード

ODIP Enterprise Solution
ビッグデータ分析の要!BI(ビジネスインテリジェンス)ツールとはIoTの光と影、デジタル世界に向けて残された5つの課題