ビッグデータ社会ってなんだ? 【社会】
【ビッグデータで私たちの暮らしはどう変わる】
最近ビッグデータという言葉をよく耳にします。ビッグデータとは、私たちの周りにあるパソコンやスマートフォン、ICカードやカーナビなどのさまざまな電子機器から発信される膨大な量のデジタルデータのことです。 これら大容量のデータを分析してビジネスや医療、防災、行政サービスなどに幅広く役立てようというのがビッグデータ社会です。ビッグデータの活用で私たちの暮らしや社会はどう変わるのでしょうか。
-ビッグデータで新しい可能性が生まれる-
インターネットの発達で、人々の生活やビジネスは大きく変化しました。ウェブを通じて情報を収集し、ネット通販やさまざまなコンテンツを楽しむことができます。
インターネットは世界中の人々とのコミュニケーションを可能にし、情報を共有することができます。同時にかつてないスピードで大容量のデータが蓄積され、情報量が少なかった時代には分からなかったこと、実現できなかったことが、ビッグデータの出現によって理解し、実現することができるようになってきました。
-ICカードや交流サイトなどからビッグデータが発信-
ビッグデータにはどんな種類があるのでしょうか。
私たちがコンビニやスーパーでモノを買うと、レジで商品ごとに付いているバーコードをリーダーが読み取って会計します。POS(販売時点情報管理)システムといわれるもので、商品名や価格をはじめ、販売した日時、店舗(場所)などが瞬時にデータ化されます。
Suica(スイカ)やICOCA(イコカ)などのIC乗車券では、乗車区間、利用線、日時などのデータが収録されます。
また、ブログや動画サイト、さらにフェイスブックやLINE、ツイッターなどソーシャル・ネットワーキング・サービス(SNS)と呼ばれるインターネット交流サイトから、文字だけでなく音声や画像、動画などのさまざまなビッグデータが生み出されています。
インターネットの発達で、人々の生活やビジネスは大きく変化しました。ウェブを通じて情報を収集し、ネット通販やさまざまなコンテンツを楽しむことができます。
インターネットは世界中の人々とのコミュニケーションを可能にし、情報を共有することができます。同時にかつてないスピードで大容量のデータが蓄積され、情報量が少なかった時代には分からなかったこと、実現できなかったことが、ビッグデータの出現によって理解し、実現することができるようになってきました。
-ICカードや交流サイトなどからビッグデータが発信-
ビッグデータにはどんな種類があるのでしょうか。
私たちがコンビニやスーパーでモノを買うと、レジで商品ごとに付いているバーコードをリーダーが読み取って会計します。POS(販売時点情報管理)システムといわれるもので、商品名や価格をはじめ、販売した日時、店舗(場所)などが瞬時にデータ化されます。
Suica(スイカ)やICOCA(イコカ)などのIC乗車券では、乗車区間、利用線、日時などのデータが収録されます。
また、ブログや動画サイト、さらにフェイスブックやLINE、ツイッターなどソーシャル・ネットワーキング・サービス(SNS)と呼ばれるインターネット交流サイトから、文字だけでなく音声や画像、動画などのさまざまなビッグデータが生み出されています。
-加速度的に膨張するビッグデータ-
インターネットにつながる情報端末やICタグなどのセンサー、電子機器から発信されるこれらのデジタルデータは、インターネット上のサーバーコンピューター(サーバー)に、ログとよばれる利用状況や通信記録などのデータとして日々蓄積されます。
現在、世界中で蓄積されているデータの90%は過去2年以内に発信されたものです。データは2年ごとにほぼ倍増し、5年後には現在の10倍、10年後には50倍に膨らむと推測されています。
今世界中の情報端末からは、1日に2.5エクサバイト(1EB=10の18乗=1兆の100万倍)のビッグデータが生み出されているといわれます。米国のIT専門調査会社のIDCは、2020年には世界中で蓄積されるビッグデータの量は40ゼタバイト(1ZB=10の21乗=1兆の10億倍)になると予測しています。
インターネットにつながる情報端末やICタグなどのセンサー、電子機器から発信されるこれらのデジタルデータは、インターネット上のサーバーコンピューター(サーバー)に、ログとよばれる利用状況や通信記録などのデータとして日々蓄積されます。
現在、世界中で蓄積されているデータの90%は過去2年以内に発信されたものです。データは2年ごとにほぼ倍増し、5年後には現在の10倍、10年後には50倍に膨らむと推測されています。
今世界中の情報端末からは、1日に2.5エクサバイト(1EB=10の18乗=1兆の100万倍)のビッグデータが生み出されているといわれます。米国のIT専門調査会社のIDCは、2020年には世界中で蓄積されるビッグデータの量は40ゼタバイト(1ZB=10の21乗=1兆の10億倍)になると予測しています。
-データの8割が音声や画像などの非構造化データ-
ビッグデータは、単に大容量のデータというだけではありません。
これまでデータといえば文字や数値など、コンピューターが高速処理を得意としていた構造化データを指していました。
これに対してビッグデータは、高速処理が難しかった画像や音声、映像などのデータ(非構造化データといいます)を含んだ多様なデータを指します。現在、ネット上のすべてのデータの80%が非構造データです。
以前はこうした雑多なデータは、コンピューター容量や処理能力の関係から邪魔者扱いされてきました。ところが記憶容量の大容量化や低価格化、サーバーの処理能力の向上などで、非構造化データを含む多様なデータの集まりであるビッグデータが高速処理(解析・分析)できるようになりました。
-ビッグデータは経済活動や社会生活に貢献する-
一般にビッグデータの特徴は、容量(Volume)、種類(Variety)、頻度・スピード(Velocity)、3つのVで示されます。大容量の多様なデータを高速処理できることがビッグデータの特徴です。
ビッグデータは、電子端末から発信される信号や交流サイトのコメント、投稿画像、ネット販売の購入記録、携帯電話のGPS信号など実にさまざまですが、雑多なデータのままでは役に立ちません。
膨大なビッグデータを超高速で解析・分析し、有益な情報として利用する技術が存在してはじめてビッグデータの活用が可能となり、経済活動や社会生活を支える「新しい資源」となるのです。
ビッグデータは、単に大容量のデータというだけではありません。
これまでデータといえば文字や数値など、コンピューターが高速処理を得意としていた構造化データを指していました。
これに対してビッグデータは、高速処理が難しかった画像や音声、映像などのデータ(非構造化データといいます)を含んだ多様なデータを指します。現在、ネット上のすべてのデータの80%が非構造データです。
以前はこうした雑多なデータは、コンピューター容量や処理能力の関係から邪魔者扱いされてきました。ところが記憶容量の大容量化や低価格化、サーバーの処理能力の向上などで、非構造化データを含む多様なデータの集まりであるビッグデータが高速処理(解析・分析)できるようになりました。
-ビッグデータは経済活動や社会生活に貢献する-
一般にビッグデータの特徴は、容量(Volume)、種類(Variety)、頻度・スピード(Velocity)、3つのVで示されます。大容量の多様なデータを高速処理できることがビッグデータの特徴です。
ビッグデータは、電子端末から発信される信号や交流サイトのコメント、投稿画像、ネット販売の購入記録、携帯電話のGPS信号など実にさまざまですが、雑多なデータのままでは役に立ちません。
膨大なビッグデータを超高速で解析・分析し、有益な情報として利用する技術が存在してはじめてビッグデータの活用が可能となり、経済活動や社会生活を支える「新しい資源」となるのです。
-ビッグデータの活用で年間7兆7000億円の経済効果-
ビッグデータで期待されているものに未来の予測があります。
例えばスーパーやコンビニでは、売上データや消費者の動態情報などを詳しく分析することで、どんな季節や天候の時にどんな商品がよく売れるのか、どこに、どういう店を出せばどういう年代の女性(男性)が多く集まるのか、といった販売戦略(将来予測)の重要な判断材料にしています。
総務省の情報通信白書(平成24年版)によりますと、2012年の国内のビッグデータの流通量は、2005年の5.5倍に当たる221万テラバイト(1TB=1兆)に達しています。
ビッグデータをフルに活用すれば、より的確な販売戦略で売上げを増やしたり、ヒット商品の開発やコストの削減などで生産性を高めることができ、その経済効果は年間7兆7000億円になると試算しています。
-急がれる革新的なデータ科学の基盤技術の確立-
今さまざまな領域でビッグデータを活用した研究が進められています。文部科学省では10万人規模の遺伝情報を活用して、一人ひとりの体質に合ったオーダーメード医療の確立や、病気の早期診断、効果的な治療法の確立をめざしています。
また、森林や水などの自然循環や生態系、地理空間などのビッグデータを高度処理(解析・分析)して、地球環境の保全や異常気象、巨大地震や大津波などの災害予測を行い、防災機能の強化や都市の最適設計に活用しようとしています。さらに、ビッグデータを能率よく解析できる情報科学や数理科学、次世代のアプリケーション技術など、革新的な基盤技術の確立を急いでいます。
-大量に必要となるデータサイエンティスト-
ビッグデータの活用には、データを分析・解析するデータサイエンティストとよばれる専門の技術者が必要です。
データサイエンティストは職種としてきちんとした定義はありませんが、数理統計などの分析技術や、プログラミングをはじめとした高度な情報処理技術が求められます。
日本の民間企業で、社内にデータサイエンティストがいる企業は全体の8%程度で、人数にして約1000人に過ぎません。このため大学や産業界では今後大量に必要とされるデータサイエンティストの育成に力を入れ始めています。
-産学の連携でデータサイエンティストの育成が始まる-
慶応義塾大学は昨年秋に、データサイエンティストを育成するためのカリキュラムを作成しました。またビッグデータの集計・解析手法を民間企業と共同研究する「データビジネス創造・ラボ」を創設しています。
昨年7月には、産学連携で「データサイエンティスト協会」が設立され、新しい職種であるデータサイエンティストに必要な技術や知識の定義を行い、データサイエンティストを育成するためのカリキュラムや評価制度の構築を進めています。
-ビッグデータ活用に向けた個人情報保護の法整備-
米国をはじめ海外ではビッグデータの利用が進んでいますが、これまで日本ではプライバシー保護の観点からビッグデータの活用に慎重でした。
昨年夏にJR東日本がIC乗車券のSuicaの乗降履歴を消費者に十分な説明がないまま民間企業に販売して問題となりました。
政府は昨年9月から「パーソナルデータに関する検討会」を発足し、ビッグデータを活用する事業者に、個人が特定できないように技術的な措置を義務づけたり、ビッグデータの利用状況を監視する第三者機関を設けるなどの法整備に乗り出しました。
今年半ばまでに詳しい内容をまとめ、2015年度に個人情報保護法の改正をめざしています。
ビッグデータで期待されているものに未来の予測があります。
例えばスーパーやコンビニでは、売上データや消費者の動態情報などを詳しく分析することで、どんな季節や天候の時にどんな商品がよく売れるのか、どこに、どういう店を出せばどういう年代の女性(男性)が多く集まるのか、といった販売戦略(将来予測)の重要な判断材料にしています。
総務省の情報通信白書(平成24年版)によりますと、2012年の国内のビッグデータの流通量は、2005年の5.5倍に当たる221万テラバイト(1TB=1兆)に達しています。
ビッグデータをフルに活用すれば、より的確な販売戦略で売上げを増やしたり、ヒット商品の開発やコストの削減などで生産性を高めることができ、その経済効果は年間7兆7000億円になると試算しています。
-急がれる革新的なデータ科学の基盤技術の確立-
今さまざまな領域でビッグデータを活用した研究が進められています。文部科学省では10万人規模の遺伝情報を活用して、一人ひとりの体質に合ったオーダーメード医療の確立や、病気の早期診断、効果的な治療法の確立をめざしています。
また、森林や水などの自然循環や生態系、地理空間などのビッグデータを高度処理(解析・分析)して、地球環境の保全や異常気象、巨大地震や大津波などの災害予測を行い、防災機能の強化や都市の最適設計に活用しようとしています。さらに、ビッグデータを能率よく解析できる情報科学や数理科学、次世代のアプリケーション技術など、革新的な基盤技術の確立を急いでいます。
-大量に必要となるデータサイエンティスト-
ビッグデータの活用には、データを分析・解析するデータサイエンティストとよばれる専門の技術者が必要です。
データサイエンティストは職種としてきちんとした定義はありませんが、数理統計などの分析技術や、プログラミングをはじめとした高度な情報処理技術が求められます。
日本の民間企業で、社内にデータサイエンティストがいる企業は全体の8%程度で、人数にして約1000人に過ぎません。このため大学や産業界では今後大量に必要とされるデータサイエンティストの育成に力を入れ始めています。
-産学の連携でデータサイエンティストの育成が始まる-
慶応義塾大学は昨年秋に、データサイエンティストを育成するためのカリキュラムを作成しました。またビッグデータの集計・解析手法を民間企業と共同研究する「データビジネス創造・ラボ」を創設しています。
昨年7月には、産学連携で「データサイエンティスト協会」が設立され、新しい職種であるデータサイエンティストに必要な技術や知識の定義を行い、データサイエンティストを育成するためのカリキュラムや評価制度の構築を進めています。
-ビッグデータ活用に向けた個人情報保護の法整備-
米国をはじめ海外ではビッグデータの利用が進んでいますが、これまで日本ではプライバシー保護の観点からビッグデータの活用に慎重でした。
昨年夏にJR東日本がIC乗車券のSuicaの乗降履歴を消費者に十分な説明がないまま民間企業に販売して問題となりました。
政府は昨年9月から「パーソナルデータに関する検討会」を発足し、ビッグデータを活用する事業者に、個人が特定できないように技術的な措置を義務づけたり、ビッグデータの利用状況を監視する第三者機関を設けるなどの法整備に乗り出しました。
今年半ばまでに詳しい内容をまとめ、2015年度に個人情報保護法の改正をめざしています。
【未来を予測するビッグデータ】
-ビッグデータは21世紀の価値ある新資源-
IT(情報技術)やICT(情報通信技術)の進展で現代は情報化社会、デジタル時代と呼ばれています。それは21世紀に入ってからのことです。2000年の時点では世界で蓄積されている情報のうち、デジタル情報の占める割合は4分の1程度で、大半は紙の印刷物やテープ、フィルムなどのアナログ情報でした。
インターネットの発達で情報化社会は進化し、ビッグデータ社会を迎えようとしています。これまでの情報化社会は、現象をデータ化(数値化、定量化)して、いかに大量のデータを高速で処理(解析・分析)するかが課題でした。そして集積されたデータから現象の原因を探り、因果関係を究明してきました。
これに対してビッグデータ社会では、量的(数値的)に計測できなかった雑多な世界の現実をデータ化し、高度な解析、分析技術によって「今何が起こりつつあるのか」を読み解き、未来を予測する手がかり(パターン)をつかもうとしています。
ビッグデータは、産業や医療、防災、環境、地域社会のさまざまな領域で、革新的な暮らしを生み出す21世紀の価値ある新資源といえます。
-ビッグデータは21世紀の価値ある新資源-
IT(情報技術)やICT(情報通信技術)の進展で現代は情報化社会、デジタル時代と呼ばれています。それは21世紀に入ってからのことです。2000年の時点では世界で蓄積されている情報のうち、デジタル情報の占める割合は4分の1程度で、大半は紙の印刷物やテープ、フィルムなどのアナログ情報でした。
インターネットの発達で情報化社会は進化し、ビッグデータ社会を迎えようとしています。これまでの情報化社会は、現象をデータ化(数値化、定量化)して、いかに大量のデータを高速で処理(解析・分析)するかが課題でした。そして集積されたデータから現象の原因を探り、因果関係を究明してきました。
これに対してビッグデータ社会では、量的(数値的)に計測できなかった雑多な世界の現実をデータ化し、高度な解析、分析技術によって「今何が起こりつつあるのか」を読み解き、未来を予測する手がかり(パターン)をつかもうとしています。
ビッグデータは、産業や医療、防災、環境、地域社会のさまざまな領域で、革新的な暮らしを生み出す21世紀の価値ある新資源といえます。