スマートフォンをはじめとした情報処理技術(ICT)の発達により、私たちは大量のデータを蓄積して活用できるようになりました。そこで注目されているのが、「データサイエンス」という分野です。この記事では、データサイエンスの概要や用いられる知識・技術、学校教育への導入の現状などを専門家が解説します。

1.データサイエンスとは

データサイエンスとは、データ分析に関する学問分野を意味する言葉です。データサイエンスでは統計学や数学、計算機科学などの知識や技術が用いられています。これらを駆使することで、大量のデータから特定の情報・法則・関連性を見つけ出します。

具体的に、データサイエンスは次のような事例で用いられています。

  •  医療現場における、患者が重症化する危険の検知
  •  物流業界における、倉庫整備・運搬の最適化
  •  飲食業界における、来客予測によるコスト削減

(1)データサイエンスに注目が集まる理由

データサイエンスに注目が集まるようになった背景には、技術の進歩によってビッグデータを容易に収集・分析できるようになったことが挙げられます。

ビッグデータとは、人類でさえ全体を把握することが難しい、巨大なデータ群のことです。ビッグデータには、以下のような多種多様なデータが蓄積されています。

  • SNSに書き込まれたコメントやアカウントのプロフィール
  • Webサイトの情報
  • 動画・音声データ
  • 顧客情報
  • メール・チャット
  • 通信記録
  • 商品販売データ

情報技術の発達やデータベースの運用コスト低下により、企業や個人が膨大にデータを蓄積できるようになりました。それに加えて、IoTやクラウドコンピューティング、人工知能(AI)の発達により、データを分析する技術も目覚ましい進歩を遂げました。こうした要因が重なり、データを分析・活用するデータサイエンスの重要性が増していったのです。

(2)データサイエンスの歴史

データサイエンスの歴史のはじまりは、デンマークのコンピュータ科学者、ピーター・ナウア氏が1974年に出版した著書だとされています。1980年代にデータサイエンスは研究分野としての地位を確立させ、1990年代、2000年代にはさまざまな手法・技術が開発されました。

そして2010年代、コンピュータの性能向上や各種部品の低コスト化、インターネットの普及などの要因によって、データサイエンスが一般社会にも浸透していきました。

2.データサイエンスで用いられる知識と技術

データサイエンスでは、主に次のような知識・学問と深い関係性があります。

(1)統計