医学部のない東京理科大学が、次世代医療のカギを握る。なぜか。その真意に迫る。
近年、ゲノム解析の進行や医療情報に関する法整備によって、「医療ビッグデータ」といわれる人体や病気に関する大量のデータがもたらされるようになった。医療の現場とデータサイエンティストが強力にタッグを組むことで、病因の解明や治療方法など医学の飛躍的な進歩が期待されている。矢部博・データサイエンスセンター長(理学部第一部応用数学科 教授)、宮崎智教授(薬学部生命創薬科学科)、寒水孝司教授(工学部情報工学科)へのインタビューを通して、データサイエンスと医療の関わりを解き明かし、データサイエンスを核とする東京理科大学の最新研究を紹介する。
ゲノム解析のスピードとコストダウンで進む遺伝子研究
――最近、ゲノム解析が話題です。なぜ注目されているのでしょうか
宮崎 ヒトのゲノム(※1)を初めて解読できたのが、今から20年ほど前です。各国の科学者による国際プロジェクトで解読が進められました。私は当時、国立遺伝学研究所にいて携わったのですが、大変な苦労がありました。人間の22個の染色体のデータのうち、アメリカが1番、日本が21番と22番、というふうに全世界で一人分の人間のデータを出すんです。10年ほどかかりました。その総額は、アポロの宇宙計画に匹敵するような金額だったといわれています。
20年たって、いま一人分のゲノムデータを10万円から20万円で作成できるといわれています。しかも、最初のヒトゲノムを出した時は、アメリカはアメリカ人のデータ、日本は日本人の……と各国のものを組み合わせて、なんとなく「人類のデータ」がまとまった、という形でしたが、いま、「個人ゲノム」と呼ばれる個人一人分のデータを出すのに1日もかかりません。遺伝子データが生命科学、医療を始め、さまざまな研究分野で基本的なデータ、インフラとして使える時代になりました。
(※1)ヒトのゲノム ヒトの体は約60兆個の細胞からなり、その一つひとつの核にあるDNAに同じ遺伝情報が記録されている。ゲノムとはこの遺伝情報全体のこと。
まったく新しいがんの治療が生まれる
――それによって、どんなことが可能に
宮崎 人間の体内でやっていることとは全く違う概念ですが、コンピューターでタンパク質の立体構造を予測して、データとしてつくることができます。がんを修復するようなタンパク質もある程度分かっているので、そのタンパク質をより多く作るようにすればいいし、逆に、がんを進行させてしまうようなタンパク質に対しては、設計図を壊して、作らせないようにすればいい。では、薬としてはどのようなものをつくったらタンパク質のポケットに入るか、といったことを、コンピューター上で設計することができます。
――コンピューター上でたんぱく質を設計なんて、SFの世界のようです
宮崎 がんについて、まだわれわれ人類が知らない隠れた設計図、隠れた分子というのはあるはずです。人の遺伝子は2万2千といわれていて、それを一つずつ昔ながらの手法で解析をしていては、研究者のみなさんの寿命が尽きてしまいますので(笑)、ここはコンピューターの出番です。すでに分かっている遺伝子の共通性や、ルールのようなものを使いながら、これはがん関連の設計図ではないかと推測し、探していくわけです。
コンピューター内で実験をし、それをもとに合成化学の先生が実際に合成し、細胞に入れたら本当に思ったとおりになるかということを実験レベルで行う。薬学はそういう二つの切り口で研究に取り組んでいます。
今年6月に「オンコパネル」というがんゲノムの遺伝子診断用のキットが健康保険で利用できるようになりました。ワンキット56万円です。利用者負担はその3割くらいです。がん関連遺伝子が解明されるにしたがって、今後どんどん発展していくでしょう。
こうした個人ゲノムデータがどんどん出てくることにより、どういう変異に対し、どういう薬が適しているかというフィードバックも大いに期待されます。
パンデミックも予測できるようになる
宮崎 遺伝子を使った研究では、インフルエンザの研究もあります。インフルエンザは、変異や薬物耐性の融合によって新しい型が生まれ、世界的なパンデミックを引き起こすこともあります。2009年の鳥インフルエンザは記憶に新しいところです。
いままでは、パンデミックについてなかなか予測できませんでしたが、ゲノムの遺伝子と、蓄積された過去の変異データを解析することによって、パンデミックを起こすような変異に近づいているのかどうかということを予測する研究もしています。
――医療とデータというと、「医療統計学」という学問領域もあります
寒水 医療統計学という学問は古くからあります。統計学を使って医学的な問題を解決する学問で、世界には研究者がたくさんいます。私が学生の頃、東京理科大学には、医療統計学の分野を開拓してきた吉村功先生がいました。その先生との出会いが、私が医療統計学を専門にするきっかけとなりました。
その当時、吉村先生は、厚生労働科学研究として、厚生労働省が行う「患者調査(国の指定統計の一つ)」の調査法に関する研究を行っていました。患者調査では、病院と診療所がランダムに選ばれて、ある特定の日の入院・外来患者のデータが収集されます。そのデータから日本の患者数が推定され、医療行政の基礎資料として活用されます。患者数を精度よく推定するには、データを効率的に収集し、適切な方法で患者数を推定することが重要です。
患者調査で得られるデータは200万件を超えます。吉村先生の研究に関わったことが、私が医療ビッグデータを扱うきっかけにもなりました。
ビッグデータ時代、求められる「データの品質」
――医療統計学と統計学の他の領域との違いは
寒水 例えば、インターネットでは「レコメンドシステム」が日常的に活用されています。それは、サービスの提供者が、システムの仕組みを知らなくても、結果的に購買意欲につながったり、売り上げが上がったりすればよいという特徴があります。
しかし、医療の場合はどうでしょうか。膨大なデータに基づく結果であったとしても「なぜかはよくわからないけど、あなたにはこの治療法が最適です。よくわからないけど...」といわれて、患者さんはどう感じるでしょうか?医療の分野では「なぜそうなのか」ということを説明することが重視されます。
――今後の課題は
寒水 以前は、国の指定統計のデータの使用許可を得るだけで1年以上かかっていたのですが、いまはかなり使用しやすくなりました。医薬品開発の治験のデータも、共有できる仕組みができてきています。世の中にある貴重なデータを共有する仕組みが増えることはとてもいいことです。
ただし、データがたくさんあればいい、というわけではありません。重要なのは「データの品質」です。医療のデータの中には、測定の単位や日付が間違って入力されたものなど、めちゃくちゃなデータもあります。
製薬会社や一部の大きな病院では、医療統計学やデータ管理の専門家がいて、データの入力、管理、事前の処理をきちんとしてくれます。ところが、すべての病院にそのような専門家を配置する余裕はありませんし、そのような人材も不足しています。そのため、データの品質が十分確保されないことがあります。
さらに、大きな病院でなくても、研究に非常に熱心な医師がたくさんいます。そのような医師がもつ患者さんのデータが活用されることも重要なことなのです。
矢部 統計データというのは、どういう狙いで、どういう意味を持ったデータを取るのか、統計家が最初のところから関与して、環境を整えて収集し、責任をもって解析するのが本来の姿です。いま、ビッグデータといわれる大量のデータが出てきて、利用できるようになったことは良い面も多いのですが、データに対してはより慎重な態度が求められると思います。クリーニング、クレンジングという、データを整理したりいらないものを除去するという前処理も重要になってきます。
――東京理科大学では、今年4月からデータサイエンスセンターを設立されました
矢部 ビッグデータがよしにつけあしきにつけ集まる時代になりました。得られたデータから価値ある情報を取り出して活用するため、高度な技術と知識を持ったデータサイエンティストの育成が喫緊の課題となっています。
データサイエンスセンターは、本学が擁する理学、工学、薬学、生命医科学、経営学の学部、研究科のプラットホームと位置付けています。学内横断的につないで、データを多角的に研究するとともに、学外の他大学や病院、研究機関、企業とも幅広く連携して、共同研究や人材育成を進めています。
また、学部教育において「データサイエンス教育プログラム」も立ち上がりました。どこの学部の学生であっても、データサイエンスの授業を受けられ、必要単位を取得すれば、卒業時に認定を受けられます。さらに大学院修士課程におけるデータサイエンティスト育成では、横浜市立大学や明治大学とも連携しています。
――この世界を目指す若者へのメッセージをお願いします
寒水 研究成果が新しい診断法や治療法の確立につながったときの達成感はとても大きいです。理科大には医学部がありませんが、いろいろな病院や医師とのつながりがあり、たくさんの機会が用意されています。
宮崎 ぜひ、夢を持っていただきたいですね。世の中は大きく変わります。若い方たちはおそらく生きている間に宇宙旅行をするでしょう。宇宙で薬を飲んだらどうなるの?なんていうことが考えられるような人に来てほしいなと思います。