download-2_edited.png

​研究の方針

当研究室ではデータサイエンスを活用した経営に関する情報(技術経営学)や人間の行動に関する解析(計算社会科学)、そして言語処理を中心としたデータサイエンスの技法に関する研究(計算言語学)に関する研究を進めています。それぞれの分野は密接に関係しており、研究者同士が交流しながら研究を進めています。
 

学生の研究テーマ選択については、自主性を最大限に尊重する方針を採っています。このため、研究室内の研究テーマはかなり多様で、扱う技法も機械学習(深層学習、表現学習を含む)、自然言語処理、複雑系ネットワーク分析などかなり広範にわたります。

​技術経営学

近年の学術領域の多様化と論文数の指数関数的な増加により、学術分野の専門知を研究開発や経営の意思決定に活用することが難しくなりつつあります。坂田研究室では、テクノロジーに関する膨大な情報(論文、特許などの技術文献やSNSに代表される社会情報)からインフォマティクス(機械学習、自然言語処理などの情報処理技術)を用いて、技術経営に関する課題解決に寄与する知見を抽出するテクノロジーインフォマティクス(技術経営情報工学)の技法群を開発しています。 特に論文情報は近代社会における人間のイノベーションが引用や共著の情報などとして構造化されて蓄積されたものだと考えられます。これらの情報を用いることで、現状の学術領域の俯瞰や将来予測、化学物質などの素材や技術の応用先の探索などを進めています。

​近年の代表的な研究

Large-scale analysis of delayed recognition using sleeping beauty and the prince

長い間注目されなかった論文であるSleeping Beautyとそのきっかけとなる論文であるPrinceを大規模に取得し、その特徴を明らかにしました。非連続な発見は遠い分野間だけではなく、近くの分野の見落としにも多く存在していることがわかりました。

Detecting trends in academic research from a citation network using network representation learning

In this paper, we propose a novel framework that detects the trend as the growth direction of a citation network using network representation learning(NRL). We presume that the linear growth of citation network in latent space obtained by NRL is the result of the iterative edge additional process of a citation network.

Scientific Attention to Sustainability and SDGs: Meta-Analysis of Academic Papers

サスティナビリティに関する学術文献がSDGsに対しどのような関心を持っているかを、30万件の書誌情報より明らかにしました。

​計算社会科学

ソーシャルネットワークは社会の意見形成や企業や個人の行動に大きな影響を与えています。人々の意見が蓄積されたデータは潜在的な社会課題や問題を含んでおり、当研究室では効率のよい社会課題の抽出技術を開発しました。このような技術は人々の意見の政策への早期に反映に寄与できると考えています。  その一方でソーシャルネットワークには、誘い出しなどの犯罪、個人への攻撃、政治的分極化などの問題が潜んでいます。また、コロナウィルスの感染拡大の状況におけるデマの拡散などのソーシャルメディアが果たした影響は大きいと考えられます。これらの問題がユーザーの行動やインタラクションにより生じるプロセスを解明することで、ソーシャルメディアの健全な活用の促進に向けた貢献ができると考えられます。本研究室では主に日本語の大量のツィートデータをもとにした解析を進めています。

​近年の代表的な研究

Evaluating Nodes of Latent Mediators in Heterogeneous Communities

異質なコミュニティをつなぐ結節点(ノード)を検出する新しいネットワーク指標(PW)を提案

Dense and influential core promotion of daily viral information spread in political echo chambers

Twitterの政治的エコーチャンバーにおいて効率的な情報拡散が行われている過程を明らかにしました。

計算言語学

計算言語学・自然言語処理に関する研究では、世界のフラグシップジャーナル・カンファレンス(TACL, ACL, EMNLP)に論文が複数件採択されるなど、深層学習技術を応用した文章要約技術を中心に先端的な成果を挙げています。機械学習技術を用いた文書要約では教師データの作成コストが実用上のボトルネックになりますが、少量の教師データでも高い性能が得られるモデルを開発することで、文書要約技術の実用性向上に貢献しています。また開発した教師なし要約技術を用いることで、これまで自動要約技術の適用が困難だったソーシャルメディア上の世論俯瞰や、複数論文からの情報集約といったより高度なタスクに挑んでおり、技術経営学や計算社会科学に関わる課題解決に役立てることを目指しています。

​近年の代表的な研究

Unsupervised Abstractive Opinion Summarization by Generating Sentences with Tree-Structured Topic Guidance

木構造上のトピックから各トピックに関する要約文を生成する教師なし要約手法を提案

研究リソース

保有データ

約7,000万件の引用情報を含む論文データ、特許のデータベースへのアクセス、ツィッターのソーシャルメディア情報、企業のM&A情報また鉄道の状況記録などの多様なデータを揃えています。卒論生や修論生は主にこれらのデータを活用して研究を行っています。また、ホットリンク、ダイキン工業、関西の私鉄連合等との共同研究を行っておりそれぞれのデータの詳細や活用方法に関してドメイン知識に基づいたアドバイスを得ることができます。

研究環境

サーバー(高メモリサーバー3台、一部はNVIDIA 2080 TIを搭載で今後はNVIDIA GPU RTX3090を導入予定 )の環境を揃えており、学生は自由に利用できます。また、産総研ABCIを研究室内サーバーリソースの不足時や大規模計算に活用しています。  Pythonを基本としTensorflow等の分野の標準的なパッケージの使用を推奨しており、研究室標準のSingularity Image を提供しており研究開始へのハードルを低くしています。

研究資産

ネットワーク解析などのノウハウに関する蓄積があります。研究で用いたコードは研究室内で共有しています。