研究内容
本研究室の主な研究テーマ

(1)マルチコア/GPUのための並列ソフトウェアと並列化コンパイラ
マルチコア/GPUを有効利用する並列処理手法の研究と並列ソフトウェアを開発しています。
Java環境においては,タスク駆動型粗粒度並列処理について研究しており,並列コードを自動生成する並列化コンパイラを開発しています。
C言語/CUDA環境においては,マルチコア/マルチGPUを併用するハイブリッド粗粒度タスク並列処理を研究しています。


(2)機械学習の並列処理による高速化
画像分類や物体検出に用いられる畳み込みニューラルネットワークにおいて, マルチコアやマルチGPUを用いた並列処理により高速化を目指します。 データセットとしてはCIFAR-10等を使用し,CUDAコードやPytorchライブラリにより高速化を行います。
(3)敵対的生成ネットワーク(GAN)の並列処理による高速化
深層学習技術の一つとしてGANがあります.識別器と生成器のネットワークを競合させ,本物のような画像を生成することが可能です。 本研究では,畳み込み層を使ったDCGANを取り上げ,PythonプログラムのGPUによる高速化を目指します。
(4)粒子法シミュレーションのマルチコア/SIMD並列処理による高速化
流体シミュレーションに用いられる粒子法は,粒子数が増えると膨大な計算時間を必要とします。 本研究では32コア/AVX-512による並列処理により高速化を実現します。以下に,水柱崩壊シミュレーションの結果を示します。


(5)準同型暗号における機械学習の推論の並列処理
準同型暗号では,暗号化したまま加算・乗算を行うことができるため,プライバシー保護下で機械学習の推論を行うことが可能です。準同型暗号の演算には長い実行時間を要するため,並列処理により高速化を目指します。
(6)スマートフォンや低消費電力プロセッサにおけるアプリの並列処理
スマートフォン(8コア ASUS Zenfone9)や低消費電力プロセッサ(12コア Jetson AGX Orin)において,Javaマルチスレッドを用いた並列処理コードを生成し,低消費電力環境下で高い実効性能を達成しています。


(7)UnityアプリケーションのVR可視化
zSpace社のVRディスプレイを使用して,UnityアプリケーションのVR可視化を実現します。VR可視化には,zSpace社が提供しているUnity用Plug-inあるいはSDK(C/C++用)を利用します。
