松谷 宏紀 (マツタニ ヒロキ)

Matsutani, Hiroki

写真a

所属(所属キャンパス)

理工学部 情報工学科 (矢上)

職名

准教授

HP

プロフィール 【 表示 / 非表示

  • 2004年 慶應義塾大学環境情報学部卒業。2008年 同大学大学院理工学研究科後期博士課程修了。博士(工学)。2009年度より2010年度まで、東京大学大学院情報理工学系研究科 特別研究員、日本学術振興会 特別研究員(SPD)。2011年度より2016年度まで、慶應義塾大学理工学部情報工学科専任講師。現在、慶應義塾大学理工学部情報工学科准教授。計算機アーキテクチャ、機械学習、ビッグデータ基盤技術に関する研究に従事。

経歴 【 表示 / 非表示

  • 2006年04月
    -
    2008年03月

    日本学術振興会, 特別研究員DC1

  • 2008年04月
    -
    2009年03月

    日本学術振興会, 特別研究員PD

  • 2009年04月
    -
    2011年03月

    日本学術振興会, 特別研究員SPD

  • 2009年04月
    -
    2011年03月

    東京大学大学院, 情報理工学系研究科, 特別研究員

  • 2011年04月
    -
    2017年03月

    慶應義塾大学, 理工学部, 専任講師

全件表示 >>

学歴 【 表示 / 非表示

  • 2000年04月
    -
    2004年03月

    慶應義塾, 環境情報学部, 環境情報学科

    日本, 大学, 卒業

  • 2004年04月
    -
    2006年03月

    慶應義塾, 理工学研究科, 開放環境科学専攻

    日本, 大学院, 修了, 修士

  • 2006年04月
    -
    2008年03月

    慶應義塾, 理工学研究科, 開放環境科学専攻

    日本, 大学院, 修了, 博士

学位 【 表示 / 非表示

  • 学士(環境情報学), 慶應義塾, 課程, 2004年03月

  • 修士(工学), 慶應義塾, 課程, 2006年03月

  • 博士(工学), 慶應義塾, 課程, 2008年03月

 

研究分野 【 表示 / 非表示

  • 計算機システム

  • 情報ネットワーク

研究キーワード 【 表示 / 非表示

  • 計算機アーキテクチャ

  • 機械学習

  • 計算機ネットワーク

  • ビッグデータ

研究テーマ 【 表示 / 非表示

  • オンデバイス学習, 

    2017年04月
    -
    継続中

 

著書 【 表示 / 非表示

  • 3D Integration for NoC-based SoC Architectures

    Hiroki Matsutani, Michihiro Koibuchi, Tadahiro Kuroda, Hideharu Amano, Springer, 2010年12月

    担当範囲: Chapter 10: 3-D NoC on Inductive Wireless Interconnect

  • Low Power Networks-on-Chip

    Hiroki Matsutani, Michihiro Koibuchi, Hiroshi Nakamura, Hideharu Amano, Springer, 2010年10月

    担当範囲: Chapter 2: Run-Time Power-Gating Techniques for Low-Power On-Chip Networks

  • Networks-on-Chips: Theory and Practice

    Michihiro Koibuchi, Hiroki Matsutani, CRC Press, 2009年03月

    担当範囲: Chapter 3: Networks-on-Chip Protocols

論文 【 表示 / 非表示

  • An area-efficient recurrent neural network core for unsupervised time-series anomaly detection

    SAKUMA T., MATSUTANI H.

    IEICE Transactions on Electronics (IEICE Transactions on Electronics)  1 ( 6 ) 247 - 256 2021年06月

    ISSN  09168524

     概要を見る

    Since most sensor data depend on each other, time-series anomaly detection is one of practical applications of IoT devices. Such tasks are handled by Recurrent Neural Networks (RNNs) with a feedback structure, such as Long Short Term Memory. However, their learning phase based on Stochastic Gradient Descent (SGD) is computationally expensive for such edge devices. This issue is addressed by executing their learning on high-performance server machines, but it introduces a communication overhead and additional power consumption. On the other hand, Recursive Least-Squares Echo State Network (RLS-ESN) is a simple RNN that can be trained at low cost using the least-squares method rather than SGD. In this paper, we propose its area-efficient hardware implementation for edge devices and adapt it to human activity anomaly detection as an example of interdependent time-series sensor data. The model is implemented in Verilog HDL, synthesized with a 45 nm process technology, and evaluated in terms of the anomaly capability, hardware amount, and performance. The evaluation results demonstrate that the RLS-ESN core with a feedback structure is more robust to hyper parameters than an existing Online Sequential Extreme Learning Machine (OS-ELM) core. It consumes only 1.25 times larger hardware amount and 1.11 times longer latency than the existing OS-ELM core.

  • An FPGA-Based On-Device Reinforcement Learning Approach using Online Sequential Learning

    Watanabe H., Tsukada M., Matsutani H.

    2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021 (2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021)     96 - 103 2021年06月

    ISSN  9781665435772

     概要を見る

    DQN (Deep Q-Network) is a method to perform Q-learning for reinforcement learning using deep neural networks. DQNS require a large buffer and batch processing for an experience replay and rely on a backpropagation based iterative optimization, making them difficult to be implemented on resource-limited edge devices. In this paper, we propose a lightweight on-device reinforcement learning approach for low-cost FPGA devices. It exploits a recently proposed neural-network based on-device learning approach that does not rely on the backpropagation method but uses OS-ELM (Online Sequential Extreme Learning Machine) based training algorithm. In addition, we propose a combination of L2 regularization and spectral normalization for the on-device reinforcement learning so that output values of the neural network can be fit into a certain range and the reinforcement learning becomes stable. The proposed reinforcement learning approach is designed for PYNQ-Z1 board as a low-cost FPGA platform. The evaluation results using OpenAI Gym demonstrate that the proposed algorithm and its FPGA implementation complete a CartPole-v0 task 29.77x and 89.40x faster than a conventional DQN-based approach when the number of hidden-layer nodes is 64.

  • Accelerating ODE-Based Neural Networks on Low-Cost FPGAs

    Watanabe H., Matsutani H.

    2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021 (2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021)     88 - 95 2021年06月

    ISSN  9781665435772

     概要を見る

    ODENet is a deep neural network architecture in which a stacking structure of ResNet is implemented with an ordinary differential equation (ODE) solver. It can reduce the number of parameters and strike a balance between accuracy and performance by selecting a proper solver. It is also possible to improve the accuracy while keeping the same number of parameters on resource-limited edge devices. In this paper, using Euler method as an ODE solver, a part of ODENet is implemented as a dedicated logic on a low-cost FPGA (Field-Programmable Gate Array) board, such as PYNQ-Z2 board. As ODENet variants, reduced ODENets (rODENets) each of which heavily uses a part of ODENet layers and reduces/eliminates some layers differently are proposed and analyzed for low-cost FPGA implementation. They are evaluated in terms of parameter size, accuracy, execution time, and resource utilization on the FPGA. The results show that an overall execution time of an rODENet variant is improved by up to 2.66 times compared to a pure software execution while keeping a comparable accuracy to the original ODENet.

  • Low-Latency Low-Energy Memory-Cube Networks using Dual-Voltage Datapaths

    Shikama Y., Kawano R., Matsutani H., Amano H., Nagasaka Y., Fukumoto N., Koibuchi M.

    Proceedings - 29th Euromicro International Conference on Parallel, Distributed and Network-Based Processing, PDP 2021 (Proceedings - 29th Euromicro International Conference on Parallel, Distributed and Network-Based Processing, PDP 2021)     143 - 147 2021年03月

    ISSN  9781665414555

     概要を見る

    Three-dimensional stack memory that provides both high-bandwidth access and large capacity is a promising technology for next-generation computer systems. While a large number of memory cubes increase the aggregate memory capacity, the communication latency and power consumption would become significant due to its low-radix large-diameter packet network. In this context, we propose a memory-cube network called Diagonal Memory Network (DMN). A diagonal network topology, its floor layout, and its lightweight router are designed for low-latency and low-voltage memory-read communication. Our evaluation results show that a DMN router decreases 31% of the hardware resources than a conventional virtual-channel router. The DMN router reduces 13% and 67% energy consumption to transit a packet along with the original datapath and bypassing datapath, respectively.

  • An On-Device Federated Learning Approach for Cooperative Model Update between Edge Devices

    Ito R., Tsukada M., Matsutani H.

    IEEE Access (IEEE Access)  9   92986 - 92998 2021年

     概要を見る

    Most edge AI focuses on prediction tasks on resource-limited edge devices while the training is done at server machines. However, retraining or customizing a model is required at edge devices as the model is becoming outdated due to environmental changes over time. To follow such a concept drift, a neural-network based on-device learning approach is recently proposed, so that edge devices train incoming data at runtime to update their model. In this case, since a training is done at distributed edge devices, the issue is that only a limited amount of training data can be used for each edge device. To address this issue, one approach is a cooperative learning or federated learning, where edge devices exchange their trained results and update their model by using those collected from the other devices. In this paper, as an on-device learning algorithm, we focus on OS-ELM (Online Sequential Extreme Learning Machine) to sequentially train a model based on recent samples and combine it with autoencoder for anomaly detection. We extend it for an on-device federated learning so that edge devices can exchange their trained results and update their model by using those collected from the other edge devices. This cooperative model update is one-shot while it can be repeatedly applied to synchronize their model. Our approach is evaluated with anomaly detection tasks generated from a driving dataset of cars, a human activity dataset, and MNIST dataset. The results demonstrate that the proposed on-device federated learning can produce a merged model by integrating trained results from multiple edge devices as accurately as traditional backpropagation based neural networks and a traditional federated learning approach with lower computation or communication cost.

全件表示 >>

KOARA(リポジトリ)収録論文等 【 表示 / 非表示

総説・解説等 【 表示 / 非表示

  • ビッグデータ利活用のための基盤システムの動向

    松谷 宏紀

    電子情報通信学会誌 100 ( 8 ) 866 - 870 2017年08月

    総説・解説(学術雑誌), 単著

研究発表 【 表示 / 非表示

  • An On-Device Learning Approach for Unsupervised Anomaly Detection

    Hiroki Matsutani

    International Forum on MPSoC for Software-defined Hardware (MPSoC'19), 2019年07月, 口頭(招待・特別)

  • オンデバイス学習による教師無し異常検知ハード ウェアとその応用

    松谷 宏紀

    LSIとシステムのワークショップ2019, 2019年05月, 口頭(招待・特別)

  • オンライン逐次学習による教師無し異常検知とその応用

    松谷 宏紀

    情報処理学会システム・アーキテクチャ研究会 (2018年12月), 2018年12月, 口頭(招待・特別)

  • An Environmentally Adaptive Anomaly Detection Method for Edge Devices

    Hiroki Matsutani

    International Symposium on Computing and Networking (CANDAR'18) Workshop, 2018年11月, 口頭(招待・特別)

  • エッジ学習による環境適応型異常検知と実社会への応用

    松谷 宏紀

    Design Solution Forum 2018, 2018年09月, 口頭(招待・特別)

全件表示 >>

競争的資金等の研究課題 【 表示 / 非表示

  • リアルタイム性と全データ性を両立するエッジ学習基盤

    2017年10月
    -
    2020年03月

    科学技術振興機構, 戦略的基礎研究推進事業(CREST), 松谷 宏紀, 受託研究,  代表

  • 多様な構造型ストレージ技術を統合可能な再構成可能データベース技術

    2013年10月
    -
    2017年03月

    科学技術振興機構, 戦略的創造研究推進事業さきがけプログラム, 松谷 宏紀, 受託研究,  代表

  • ワイヤレス3次元ネットワークオンチップの最適化

    2011年10月
    -
    2013年03月

    日本学術振興会, 科学研究費補助金(文部科学省・日本学術振興会), 松谷 宏紀, 補助金,  代表

受賞 【 表示 / 非表示

  • 情報処理学会 マイクロソフト情報学研究賞

    松谷 宏紀, 2018年03月

    受賞区分: 国内学会・会議・シンポジウム等の賞

  • ACM Recognition of Service Award

    Hiroki Matsutani, 2018年01月

    受賞区分: 国内外の国際的学術賞

  • 電子情報通信学会 情報・システムソサイエティ 査読功労賞

    松谷 宏紀, 2017年06月

    受賞区分: 国内学会・会議・シンポジウム等の賞

  • Best Paper Award, International Symposium on Computing and Networking (CANDAR'16)

    Ryuta Kawano, Hiroshi Nakahara, Ikki Fujiwara, Hiroki Matsutani, Michihiro Koibuchi, Hideharu Amano, 2016年11月, LOREN: A Scalable Routing Method for Layout-conscious Random Topologies

    受賞区分: 国内外の国際的学術賞

  • 情報処理学会 特選論文

    林 愛美, 徳差 雄太, 松谷 宏紀, 2016年08月, FPGA NIC向けノンパラメトリックオンライン外れ値検出機構

    受賞区分: 国内学会・会議・シンポジウム等の賞

全件表示 >>

 

担当授業科目 【 表示 / 非表示

  • VLSI設計演習

    2021年度

  • 情報工学輪講

    2021年度

  • 情報工学実験第2

    2021年度

  • 開放環境科学課題研究

    2021年度

  • 開放環境科学特別研究第2

    2021年度

全件表示 >>

担当経験のある授業科目 【 表示 / 非表示

  • 計算機基礎

    慶應義塾, 2018年度, 春学期, 専門科目, 講義, 専任, 1時間

  • 分散システム特論

    慶應義塾, 2018年度, 秋学期, 専門科目, 講義, 専任, 1時間

  • VLSI設計演習

    慶應義塾, 2018年度, 春学期, 専門科目, 演習, 専任, 1時間

  • 情報工学実験第2

    慶應義塾, 2018年度, 秋学期, 専門科目, 実習・実験, 兼担, 4時間

  • アルゴリズム第2

    慶應義塾, 2018年度, 春学期, 専門科目, 講義, 専任, 1時間

全件表示 >>

教育活動及び特記事項 【 表示 / 非表示

  • Open Cell Libraryを用いたデジタルVLSI設計, 電子情報通信学会2014年ソサイエティ大会, チュートリアル

    2014年09月

    , 教育方法・実践に関する発表、講演

 

所属学協会 【 表示 / 非表示

  • IEEE

     
  • 電子情報通信学会

     
  • 情報処理学会

     

委員歴 【 表示 / 非表示

  • 2019年08月
    -
    継続中

    Technical program committee, International Conference on Parallel Processing (ICPP)

  • 2019年07月

    Organizing committee (Local organization chair), International Forum on MPSoC for Software-defined Hardware (MPSoC)

  • 2018年10月

    ACM Student Research Competition selection committee, International Symposium on Microarchitecture (MICRO)

  • 2018年04月
    -
    継続中

    Organizing committee (Secretary), IEEE Symposium on Low-Power and High-Speed Chips and Systems (COOL Chips)

  • 2018年02月

    Guest editor, IEICE Transactions on Information and Systems, Special Section on Reconfigurable Systems

全件表示 >>