榊原 康文 (サカキバラ ヤスブミ)

Sakakibara, Yasubumi

写真a

所属(所属キャンパス)

理工学部 生命情報学科 (矢上)

職名

教授

メールアドレス

メールアドレス

HP

外部リンク

経歴 【 表示 / 非表示

  • 1985年04月
    -
    1996年03月

    (株)富士通研究所情報社会科学研究所 ,研究員

  • 1992年06月
    -
    1993年06月

    兼 米国カリフォルニア大学サンタクルーズ校 ,客員研究員

  • 1996年04月
    -
    2001年09月

    東京電機大学理工学部情報科学科 ,助教授

  • 2001年10月
    -
    2002年03月

    東京電機大学理工学部情報科学科 ,教授

  • 2002年04月
    -
    2005年03月

    慶應義塾大学理工学部生命情報学科 ,助教授

全件表示 >>

学歴 【 表示 / 非表示

  • 1983年03月

    東京工業大学, 理学部, 情報科学科

    大学, 卒業

  • 1985年03月

    東京工業大学, 理工学研究科, 情報科学専攻

    大学院, 修了, 修士

学位 【 表示 / 非表示

  • 理学, 東京工業大学, 1991年10月

 

研究分野 【 表示 / 非表示

  • 生命・健康・医療情報学

  • 生命・健康・医療情報学 (バイオインフォマティクス)

  • システムゲノム科学

研究キーワード 【 表示 / 非表示

  • がんゲノム

  • バイオインフォマティクス

研究テーマ 【 表示 / 非表示

  • ビッグデータ解析, 

    2012年04月
    -
    継続中

  • がんゲノム解析, 

    2010年04月
    -
    継続中

  • 機能性RNA配列解析, 

    2002年04月
    -
    継続中

 

著書 【 表示 / 非表示

  • 情報数理シリーズ「計算論的学習」

    榊原康文,小林聡,横森貴, 培風館, 2001年10月

     概要を見る

    コンピュータに学習能力を持たせることを目的とする人工知能分野における機械学習の理論を解説する日本ではじめての教科書.

  • DNAコンピューティング

    Paun, Rozenberg, Salomaa 著,横森貴, 榊原康文, 小林聡 訳, シュプリンガー・フェアラーク東京, 1999年12月

     概要を見る

    DNAコンピュータに関するはじめての教科書.形式言語理論に基づいたDNAコンピュータの理論に関する研究を中心に書かれている.

  • 新版 情報処理ハンドブック

    情報処理学会偏,13編6章の「学習」に関する節を分担執筆, オーム社, 1995年11月

     概要を見る

    情報処理に関するすべての分野をカバーするハンドブック.

論文 【 表示 / 非表示

  • Convolutional neural network based on SMILES representation of compounds for detecting chemical motif

    Hirohara M., Saito Y., Koda Y., Sato K., Sakakibara Y.

    BMC Bioinformatics (BMC Bioinformatics)  19 2018年12月

     概要を見る

    © 2018 The Author(s). Background: Previous studies have suggested deep learning to be a highly effective approach for screening lead compounds for new drugs. Several deep learning models have been developed by addressing the use of various kinds of fingerprints and graph convolution architectures. However, these methods are either advantageous or disadvantageous depending on whether they (1) can distinguish structural differences including chirality of compounds, and (2) can automatically discover effective features. Results: We developed another deep learning model for compound classification. In this method, we constructed a distributed representation of compounds based on the SMILES notation, which linearly represents a compound structure, and applied the SMILES-based representation to a convolutional neural network (CNN). The use of SMILES allows us to process all types of compounds while incorporating a broad range of structure information, and representation learning by CNN automatically acquires a low-dimensional representation of input features. In a benchmark experiment using the TOX 21 dataset, our method outperformed conventional fingerprint methods, and performed comparably against the winning model of the TOX 21 Challenge. Multivariate analysis confirmed that the chemical space consisting of the features learned by SMILES-based representation learning adequately expressed a richer feature space that enabled the accurate discrimination of compounds. Using motif detection with the learned filters, not only important known structures (motifs) such as protein-binding sites but also structures of unknown functional groups were detected. Conclusions: The source code of our SMILES-based convolutional neural network software in the deep learning framework Chainer is available at http://www.dna.bio.keio.ac.jp/smiles/ , and the dataset used for performance evaluation in this work is available at the same URL.

  • A max-margin training of RNA secondary structure prediction integrated with the thermodynamic model

    Akiyama M., Sato K., Sakakibara Y.

    Journal of Bioinformatics and Computational Biology (Journal of Bioinformatics and Computational Biology)  16 ( 6 )  2018年12月

    ISSN  02197200

     概要を見る

    © 2018 World Scientific Publishing Europe Ltd. A popular approach for predicting RNA secondary structure is the thermodynamic nearest-neighbor model that finds a thermodynamically most stable secondary structure with minimum free energy (MFE). For further improvement, an alternative approach that is based on machine learning techniques has been developed. The machine learning-based approach can employ a fine-grained model that includes much richer feature representations with the ability to fit the training data. Although a machine learning-based fine-grained model achieved extremely high performance in prediction accuracy, a possibility of the risk of overfitting for such a model has been reported. In this paper, we propose a novel algorithm for RNA secondary structure prediction that integrates the thermodynamic approach and the machine learning-based weighted approach. Our fine-grained model combines the experimentally determined thermodynamic parameters with a large number of scoring parameters for detailed contexts of features that are trained by the structured support vector machine (SSVM) with the ℓ1 regularization to avoid overfitting. Our benchmark shows that our algorithm achieves the best prediction accuracy compared with existing methods, and heavy overfitting cannot be observed. The implementation of our algorithm is available at https://github.com/keio-bioinformatics/mxfold.

  • Time-Series Analysis of Tumorigenesis in a Murine Skin Carcinogenesis Model

    Aoto Y., Okumura K., Hachiya T., Hase S., Wakabayashi Y., Ishikawa F., Sakakibara Y.

    Scientific Reports (Scientific Reports)  8 ( 1 )  2018年12月

     概要を見る

    © 2018, The Author(s). Recent years have witnessed substantial progress in understanding tumor heterogeneity and the process of tumor progression; however, the entire process of the transition of tumors from a benign to metastatic state remains poorly understood. In the present study, we performed a prospective cancer genome-sequencing analysis by employing an experimental carcinogenesis mouse model of squamous cell carcinoma to systematically understand the evolutionary process of tumors. We surgically collected a part of a lesion of each tumor and followed the progression of these tumors in vivo over time. Comparative time-series analysis of the genomes of tumors with different fates, i.e., those that eventually metastasized and regressed, suggested that these tumors acquired and inherited different mutations. These findings suggest that despite the occurrence of an intra-tumor selection event for malignant alteration during the transformation from early- to late-stage papilloma, the fate determination of tumors might be determined at an even earlier stage.

  • Convolutional neural networks for classification of alignments of non-coding RNA sequences

    Aoki G., Sakakibara Y.

    Bioinformatics (Bioinformatics)  34 ( 13 ) i237 - i244 2018年07月

    ISSN  13674803

     概要を見る

    © The Author(s) 2018. Published by Oxford University Press. All rights reserved. Motivation: The convolutional neural network (CNN) has been applied to the classification problem of DNA sequences, with the additional purpose of motif discovery. The training of CNNs with distributed representations of four nucleotides has successfully derived position weight matrices on the learned kernels that corresponded to sequence motifs such as protein-binding sites. Results: We propose a novel application of CNNs to classification of pairwise alignments of sequences for accurate clustering of sequences and show the benefits of the CNN method of inputting pairwise alignments for clustering of non-coding RNA (ncRNA) sequences and for motif discovery. Classification of a pairwise alignment of two sequences into positive and negative classes corresponds to the clustering of the input sequences. After we combined the distributed representation of RNA nucleotides with the secondary-structure information specific to ncRNAs and furthermore with mapping profiles of next-generation sequence reads, the training of CNNs for classification of alignments of RNA sequences yielded accurate clustering in terms of ncRNA families and outperformed the existing clustering methods for ncRNA sequences. Several interesting sequence motifs and secondary-structure motifs known for the snoRNA family and specific to microRNA and tRNA families were identified.

  • DEclust: A statistical approach for obtaining differential expression profiles of multiple conditions

    Y. Aoto, T. Hachiya, K. Okumura, S. Hase, K. Sato, Y. Wakabayashi, 榊原 康文

    PLoS One 12-11   e0188285 2017年

    研究論文(学術雑誌), 共著, 査読有り

全件表示 >>

KOARA(リポジトリ)収録論文等 【 表示 / 非表示

全件表示 >>

総説・解説等 【 表示 / 非表示

研究発表 【 表示 / 非表示

  • MetaVelvet : An extension of Velvet assembler to de novo metagenome assembly from short sequence reads

    榊原 康文

    ACM Conference on Bioinformatics, Computational Biology and Biomedicine 2011 (Chicago, USA) , 2011年08月, 口頭(一般)

  • Comprehensive analysis of small non-coding RNAs in medaka transcriptome by deep RNA-seq approach

    榊原 康文

    RNA 2011 Sixteenth Annual Meeting of the RNA Society (Kyoto, Japan) , 2011年06月, 口頭(一般)

  • Genome-wide detections of non-coding RNAs on Ciona intestinalis genome: from in silico search of snoRNA to full-length sequencing and expression analysis

    Kawarama, J., Hase, S., Hachiya, T., Hotta, K., Sakakibara, Y.

    5th International Tunicate Meeting (Okinawa, Japan) , 2009年06月, 口頭(一般)

  • Discriminative Detection of Cis-acting Regulatory Variation from Location Data

    Yuji Kawada, Yasubumi Sakakibara

    The 4th Asia-Pacific Bioinformatics Conference (APBC2006), Taiwan (Taiwan) , 2006年02月, 口頭(一般)

  • Intensive in vitro experiments of implementing and executing finite automata in test tube

    Junna Kuramochi and Yasubumi Sakakibara

    The 11th International Meeting on DNA Based Computers (DNA11), London, Ontario (London, Ontario) , 2005年06月, 口頭(一般)

全件表示 >>

競争的資金等の研究課題 【 表示 / 非表示

  • 非コードRNA遺伝子をゲノムワイドに発見する汎用システム

    2018年04月
    -
    2023年03月

    文部科学省・日本学術振興会, 科学研究費助成事業, 榊原 康文, 基盤研究(A), 補助金,  代表

  • 人工知能を用いた化学コミュニケーション空間の多様性と共通性の解明

    2017年06月
    -
    2022年03月

    文部科学省・日本学術振興会, 科学研究費助成事業, 榊原 康文, 新学術領域研究(研究領域提案型), 補助金,  代表

  • ビッグデータ駆動型創薬システム研究拠点

    2014年
    -
    2018年

    戦略的研究基盤形成支援事業, 榊原康文, 代表

  • 発がんゲノムにおける非コードRNAの網羅的機能解析

    2011年
    -
    2014年

    科学研究費補助金(文部科学省・日本学術振興会), 榊原康文, 代表

  • ゲノム科学の総合的推進に向けた大規模ゲノム情報生産・高度情報解析支援

    2010年
    -
    2015年

    科学研究費補助金(文部科学省・日本学術振興会), 小原雄治, 分担

全件表示 >>

知的財産権等 【 表示 / 非表示

  • 核酸分子を用いた新規な情報解析方法およびそれを用いた核酸の解析方法

    特願: 特願2000-382449  2000年12月 

    特許

  • Data Sorting,Data Sorting Tree Creating,Derivative

    特許: United State Patent,No.5787426  1998年07月

    特許, PCT国際出願

受賞 【 表示 / 非表示

  • 東京電機大学研究振興会 教育奨励賞

    榊原 康文, 1999年, 東京電機大学研究振興会, 「プログラム言語のマルチメディア教育」

 

担当授業科目 【 表示 / 非表示

  • 基礎理工学課題研究

    2019年度

  • 基礎理工学特別研究第2

    2019年度

  • 基礎理工学特別研究第1

    2019年度

  • 生命情報総合演習第2

    2019年度

  • 生命情報総合演習第1

    2019年度

全件表示 >>

担当経験のある授業科目 【 表示 / 非表示

  • バイオインフォマティクス

    慶應義塾, 2015年度, 春学期, 専門科目, 講義, 兼担, 50人

  • 基礎生命実験

    慶應義塾, 2015年度, 秋学期, 専門科目, 実習・実験, 兼任, 50人

  • システムバイオロジー特論

    慶應義塾, 2015年度, 秋学期, 専門科目, 講義, 兼任, 50人

  • バイオプログラミング第2

    慶應義塾, 2015年度, 秋学期, 専門科目, 講義, 兼担, 50人

  • アルゴリズムと情報処理

    慶應義塾, 2015年度, 秋学期, 専門科目, 講義, 専任, 50人

全件表示 >>

 

社会活動 【 表示 / 非表示

  • 第8回 新しい RNA/RNP を見つける会

    2009年09月
  • 6th International Workshop on Algorithmic Learning

    1995年10月
    -
    継続中
  • (財)新世代コンピュータ技術開発機構 蛋白質立体構造予測タスクグループ

    1994年04月
    -
    1995年03月
  • 2nd,3rd,4th,5th,6th International Colloquium on Gr

    1994年
    -
    2002年
  • 5th,7th,8th,9th,11th International Workshop on Alg

    1994年
    -
    2000年

全件表示 >>

所属学協会 【 表示 / 非表示

  • 16th International Conference on DNA Computing and Molecular Programming, 

    2010年07月
  • ゲノムインフォマティクス国際会議, 

    2009年12月
  • 人工知能学会 人工知能基礎論研究会, 

    1998年04月
    -
    2002年03月
  • 情報処理学会 論文誌編集委員会, 

    1998年04月
    -
    2002年03月
  • 第44回情報処理学会全国大会 チュートリアルセッション 機械学習入門, 

    1992年
    -
    継続中

全件表示 >>

委員歴 【 表示 / 非表示

  • 2010年07月

    プログラム委員長, 16th International Conference on DNA Computing and Molecular Programming

  • 2009年12月

    大会委員長, ゲノムインフォマティクス国際会議

  • 2009年09月

    委員長, 第8回 新しい RNA/RNP を見つける会

  • 1998年04月
    -
    2002年03月

    幹事, 人工知能学会 人工知能基礎論研究会

  • 1998年04月
    -
    2002年03月

    委員, 情報処理学会 論文誌編集委員会

全件表示 >>