株式会社Rhelixaのプレスリリース

株式会社Rhelixa(本社:東京都中央区、代表取締役社長:仲木 竜、以下「当社」)は、この度DNAメチル化(*1)アレイ解析において必然的に生じる“測定条件によるデータの偏り(バッチ効果)”を補正する新手法「iComBat」を開発し、その成果をまとめた研究論文が生命科学分野の計算科学技術を専門に取り扱う国際学術誌であるComputational and Structural Biotechnology Journal(CSBJ)誌に採択されました。
本研究で提案する「iComBat」は、既存の補正済みデータを保持したまま新たに追加されたデータのみを補正できることを特徴としており、特に介入研究やコホート研究(*2)のように継続的なデータ収集を伴う研究領域において有効性を発揮します。さらに、段階的に新しいデータが追加されるケースにおいても、長期的な解析における信頼性と一貫性の確保に大きく貢献することが期待されます。
【研究概要】
本論文で提案している「iComBat」は、DNAメチル化アレイ解析において常に伴う課題である“バッチ効果“を補正する新しい方法です。バッチ効果とは、測定機器や試薬ロット、測定時期などの違いによってデータに系統的なズレが生じてしまう現象を指し、解析結果や解釈に大きく影響を与えます。従来広く用いられてきたバッチ効果の補正法である
ComBatは全データを同時に補正する方式のため、新しいデータを追加するとすでに補正済みのデータの結果まで変わってしまう問題がありました。
iComBatは「新しく追加されたデータのみ」を補正することでこの課題を解決し、すでに補正済みのデータの現状保持を可能にしています。シミュレーションおよび公開データを用いた検証では、精度は従来のComBatと同等の精度を保ちつつ、新規に追加されたデータのみの補正が可能であることが実証されました。提案手法であるiComBatは、特に、エピジェネティッククロック(*3)の介入前後差を測る研究のように、段階的にデータが集まる状況であり、かつ以前のデータを再補正することが好ましくないケースで大きな活用が期待されます。
【今後の展開】
本研究で開発された「iComBat」は、長期的にデータが積み上がる研究に有効であるため、継続的な測定が行われる自社サービス「エピクロック®テスト」の精度向上に向けた活用や、
エピジェネティッククロックの変化を対象とした縦断的研究への活用を想定しています。特に、
・食事や運動、環境などライフスタイル介入を伴う研究
・特定の集団について継続的にデータを収集解析するコホート研究
・サプリメントなど臨床介入を伴う研究
等の共同研究での活用も想定しています。
【研究内容と成果】
本研究では、DNAメチル化アレイデータのバッチ効果補正に広く用いられている手法であるComBatを拡張し、逐次的なバッチ効果補正手法iComBat( (incremental ComBat))を開発しました。
本提案手法は、すでに補正されたデータを再処理することなく、新たに追加されたデータのみを補正することを可能にします。
シミュレーション実験および複数のデータセットにおいて従来の手法とiComBatの比較を行った結果、ほぼ同等の補正能力が示唆されました。特に、アメリカ/フィリピンなど4つの独立したコホート研究から得られたデータセットに適用しエピジェネティッククロックを適用したところ、新しいバッチを追加すると従来法では既存サンプルのエピジェネティック年齢が変化してしまうものの、iComBatでは変化しないことが確認されました。
iComBatにより既存データを再補正することなく新たなデータを追加/解析することが出来るため、継続的な介入効果測定などに対して、より正確な評価が可能となることが期待されます。

(a) 全バッチを同時にComBatで補正したデータと、iComBatで逐次補正したデータから算出したエピジェネティック年齢の散布図。非常に高い相関係数を示した。
(b) 新しいバッチを逐次的に追加した際に、既存バッチのサンプルにおけるエピジェネティック年齢の変化を示す箱ひげ図。ComBatでは既存バッチのサンプルのエピジェネティック年齢が変化したものの、iComBatでは変化しなかった。
【掲載論文】
【題名】iComBat: An incremental framework for batch effect correction in DNA methylation array data
【著者名】塘 由惟, 仲木 竜
【掲載誌】Computational and Structural Biotechnology Journal
【掲載日】2025/9/19
【用語補足】
*1: DNAメチル化
DNA分子のシトシン塩基にメチル基が付加される化学的な修飾を指す。この修飾は、特にCpGサイトと呼ばれる特定の配列で頻繁に見られる。これまでの研究から、DNAメチル化は環境/加齢などで変化することが知られており、近年がんをはじめとしたさまざまな疾患の発症に大きく関与することが明らかになっている。
*2:コホート研究
特定の集団を長期間追跡調査し、健康状態の経時的な変化とその要因との関係を調べる研究手法。
*3:エピジェネティッククロック
DNAメチル化パターンに基づき、生物学的年齢を予測するモデル。
【本リリースに関するお問い合わせ先】
株式会社Rhelixa(レリクサ)広報
メール: press@rhelixa.com
【株式会社Rhelixa(レリクサ)について】
当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています

