近年、量子ニューラルネットワーク(QNN)が従来の古典ニューラルネットワーク(cNN)の代替として注目されています。QNNはデータ処理や学習の効率を大幅に改善する可能性がありますが、実用性を伴った性能の理解が完全にはなされておらず、高性能なモデル設計の処方箋もありません。また、量子計算機を用いたモデルの学習を想定すると、古典計算機比で動作周波数が数万倍遅い点などが実用上の問題となります。
本研究では、NTK(Neural Tangent Kernel)理論を用いて解析的な設計が可能、かつ古典計算機で効率的なエミュレーション不能な(量子計算機で優位性が得られる可能性のある)量子-古典ハイブリッドモデルを提案し、数値実験により一般的な機械学習タスクにおいてその有効性を示しました。さらに、特徴量抽出部と学習部を分離したことで、実時間の動作効率の大幅な向上が可能になります。
本手法は、各国で精力的に開発が進められている、量子コンピュータ(QC)と高性能計算機(HPC)を融合したシステムにおける機械学習モデルの構築にも適用が期待されます。
今回、量子機械学習の領域で重要な問題として知られている3つの課題の解決を行いました。一つ目が、Barren plateau問題と呼ばれる勾配消失です。巨大なヒルベルト空間を用いてモデル構築を行うと表現力が高すぎるが故に、量子ビット数が増えるにつれて指数関数的に学習が困難になることが知られています。二つ目の問題が学習コストの問題です。勾配法を用いてモデルのパラメーターを学習する場合、多数の量子回路を実行する必要があり、量子計算機の周波数の遅さが直接的に計算時間に悪影響を及ぼします。まずこれらの問題を解決するために、提案手法では、量子回路を特徴量の抽出に特化させ、その極端な場合として量子回路部にモデルのパラメーターを持たない構造を採用しました。モデルのパラメーターをcNN部に集約することで、日々進歩する古典機械学習のモデル学習手法や古典計算機の高速化の恩恵を享受できます。三つ目の問題が汎化性能の問題です。NTK理論は学習誤差の収束を保証しますが、汎化性能は保証しません。さらに、本研究で用いた量子カーネルは、カーネルの表現力が高すぎると過学習を起こすことや、類似度消失と呼ばれる現象により汎化性能が低下することが知られていました。そこで本研究では、projected quantum kernel (PQK)と呼ばれる、過学習や類似度消失を回避しつつ、効率的な古典エミュレーションが不能なカーネルが自然に含まれるような手法を開発しました。具体的には、量子-古典ハイブリッドニューラルネットワークの出力がPQKの非線形変換となるようなモデルを構築し、量子カーネルの高い表現力と洗練された古典機械学習手法の両立が可能なことを、理論と数値実験の両面で示しました。今後は、より発展的な学習モデル(例えば、拡散モデルやTransformer)への適用や、大規模な系で産業的に重要なデータを用いた実証実験も期待されます。
■ 掲載論文
Quantum-classical hybrid neural networks in the neural tangent kernel regime – IOPscience