onewanのメモ帳

数式が書きたくて始めたブログ。twitter IDは @onewan

最適輸送のお話

メリー・クリスマス!!この記事は、「日曜数学Advent Calendar 2023」の24日目の記事です。

adventar.org

昨日23日目の記事は、Seiichi Manyamaさんの「n 次多項式の判別式の項数」でした。

manchanr6.blogspot.com

はじめに

 今年の日曜数学Advent Calendarは、最適輸送のお話をさせて頂きます。

最適輸送とは?

 最適輸送とは、その名の通り、複数の地点にある資源を、需要のある地点にいかに効率よく運ぶかを考える、物資輸送問題として18世紀頃から研究されていたものだそうです。その後、経済資源の割当や、流体力学の理論に応用されるようになり、さらにはコンピュータサイエンスの世界でも登場するようになりました。

 特に、機械学習の世界では、確率分布と確率分布を比較するためのツールとして利用されています。ここで、確率分布としてはヒストグラム、点群、連続分布(経験分布で近似)などが扱われます。

KLダイバージェンスとの比較

 機械学習に詳しい方はご存知のとおり、確率分布と確率分布を比較するものとして有名なのはKL(カルバック=ライブラー)ダイバージェンスです。参考までに離散分布におけるKLダイバージェンスについて下記します。KLダイバージェンスは、最尤推定を行う場面などで現れます。

ただし、 0 \log 0 =0とし、あるi \in \{1,2, \cdots , n \}において a_i >0 \wedge b_i = 0である場合は  KL(a || b) = \inftyとする。

 機械学習を行う場合、分布を近付けたい対象との比較方法として、このKLダイバージェンスにはない最適輸送の利点がいくつかあります。その中でも、「適切な仮定の下で距離の公理を満たす」というものがあります。ここで距離の公理を復習してみましょう。

距離の公理

 Xを集合とする。関数 d: X \times X \rightarrow \mathbb{R}が、任意の x,y,z \in Xに対して以下をすべて満たすとき、 d X上の距離であるという
- (1).(非負性)  d(x,y) \ge 0
- (2).(同一性)  d(x,y) = 0 \Leftrightarrow x = y
- (3).(対称性)  d(x,y)=d(y,x)
- (4).(三角不等式)  d(x,z) + d(z,y) \ge d(x,y)

これら4つの条件を距離の公理という(ただし、(1)は(2),(3),(4)から導くことができる)。

KLダイバージェンスは、上記の式を見て頂ければ明らかですが、一般には(3)対称性も、(4)三角不等式も満たさないので、距離の公理を満たしません。

最適輸送とWasserstein距離

点群の最適輸送問題を線型計画問題として定式化すると、 OT( \alpha, \beta ,C) :=  \displaystyle \min_{P \in \mathcal{U} (a,b)}  \langle C,P \rangleと表される。ここで a,bはそれぞれ輸送元と輸送先の点に対する重みベクトル、 \alpha, \betaはそれぞれ a,bの確率分布、 \mathcal{U}(a,b)は実行可能解の集合、Cはコスト行列、Pは輸送行列で、 \langle . \rangleは行列の要素同士を掛けた和である。

なお、輸送元の各点から輸送先の重みで輸送すれば制約を満たすので、 a {b}^{T}は実行可能解になります。

最適輸送コスト自体は、最適輸送距離とも呼ばれますが、距離の公理を満たしません。例えば、コスト行列Cが0行列の場合には任意の輸送行列Pが解となり、同一性を満たさないからです。

そこで、距離の公理を満たす最適輸送距離として、以下のようなWasserstein距離を紹介します。

 \mathcal{X}上の距離関数d:  \mathcal{X} \times  \mathcal{X} \rightarrow \mathbb{R}と実数 p \ge 1について、 C(x,y) = {d(x,y)}^pと定義する。このとき、 \alpha, \beta \in \mathcal{P}( \mathcal{X})について  W_p(\alpha, \beta) := OT(\alpha, \beta ,C)^{1/p} \alpha \betaのp-Wasserstein距離といいます

この(p-)Wasserstein距離は、距離の公理を満たします。点群に関する証明は参考文献に載っているのでご参照ください。

おわりに

今回は最適輸送とWasserstein距離の話を書かせて頂きました。 Wasserstein距離は、何か色々使えそうな予感がするので、もう少し勉強したいなと思っています。

それでは、みなさま、良いクリスマスを!!

参考文献

[1] 佐藤竜馬 著, 「最適輸送の理論とアルゴリズム」, 講談社