最適輸送のお話
メリー・クリスマス!!この記事は、「日曜数学Advent Calendar 2023」の24日目の記事です。
昨日23日目の記事は、Seiichi Manyamaさんの「n 次多項式の判別式の項数」でした。
はじめに
今年の日曜数学Advent Calendarは、最適輸送のお話をさせて頂きます。
最適輸送とは?
最適輸送とは、その名の通り、複数の地点にある資源を、需要のある地点にいかに効率よく運ぶかを考える、物資輸送問題として18世紀頃から研究されていたものだそうです。その後、経済資源の割当や、流体力学の理論に応用されるようになり、さらにはコンピュータサイエンスの世界でも登場するようになりました。
特に、機械学習の世界では、確率分布と確率分布を比較するためのツールとして利用されています。ここで、確率分布としてはヒストグラム、点群、連続分布(経験分布で近似)などが扱われます。
KLダイバージェンスとの比較
機械学習に詳しい方はご存知のとおり、確率分布と確率分布を比較するものとして有名なのはKL(カルバック=ライブラー)ダイバージェンスです。参考までに離散分布におけるKLダイバージェンスについて下記します。KLダイバージェンスは、最尤推定を行う場面などで現れます。
- 離散分布におけるKLダイバージェンス
ただし、とし、あるにおいてである場合は とする。
機械学習を行う場合、分布を近付けたい対象との比較方法として、このKLダイバージェンスにはない最適輸送の利点がいくつかあります。その中でも、「適切な仮定の下で距離の公理を満たす」というものがあります。ここで距離の公理を復習してみましょう。
距離の公理
を集合とする。関数が、任意のに対して以下をすべて満たすとき、は上の距離であるという
- (1).(非負性)
- (2).(同一性)
- (3).(対称性)
- (4).(三角不等式)
これら4つの条件を距離の公理という(ただし、(1)は(2),(3),(4)から導くことができる)。
KLダイバージェンスは、上記の式を見て頂ければ明らかですが、一般には(3)対称性も、(4)三角不等式も満たさないので、距離の公理を満たしません。
最適輸送とWasserstein距離
点群の最適輸送問題を線型計画問題として定式化すると、 と表される。ここではそれぞれ輸送元と輸送先の点に対する重みベクトル、はそれぞれの確率分布、は実行可能解の集合、Cはコスト行列、Pは輸送行列で、は行列の要素同士を掛けた和である。
なお、輸送元の各点から輸送先の重みで輸送すれば制約を満たすので、は実行可能解になります。
最適輸送コスト自体は、最適輸送距離とも呼ばれますが、距離の公理を満たしません。例えば、コスト行列Cが0行列の場合には任意の輸送行列Pが解となり、同一性を満たさないからです。
そこで、距離の公理を満たす最適輸送距離として、以下のようなWasserstein距離を紹介します。
上の距離関数と実数について、と定義する。このとき、について をとのp-Wasserstein距離といいます
この(p-)Wasserstein距離は、距離の公理を満たします。点群に関する証明は参考文献に載っているのでご参照ください。
おわりに
今回は最適輸送とWasserstein距離の話を書かせて頂きました。 Wasserstein距離は、何か色々使えそうな予感がするので、もう少し勉強したいなと思っています。
それでは、みなさま、良いクリスマスを!!
参考文献
[1] 佐藤竜馬 著, 「最適輸送の理論とアルゴリズム」, 講談社