【DX時代の物流】「確率・統計」が物流業界に何をもたらすのか?|ベイズ統計のススメ

2021年8月31日

昨今、すべてのビジネスマン、ビジネスウーマンに統計スキルは必須だと言われています。

過去の経験や勘に頼るビジネス判断は古臭く、データで証拠を見せろという時代になっているからです。

社会人向けの統計学に関する本もたくさん出版されています。

ところが、物流業界では統計スキルがあまり重要視されません。

勿論、物流では大量のデータを扱いますのでデータ分析は古くからされています。

しかしそれは平均を計算したりグラフにしてみるくらいで、推定や検定回帰相関など統計学の本質に関わる部分については活用されていません。

 

また、統計と一緒に語られることの多い確率論についても、物流の世界で活用されているとは言えません。

物流では天候、交通事情、利害関係者の人為ミスなど様々なリスクがあります。

確率理論はそれらのリスクを定量化して意思決定を助けるため、非常に重要なはずなのですが、ほとんど活用されていません。

本当に必要ないのでしょうか?

 

統計論

統計には、大きく分けて3種類あります。

データを集めて表やグラフを作り、平均や傾向を見ることでデータの特徴を把握するという統計を古典統計(記述統計)と呼びます。

母集団から標本を抜き取って、その標本特性から母集団の特性を推測して、それが正しいかどうかを検定する統計を推測統計と呼びます。

始めに直観で決めた事前確率を基に、新しく得られたデータから新たな事後確率を次々と更新していく統計をベイズ統計と呼びます。

 

古典統計

まず古典統計から見ていきましょう。

ここに2つの商品Aと商品Bがあるとします。

先月の毎日の売上個数の平均を計算すると、商品Aは100個、商品Bは80個でした。

この会社では、すべての商品について常に1週間分の在庫を持つようにしています。

従って、商品Aは700個、商品Bは560個の在庫水準に設定しています。

本当にこれで大丈夫でしょうか?

 

ここでの問題は、売上の平均は考慮していても、ばらつきは考慮されていないことです。

極端な話し、商品Aは毎日コンスタントに100個売れていて、商品Bは1個も売れない日もあれば、160個売れる日もあるかもしれません。

そのような場合、商品Bの方が多くの在庫が必要なのは明らかです。

ところが、このような在庫管理をしている会社は数多く存在します。

 

これを統計的に解決するとこうなります。

まず、平均だけでなく標準偏差も計算します。

平均と標準偏差が分かれば、下図における山の頂上と位置と、山の広がり具合がわかります。

すると標準正規分表から、どれだけの在庫を持っておけば品切れするリスクは何%かということが統計的にわかります。

>> 【標準偏差の気持ち】標準正規分布表の使い方をわかりやすい言葉で徹底解説

 

それによって在庫数を設定することになります。

つまり、一律1週間というように在庫日数を決めるのではなく、売上のばらつきを考慮しながら商品ごとに在庫日数を設定するのです。

 

これだけではありません。

物流の世界では、平均は計算するけれども標準偏差は考慮しないケースがほとんどです。

また古典統計には、ある変数と別の変数との間に相関があるかとか、ある場合にはどのような計算式で両者が関係付けられるかという回帰分析も含まれます。

メーカーの生産現場の行われる品質管理では、このような分析は日常的に行われていますが、物流でもそれを真似した品質管理や改善活動を行っている会社もあります。

また需給調整をする部門でも、天候と売上の相関を調べたり、他商品の売上との相関を調べたりしているケースもあります。

これも小売り業界がやっていた手法を真似して使っていると言えます。

つまり、他業界で開発された手法を真似しているケースはあっても、物流業界オリジナルではあまり適用例がないということです。

>> 物流数学の基礎 >> 古典統計

 

推測統計

次に推測統計の分野はどうでしょうか?

こちらは更に適用例がないと言うか、そもそもニーズがないとも言えます。

作業品質管理の分野では、母集団を全数チェックするだけのコストを掛けられないために、やむなくサンプルチェックの結果から母集団の品質度合を推定することは時々行われます。

しかし、それ以外ではサンプル(標本)から母集団の性質を推定するというニーズは、物流業界にはあまりないように思われます。

こちらは区間推定を無理やり適用した事例です。

>> タイヤの摩耗を【区間推定】する方法を具体例でわかりやすく解説します。

>> 【具体例でわかりやすく!】区間推定は何に使えるの?|燃費推定で実演します。

 

一方、推測統計の使い方の一つとして、ある施策の有効性を判断するために2つのグループに分け、1つのグループには施策を実行し、もう1つのグループには実行せずに、両者の結果を比較するという仮説検定があります。

ある集団とある集団に差があるかを知りたいのに、差がないという反対の仮説(帰無仮説)を立て、差がないことは滅多に起きないので差がないという仮説は棄却された

という非常に回りくどいやり方で検定するのですが、物流業界ではそんな面倒なことは抜きにして、

良くなるに決まってんだから早く進めろ

で済ませてしまっている感じです。

これについては、ニーズはあるが物流業界は旧態依然としているため、適用が進んでいないと言うことができるでしょう。

仮説検定の適用事例はこちら。

>> z検定の使い方|改善効果をz検定で検証する方法を具体例でわかりやすく解説します。

>> 【対応がある2郡】改善効果をt検定で検証する方法を具体例でわかりやすく解説します。

>> 【Welchのt検定】改善効果をt検定で検証する方法を具体例でわかりやすく解説します。

>> 【具体例でわかりやすく!】カイ二乗検定は何に使えるの?|出荷傾向の区分けを実演

>> 【具体例でわかりやすく解説!】F検定は何に使えるの?|商品分類の仕方で実演

 

ベイズ統計

最後にベイズ統計です。

これについては別の記事でじっくり解説する予定ですが、これから物流の世界で広く適用されていく可能性が非常に高い統計理論です。

前の2つの統計理論は得られたデータの特徴を調べたり、標本サンプルから母集団の性質を推定したりするのに用いられます。

対して、ベイズ統計は確率を新しく得られたデータによって次々に更新していくという使い方をします。

そのため、様々なデータが容易に得られるビッグデータの時代に即していると言えます。

 

物流業界ではないのですが、身近な適用例としてスパムメールの判定に使われています。

怪しいメールが来るとメールソフトによって

「怪しいと思われるメールを受信しました。スパムとしますか?それとも正常なメールですか?選択して下さい」

というメッセージが送られてきますが、この時

「スパムとして下さい」

を選択すると、そのメールに含まれる言葉によって、各キーワードに対するスパムの可能性が更新されます。

これを繰り返すことによって、各キーワードの組み合わせによるスパムメールの判定の精度が上がっていくのです。

 

物流への応用例としては、船便の到着日の予測が考えられます。

船便というのは、よく遅れますね。

直行便でなく、どこかの港での積み替えがある経由便では、嫌になるほどよく遅れます。

また、船会社によってもよく遅れる会社と、あまり遅れない会社があります。

各船会社のスケジュールとリードタイムの実績についてのデータが取れれば、逐次新しいデータで定時到着する確率を更新していけます。

この時、単に定時到着する確率は80%というような単純なものではなく、リードタイムの確率分布まで更新できれば、顧客は

「この便は遅れるが、2日遅れで到着する確率が95%以上あるので、納期には問題ないな」

というような判断ができます。

また、この考え方は適正在庫コントロールにも応用ができ、今後適用事例が出てくると思われます。

 

確率分布の適用事例についての記事はこちら >> 確率分布

ベイズ統計についての記事はこちら >> Excelで機械学習/ベイス推定

 

確率論

ビジネスにはリスクがつきものです。

物流の世界では特に、自ら制御できないアンコントローラブルなリスクが多いと言えます。

確率理論はこれらのリスクを定量化できます。

確率というと、あることが起きる確率は何%という使い方を思い浮かべます。

しかし、確率理論ではある特定の事象についての確率だけを考えるのではなく、その周りの事象の確率も含めて確率分布という捉え方をします。

よく出てくる正規分布も確率分布の一つです。

このような捉え方をすることによって、ある事象が達成不可能ということが分かった場合でも、どんな代替手段を取ることにより何%の確率でリカバリー可能かということが分かります。

つまり代替手段を合理的に判断できるようになるわけです。

合理的に判断できるということは、システム化も可能ということです。

このように確率論はアンコントローラブルなリスクが多い物流業界では実に適用範囲が広いと思うのですが、残念なことに余り注目されていません。

先に出てきたベイズ統計は統計論というよりは確率論に近く、今後この分野の適用事例が物流業界に広がっていくのは時間の問題だと思います。

 

まとめ

統計学はビジネスに必須と言われていますが、物流業界で役に立つ分野は下記に限られると思われます。

  1. データの特徴を分析する古典統計
  2. 推測統計の一つである仮説検定
  3. ビッグデータからリスクを定量化できるベイズ統計

これらのうち1はある程度されていますが、データのばらつきを表す標準偏差の更なる活用が望まれます。

2は適用できるのにされていない面がありますので、勉強する必要があると思います。

ただし、適用しなくてもそれほど痛手はないでしょう。

3も適用できるのにされていないという面では2と同じですが、こちらは今後やる会社とやらない会社とで競争力に差が付くほど重要になっていくと思われます。