物流業界で「確率」「統計」は不要なのか?必要性を考えてみた。

2022年11月6日

物流で「確率」「統計」は役立たずなのか?

昨今、すべてのビジネスマン、ビジネスウーマンに統計スキルは必須だと言われています。

過去の経験や勘に頼るビジネス判断は古臭く、データで証拠を見せろという時代になっているからです。

社会人向けの統計学に関する本もたくさん出版されています。

ところが、物流業界では統計スキルがあまり重要視されません。

勿論、物流では大量のデータを扱いますのでデータ分析は古くからされています。

しかしそれは平均を計算したりグラフにしてみるくらいで、推定や検定回帰相関など統計学の本質に関わる部分については活用されていません。

 

また、統計と一緒に語られることの多い確率論についても、物流の世界で活用されているとは言えません。

物流では天候、交通事情、利害関係者の人為ミスなど様々なリスクがあります。

確率理論はそれらのリスクを定量化して意思決定を助けるため、非常に重要なはずなのですが、ほとんど活用されていません。

本当に必要ないのでしょうか?

 

統計論の必要性を検証する

統計には、大きく分けて3種類あります。

データを集めて表やグラフを作り、平均や傾向を見ることでデータの特徴を把握するという統計を古典統計(記述統計)と呼びます。

母集団から標本を抜き取って、その標本特性から母集団の特性を推測して、それが正しいかどうかを検定する統計を推測統計と呼びます。

始めに直観で決めた事前確率を基に、新しく得られたデータから新たな事後確率を次々と更新していく統計をベイズ統計と呼びます。

 

極めて重要だが一部軽視されている「古典統計」

まず古典統計から見ていきましょう。

ここに2つの商品Aと商品Bがあるとします。

先月の毎日の売上個数の平均を計算すると、商品Aは100個、商品Bは80個でした。

この会社では、すべての商品について常に1週間分の在庫を持つようにしています。

従って、商品Aは700個、商品Bは560個の在庫水準に設定しています。

本当にこれで大丈夫でしょうか?

 

ここでの問題は、売上の平均は考慮していても、ばらつきは考慮されていないことです。

極端な話し、商品Aは毎日コンスタントに100個売れていて、商品Bは1個も売れない日もあれば、160個売れる日もあるかもしれません。

そのような場合、商品Bの方が多くの在庫が必要なのは明らかです。

ところが、このような在庫管理をしている会社は数多く存在します。

 

これを統計的に解決するとこうなります。

まず、平均だけでなく標準偏差も計算します。

平均と標準偏差が分かれば、下図における山の頂上と位置と、山の広がり具合がわかります。

すると標準正規分表から、どれだけの在庫を持っておけば品切れするリスクは何%かということが統計的にわかります。

【標準偏差を使えば確率が分かる】標準正規分布表の使い方をわかりやすく解説

 

それによって在庫数を設定することになります。

つまり、一律1週間というように在庫日数を決めるのではなく、売上のばらつきを考慮しながら商品ごとに在庫日数を設定するのです。

 

これだけではありません。

物流の世界では、平均は計算するけれども標準偏差は考慮しないケースがほとんどです。

また古典統計には、ある変数と別の変数との間に相関があるかとか、ある場合にはどのような計算式で両者が関係付けられるかという回帰分析も含まれます。

メーカーの生産現場の行われる品質管理では、このような分析は日常的に行われていますが、物流でもそれを真似した品質管理や改善活動を行っている会社もあります。

また需給調整をする部門でも、天候と売上の相関を調べたり、他商品の売上との相関を調べたりしているケースもあります。

これも小売り業界がやっていた手法を真似して使っていると言えます。

つまり、他業界で開発された手法を真似しているケースはあっても、物流業界オリジナルではあまり適用例がないということです。

 

他業界のモノ真似だからでしょうか?

本質を理解した運用がなされていない例が散見されます。

 

カイゼンで必須だが軽視されている「推測統計」

次に推測統計の分野はどうでしょうか?

メーカーの工場における品質管理では、母集団を全数チェックするだけのコストを掛けられないために、やむなくサンプルチェックの結果から母集団の品質度合を推定することは頻繁に行われます。

これは品質管理や生産管理の専門家でなくても、現場レベルの作業改善活動においても盛んに行われています。

物流では輸送においても倉庫においても、ある条件を変えてその効果を測定するために、サンプル測定してそこから全体の効果を推定したいという場面は多いと思うのですが、この分野に通じている人は少ないと思います。

こちらは区間推定を無理やり適用した事例です。

【区間推定の使い方】タイヤの摩耗を具体例にわかりやすく解説します。

 

【区間推定の使い方】t分布表を使って推定する方法をわかりやすく解説

 

一方、推測統計の使い方の一つとして、ある施策の有効性を判断するために2つのグループに分け、1つのグループには施策を実行し、もう1つのグループには実行せずに、両者の結果を比較するという仮説検定があります。

これもカイゼンのネタを見つけたり、効果を測定したりするのに必要なテクニックですが、あまり使われているようには思えません。

 

ある集団とある集団に差があるかを知りたいのに、差がないという反対の仮説(帰無仮説)を立て、差がないことは滅多に起きないので差がないという仮説は棄却された

という非常に回りくどいやり方で検定するのですが、物流業界ではそんな面倒なことは抜きにして、

良くなるに決まってんだから早く進めろ

で済ませてしまっている感じではないでしょうか。

これについては、ニーズはあるが物流業界は旧態依然としているため、適用が進んでいないと言うことができるでしょう。

仮説検定の適用事例はこちら。

>> z検定の使い方|改善効果をz検定で検証する方法を具体例でわかりやすく解説します。

>> 【対応がある2郡】改善効果をt検定で検証する方法を具体例でわかりやすく解説します。

>> 【Welchのt検定】改善効果をt検定で検証する方法を具体例でわかりやすく解説します。

>> 【具体例でわかりやすく!】カイ二乗検定は何に使えるの?|出荷傾向の区分けを実演

>> 【具体例でわかりやすく解説!】F検定は何に使えるの?|商品分類の仕方で実演

 

これからのビッグデータ時代に有望な「ベイズ統計」

最後にベイズ統計です。

これについては別の記事でじっくり解説する予定ですが、これから物流の世界で広く適用されていく可能性が非常に高い統計理論です。

前の推測統計で出てきた仮説検定は違いの有無をYESかNOで判断しますが、ベイズ統計では確率で表せます。

また、ベイズ統計は確率を新しく得られたデータによって次々に更新していくという使い方もします。

そのため、様々なデータが容易に得られるビッグデータの時代に即していると言えます。

 

物流業界ではないのですが、身近な適用例としてスパムメールの判定に使われています。

怪しいメールが来るとメールソフトによって

「怪しいと思われるメールを受信しました。スパムとしますか?それとも正常なメールですか?選択して下さい」

というメッセージが送られてきますが、この時

「スパムとして下さい」

を選択すると、そのメールに含まれる言葉によって、各キーワードに対するスパムの可能性が更新されます。

これを繰り返すことによって、各キーワードの組み合わせによるスパムメールの判定の精度が上がっていくのです。

ナイーブベイズ分類器の計算方法を具体例でわかりやすく解説します。

 

物流への応用例としては、船便の到着日の予測が考えられます。

船便というのは、よく遅れますね。

直行便でなく、どこかの港での積み替えがある経由便では、嫌になるほどよく遅れます。

また、船会社によってもよく遅れる会社と、あまり遅れない会社があります。

各船会社のスケジュールとリードタイムの実績についてのデータが取れれば、逐次新しいデータで定時到着する確率を更新していけます。

この時、単に定時到着する確率は80%というような単純なものではなく、リードタイムの確率分布まで更新できれば、顧客は

「この便は遅れるが、2日遅れで到着する確率が95%以上あるので、納期には問題ないな」

というような判断ができます。

また、この考え方は適正在庫コントロールにも応用ができ、今後適用事例が出てくると思われます。

 

確率分布の適用事例についての記事はこちら >> 確率分布の使い方

ベイズ統計についての記事はこちら >> ベイス統計の使い方

 

確率論の必要性を検証する

ビジネスにはリスクがつきものです。

物流の世界では特に、自ら制御できないアンコントローラブルなリスクが多いと言えます。

確率理論はこれらのリスクを定量化できます。

確率というと、あることが起きる確率は何%という使い方を思い浮かべます。

しかし、確率理論ではある特定の事象についての確率だけを考えるのではなく、その周りの事象の確率も含めて確率分布という捉え方をします。

よく出てくる正規分布も確率分布の一つです。

このような捉え方をすることによって、ある事象が達成不可能ということが分かった場合でも、どんな代替手段を取ることにより何%の確率でリカバリー可能かということが分かります。

つまり代替手段を合理的に判断できるようになるわけです。

合理的に判断できるということは、システム化も可能ということです。

このように確率論はアンコントローラブルなリスクが多い物流業界では実に適用範囲が広いと思うのですが、残念なことに余り注目されていません。

先に出てきたベイズ統計は統計論というよりは確率論に近く、今後この分野の適用事例が物流業界に広がっていくのは時間の問題だと思います。

 

まとめ

  1. 古典統計・・・ばらつきの重要性が認識されていない
  2. 推測統計・・・カイゼンに必須だが「仮説検定」、「推定」ともに重視されていない
  3. ベイズ統計・・・新しい分野で、今後の取り組み次第で会社の競争力に差が付く

世の中では「確率」「統計」の重要性に気づき取り組み始めていますが、物流業界では相変わらず重視されていません。

(少なくとも管理人のいる会社では誰も勉強していない)

しかし、物流業界は特殊で必要ないということは決してないのです。

 

【Udemyの関連講座】

はじめての統計(推定・検定編) ~記述統計から推測統計へ!しっかり9時間、97レクチャーでデータ時代の入場券を手に入れる

データサイエンス時代にまず押さえるべきデータの扱い方・見方を扱った統計講座。データをどう要約し、分かりやすく伝えるのか(記述統計)から、そのデータから母集団について何が言えるのか(推測統計)まで、丁寧に統計的発想を身に付けます

いちばん理解できる統計学ベーシック講座その1【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。統計学や確率思考という一生モノのスキルを一緒に身につけましょう!