http://en.wikipedia.org/wiki/Time_series
time series modelでは、いくつかのindependent variableに時間の概念をいれて相関をとることで、regressionのviolationになりそうなautocorrelationやheteroskedasticityを解決してくれます。
例えば、売上とプロモーションの関係をみるときに単純に同じ日数で比べてしまっては相関がないように思われます。直感で考えればプロモーションは少し日数が経過したあとに売上に紐づくからです。そのため、プロモーションのトレンドを1日ずらし、2日ずらし、3日ずらしと何日かずらしたもので、いっぺんにmultiple regressionをかけてみます。その中でp-valueでイレギュラーなものが発生していないものを採用することで、プロモーションコストが売上の何日目にどのくらいインパクトを与えてくれるのか見ることができます。
しかしここでもしresidual plotにautocorrelationの要素が発生していたら、同様に、今度は売上も1日ずらし、2日ずらし、3日ずらしでみてみます。商品を購入した顧客のクチコミ効果のようなものが発生していれば、今日購入した顧客がクチコミによって2日後に購入する顧客にインパクトを与えている可能性があります。
さらに時間の経過日数もindependent variableにいれてみることで、長期トレンドとして上昇基調や下降基調にある売上傾向をvariableとして読むことができます。
いままで統計の勉強、regressionの勉強をしていましたが、time series modelを学んで、マーケティングにどういかしていったらいいのかがわかった気がします。たくさんのデータからどうやって数字を読み込んでいくのか、直感とともに、ロジックをexcelに反映させていく考え方を少し学んだ気がします。
0 件のコメント:
コメントを投稿