新しく開設された
Discord コミュニティに参加して、リアルタイムのディスカッション、ユーザー同士のサポート、メリディアン チームとの直接の交流をお楽しみください。
必要なデータ量
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このセクションには、必要なデータ量を把握するための情報をまとめています。正確なデータ量はデータの内容によって異なるため、このガイダンスは大まかな方向性を示すものです。
データサイズは、地域の数に時点の数を掛けたものです。
これらの時点と地域は独立していません。たとえば、マーケティング ミックス モデリング(MMM)設定の 1,000 個のデータポイントは、1,000 回のコイントスや、テストでランダムに割り当てられた 1,000 人の参加者とは異なります。
全国モデルと地域モデルのセクションもご確認ください。
全国モデルのデータ量
全国モデルの信頼性を測る重要指標は、把握したい測定対象の効果あたりのデータポイント数です。たとえば、メディア チャネルが 12 個、コントロールが 6 個、ノットが 8 個ある場合、効果の合計は 26 個になります(この例では、わかりやすくするため、Adstock と Hill のパラメータは無視します)。2 年分の週次データがある場合は、データポイントは 104 個となり、効果あたりのデータポイント 4 個となります。その場合はサンプルサイズが小さいシナリオとなり、データは不十分です(また、メディア費用の分散が不十分だと、全国モデルに悪影響が生じます)。ノットの詳細については、knots
引数の動作をご確認ください。
全国モデルに十分なデータを取得するのは難しいため、次のように対処します。
マーケティング ミックス モデリングの範囲を狭めます。推定対象のメディア チャネルを減らす(費用の少ないチャネルを除外するか、チャネルを統合する)、時間効果を推定するためのノットを減らす、不要なコントロールを削除するなどが考えられます。ただし、重要な交絡因子は削除しないでください。
取得するデータを大幅に増やします。たとえば、2 年ではなく 3 年間の週次データを使用します。データ量を増やすと推論の分散は小さくなりますが、推論の関連性が低下する場合もあります。
それで、範囲を狭めたり、データを増やしたりするのではなく、データに地域の粒度を追加して地域モデルを使用する方法をおすすめです。
前述の例を使って全国モデルについて考えてみましょう。12 個のメディア チャネルを 3 つにまとめ、ノットを 2 つに減らすことができます。また、KPI の説明にはなっているものの、メディアの説明にはなっていないコントロールが見つかる場合もあります。この場合、そのコントロールは実際には交絡因子ではないため、削除しても問題ありません。3 年分の週単位データも使用する場合は、10 個の効果を推定するためのデータポイントは 156 個になります。効果あたりのデータポイントは約 15 個になるため、マーケティング ミックス モデリングから方向性に関する情報をある程度収集できるようになります。
地域モデルのデータ量
測定対象の効果あたりのデータポイント数も、信頼性を測る重要指標であることに変わりはありません。ただし、地域階層のため、この指標は解釈が容易ではありません。たとえば、12 個のメディア チャネル、6 個のコントロール、100 個のノット、105 個の地域がある場合、推定する効果の数はおおよそ $(12 \times 105)+(6 \times 105)+ 100 = 1,990$ となります(メディアとコントロールには地域レベルの効果があるため、地域の数の 105 で乗算しています)。3 年分の週単位データがある場合は、データポイント数は $105 \times(52 \times 3)= 16,380$ となります。効果ごとに約 8 個のデータポイントです。わかりやすくするため、この例では Adstock と Hill のパラメータは無視します。
この例では考慮されていない重要ポイントは、地域階層の定義により、地域レベルのメディアおよびコントロールの効果は、地域間で独立しているわけではないということです。つまり、メディア チャネル 1 が地域 1 に与える効果と、メディア チャネル 1 が地域 2 に与える効果を推定する際は、データが共有されます。コントロールについても同様です。データが共有されるため、実質的には、効果ごとに 8 個を超えるデータポイントが使用されます。共有されるデータの量は、地域間での効果の類似性によって異なります。これは、eta_m
パラメータと xi_c
パラメータによって決まります。
地域レベルのモデルに十分なデータを取得するのが難しい場合は、メディア チャネルを統合するか、費用の少ないメディア チャネルを削除することをおすすめします。または、階層分散項 eta_m
と xi_c
に、より正規化された事前分布(HalfNormal(0.1)
など)を適用することもできます。これにより、地域間で情報を共有しやすくなります。
キャンペーン単位のデータの使用について
メリディアン モデルで使用できるのはチャネルレベルのデータのみです。マーケティング ミックス モデリングはチャネルレベルで効果を発揮するマクロツールであるため、通常はキャンペーン レベルで実行することはおすすめしません。開始と終了が厳密な別個のキャンペーンを使用すると、Adstock のメモリが失われる恐れがあります。より詳細なインサイトを入手したい場合は、デジタル チャネル向けのデータドリブン マルチタッチ アトリビューションを使用することをおすすめします。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-04 UTC。
[null,null,["最終更新日 2025-08-04 UTC。"],[[["\u003cp\u003eData size is determined by the number of geographic areas and time points, which are not independent and influence model requirements.\u003c/p\u003e\n"],["\u003cp\u003eNational models require substantial data per effect for reliable insights, often necessitating scope reduction or data aggregation.\u003c/p\u003e\n"],["\u003cp\u003eGeo models leverage hierarchical structures, potentially requiring less data per effect due to shared information across geographic areas.\u003c/p\u003e\n"],["\u003cp\u003eWhile campaign-level data is not recommended for Meridian's channel-focused approach, granular insights can be gained through multi-touch attribution for digital channels.\u003c/p\u003e\n"]]],["Data requirements vary, with the size calculated by geos multiplied by time points. National models need sufficient data points per effect (e.g., media channels, controls, knots). If data is insufficient, reduce the model's scope by estimating fewer channels/knots, get more data, or use a geo model. Geo models, while more complex due to geo hierarchy, share data across geos, increasing effective data points per effect. Campaign-level data is discouraged in favor of channel-level analysis.\n"],null,["# Amount of data needed\n\nThis section can help you build a sense of how much data you need. The\nguidance about the amount of data needed is rough and directional because the\ntrue answer depends on what the data is like.\n\n- Data size is the number of geos times the number of time points.\n\n- These time points and geos are not independent. For example, 1,000 data points\n in a marketing mixed modeling (MMM) setting isn't the same as something like\n 1,000 coin flips or 1,000 randomly assigned participants in an experiment.\n\nAlso see the sections for national models and geo models.\n\nAmount of data for national models\n----------------------------------\n\nAn important confidence check metric for national models is the number of\ndata points per effect that you are trying to measure and\nunderstand. For example, if you have 12 media channels, six controls, and\neight knots, the total is 26 effects. (For simplicity, ignore things like\nAdstock and Hill parameters for this example.) If you have two years' worth\nof weekly data, then you have 104 data points and four data points per\neffect. This is a low sample-size scenario and you don't have enough data.\n(Additionally, insufficient variation in the media spend adversely impacts\nnational models.) For more information about knots, see\n[How the `knots` argument works](/meridian/docs/advanced-modeling/setting-knots#how-knots-argument-works).\n\nBecause it is difficult to get enough data for a national model, you can\ndo the following:\n\n- Lower the scope of the MMM. You can estimate fewer media channels (either by\n dropping a channel with low-spend or combining channels), use fewer knots to\n estimate time effects, and remove any extraneous controls. However,\n don't remove important confounders.\n\n- Get much more data. For example, use three years' of weekly data instead\n of two. Adding more data will reduce the variance in inference, but might\n make the inference less relevant.\n\n- Alternatively, consider adding geo granularity to your data and using a\n geo model instead of lowering the scope or adding more data.\n\nConsider the previous hypothetical example for the national model. You can\ncombine the 12 media channels into three, lower your knots to two. You might\nalso recognize that one of your controls explains the KPI but not the media,\nwhich means that it is not a true confounder and you can remove it.\nIf you also use three years' worth of weekly data, you then have 156 data\npoints to estimate 10 effects. This is roughly 15 data points per effect and\nnow you might be able to glean some directional information from the MMM.\n\nAmount of data for geo models\n-----------------------------\n\nThe number of data points per effect that you are trying to measure and\nunderstand is still an important confidence-check metric. However, due to the\ngeo hierarchy, that metric is not as clear to interpret. For example, if you\nhave 12 media channels, six controls, 100 knots, and 105 geos, that is roughly\n$(12 \\\\times 105) + (6 \\\\times 105) + 100 = 1,990$ effects to estimate.\n(You multiply by 105 for the number of geos because media and controls have\ngeo-level effects.) If you have three years' worth of weekly data, then you\nhave $105 \\\\times (52 \\\\times 3) = 16,380$ data points. This is roughly 8 data\npoints per effect. For simplicity, ignore things like Adstock and Hill\nparameters in this example.\n\nAn important detail that was not considered in this example is that by\ndefinition of a geo hierarchy, the geo-level media effects and geo-level\ncontrol effects are not independent across the geos. Effectively, this means\nthat data is shared when estimating the effect of media channel 1 on geo 1 and\nthe effect of media channel 1 on geo 2. This is similar for controls too.\nBecause data is shared, you effectively have more than eight data points per\neffect. How much data is shared depends on how similar the effects are across\ngeos. This can be determined by the `eta_m` and `xi_c`parameters.\n\nWe recommend that if you are having difficulty getting enough data for a\ngeo-level model, then consider combining media channels or dropping a media\nchannel with low spend. Or, you can put a more regularizing prior on\nhierarchical variance terms `eta_m` and `xi_c`, for example, `HalfNormal(0.1)`,\nwhich will encourage sharing information across geos.\n\nCan I use campaign-level data?\n------------------------------\n\nThe Meridian model is focused only at channel-level. We generally\ndon't recommend running at the campaign-level because MMM is a macro tool that\nworks well at the channel-level. If you use distinct campaigns that have hard\nstarts and stops, you risk losing the memory of the Adstock. If you are\ninterested in more granular insights, we recommend data-driven multi-touch\nattribution for your digital channels."]]