第1章 景気回復の現状と課題 第3節

[目次]  [戻る]  [次へ]

第3節 消費行動分析の新たな視点

第4次産業革命とも呼ばれる技術革新が進展する中で、電子商取引が年々拡大し、消費者の行動に変化がみられるとともに、消費や物価動向に関するオンライン情報等のビッグデータが景気分析等に用いられるようになってきている。本節では、こうした技術革新をキーワードにした消費分析を2つの観点から行う。1つ目は、ネットショッピングを利用した消費の状況について、利用者の属性等も踏まえて詳しく分析を行う。2つ目は、小売のPOSデータ及び新聞記事のテキストデータといったビッグデータや機械学習を活用した景気動向の分析について、内閣府における最近の取組と分析結果を紹介する。

1 インターネットを利用した消費(eコマース)やシェアリング

技術革新によりインターネットへの接続が容易になったことを背景に、ネットを利用した消費は年々増加傾向にある。ここでは、ネットを利用した消費活動を行っている世帯・個人の特徴を整理するとともに、ネット利用世帯と非利用世帯の間で支出金額に違いがみられるのか、ネット利用世帯に限った場合の特徴は何か、シェアリングエコノミーは消費にどのような変化をもたらすかといった点について分析を行う。

増加するeコマースの概観

まず、企業と消費者間の電子商取引(EC)市場の動向について確認しよう。技術革新やインターネットの普及に伴い、近年eコマースは拡大を続けており、2017年におけるEC市場規模40は16.5兆円となっている(第1-3-1図(1))。2010~17年の年平均成長率は約11%となるなど、10%を超える急成長を見せている。

2017年の16.5兆円の市場規模の内訳をみると、約52%が衣類・食料・家電等の物販系分野、約35%が旅行等のサービス系分野、約12%がオンラインゲーム等のデジタル系分野となっており、EC市場の半分以上は物販系分野が占めている。この物販系分野におけるEC化率(販売総額のうちインターネット経由で販売された割合)は2017年で5.8%と報告されている。その内容を詳細にみると(第1-3-1図(2))、事務用品・文房具や生活家電・AV機器等でEC化率が30%を超えている。また、書籍、家具、衣服等でのEC化率も、物販系分野全体のEC化率を上回っており、これらの商品ではオンラインで商品を購入する機会が多くなっていることがうかがえる。

こうしたEC市場の拡大の背景には、スマートフォン等の情報通信機器の保有率が急上昇していることが指摘できる。スマートフォンを保有している世帯の割合は2010年では10%を下回っていたが、2016年では72%まで上昇しており、パソコンの保有割合(73%)とほぼ同程度の水準となっている41

ネットショッピングの利用には、年齢、収入、時間的制約等が関係

では、EC市場に参加している人、ネットショッピングを利用している人には、どのような特徴があるのだろうか。財・サービスや支出金額に関わらず、オンラインで消費活動を行った者の特徴について整理していきたい。

まず、総務省「家計消費状況調査」の個票データを用いて、世帯が持つ属性のうち、どのような属性がよりネットショッピングの利用の有無に大きく影響しているのか確認する。ここでは、ネットショッピングを利用した世帯の割合が高く(低く)なるような属性でサンプルを分割していく、ツリー構造の「決定木(decision tree)」と呼ばれるグラフの作成を行った42

分析結果をみると(第1-3-2図(1))、2017年においてネットショッピング利用を大きく左右した要素は「世帯主の年齢」であることがわかる。分析対象のサンプルにおいて、ネットショッピングを利用した二人以上世帯の割合は約33%となっているが、世帯主が64歳以上の世帯に限定すると、利用割合が約19%と非常に少なくなる。逆に、世帯主が64歳未満の世帯では、利用割合が約47%とその割合が高くなる。また、年齢の次には「世帯収入」が重要な変数となっている。世帯主の年齢が64歳以上の世帯では400万円、64歳未満の世帯では500万円以上が分岐点であり、分岐点より収入が多い世帯では利用割合が高まる一方、分岐点を下回ると利用割合が低下している。

年齢や収入の分岐点の値はあくまでも対象サンプルのものであるが、傾向として世帯主の年齢がネットショッピングの利用割合を大きく左右する要因である可能性が高い。また、高齢者の世帯でもある程度の収入があればネットショッピングの利用率が高くなるが、若年世帯でも収入が低ければ利用率が低くなることがわかった。

このようにネットショッピングの利用の有無には、年齢と収入の要因が大きいと考えられるが、その他にも個々人の時間的な制約も影響している可能性が考えられる。ネットショッピングを利用している人は、その理由として実店舗に出向かなくてもよいことや、24時間いつでも買物できることを挙げる割合が高いことから43、利便性をメリットに感じている人が多いことが指摘できる。

そこで、世帯単位ではなく、15歳以上の個人(在学者を除く)を対象にネットショッピングを利用した者の特徴について、プロビットモデルを用いた分析を行った44第1-3-2図(2)は推計結果であり、ベースライン(非就業者、大卒未満、配偶者・子どもなし、男性、大都市在住、平日利用)と比較した場合に、どの程度ネットショッピングを利用する確率が変化するかの差分をプロットしたものである。まず、就業状態についてみると、フルタイム(始業時間が選択不可)、フレックス(始業時間等が選択可)、短時間労働、自営業・役員等の4つに分類しているが45、どの就業状態もプラス方向に効いており、非就業者と比較して就業者のネットショッピングの利用確率が高いことを示している。また、大卒以上の人、10歳未満の子どもがいる人、配偶者がいる人もネットショッピングの利用確率が高くなっている。逆に、より人口規模が小さい都市に在住している場合や、週末の場合は、ネットショッピングの利用確率が低くなる傾向がある。

就業者の人についてさらに詳しくみるために、ネットショッピングを日中(9~18時)に利用する確率と、夕方以降(18~24時)に利用する確率に分けて推計を行った(第1-3-2図(3))。グラフはネットショッピングを利用する確率について、非就業者との差をプロットしたものだが、フレックス・自営業以外の者では日中にネットショッピングを利用する確率は有意にマイナスとなっており、特にフルタイムで働いている人が低くなっている。一方、夕方以降においてはどの就業形態でも有意にプラスとなっており、フレックスやフルタイムの就業状態にある者では、短時間労働者と比較して、より夕方にネットショッピングを利用する確率が高いことがわかる。

以上を総括すると、ネットショッピングの利用には、年齢、収入以外に時間的な制約があるかどうかも関係しており、就業者等の日中に実店舗に買物に行くことが困難な人が、平日の仕事が終わった夕方以降にネットショッピングを利用している様子が見て取れる。より時間的ゆとりがあると考えられる週末ではネットショッピングの利用が低くなることも踏まえると、ネットショッピングは時間的制約のある人等にとって消費機会の拡大に寄与していることが示唆されている。今後、夫婦ともにフルタイムで働く世帯が増加すれば、ネットショッピングの利用率はさらに上昇していく可能性が考えられる。

消費支出金額は旅行で多く、衣類・家具・家電で少ない傾向

ネットショッピングを利用している人は、上記で論じた利便性に加え、実店舗よりも安く買えることや品揃えが豊富であることをメリットと感じている人もいることから46、ネットと実店舗における消費活動には何らかの差が生じる可能性が考えられる。

この点を確認するために、年齢や収入等の属性をコントロールした上で、ネットを利用して商品・サービスを購入した世帯とネットを利用しなかった世帯を比較し、特定の商品・サービスの支出金額に差が生じているのかを検証した。対象とした商品・サービスは、衣類、家具、家電、旅行の4点である。試算方法としては、まず、ネット消費の利用の有無にかかわらず、例えば、冷蔵庫・エアコン・テレビ等の家電品目を購入した世帯を対象とする。次に、対象世帯のなかで、インターネットを利用して家電を購入した世帯と、その世帯と同じ世帯属性をもつがインターネットを利用しなかった世帯とをマッチングさせ、両世帯の家電品目の支出金額に差が生じているかを計算する47

推計結果をみると(第1-3-3図(1))、衣類、家具、家電の財ではマイナスとなっており、ネットを利用している世帯では、ネットを利用していない世帯に比べて、それぞれ約7千円、約5千円、約1.6万円支出金額が少ない。逆に、旅行消費についてはネット利用世帯の方が約6千円大きくなっている。また、計算に使用したネットを利用した世帯における平均消費額をみたのが第1-3-3図(2)である。第1-3-3図(1)の結果を、第1-3-3図(2)の金額で割ると、大きいものの順番に、家電、衣料、家具、旅行となることから、相対的に財においてネット利用による影響がみられる。

衣類、家具、家電といった財の購入においてネットを利用した世帯の支出金額が少なくなっている背景としては、比較的価格の安い商品がネット経由で購入されている可能性や、ネット上の販売価格が実店舗で買うより安い商品もあること等が影響していると考えられる。事実、ネットショッピング1回当たりの平均購入金額は少額なものが多いとの調査48や、同じ商品のオンライン価格と実店舗価格を比較した場合、両者の価格が異なる際にはオンライン価格の方が安いケースが多いとの調査49もある。また、旅行についてはその背景が必ずしも明確ではないものの、ネット利用者はより各自の嗜好にあった旅のプランを自由に作成することで価格が高くなる可能性等が考えられる50

高齢者世帯も他の年齢層と同程度のネット支出金額

これまではネット利用者と非利用者の対比で消費状況の分析を行ってきたが、最後に、ネット利用者のみに限ってみた際にどのような特徴があるのかについて整理しておきたい。

第1-3-4図(1)は、世帯主の年齢階級別に2015~2017年におけるネットを利用した消費額についてみたものである。第1-3-2図で指摘したように、ネット利用の有無には年齢が大きく影響しているため、全世帯の平均でみると世帯主の年齢が60歳以上になると支出金額が減少していくことがわかる。一方、ネットを使った消費を行った世帯の中での平均をとると、1か月の平均で39歳以下は約2.6万円、40代は約2.8万円、50代は約3.3万円と徐々に増加していき、60歳以上の支出金額では50代の支出金額と概ね同程度の3万円台となっている。ネット利用の有無については年齢による影響が非常に大きいが、使っている世帯のみに限定すると、高齢者世帯でも他の世帯と同程度かそれ以上の金額を支出していることがわかる。

ただし、上記は世帯単位でみたものであるため、世帯主が高齢者であっても、他の若い世帯員等がネット消費を行っている可能性が考えられる。そこで、世帯主本人のみがネット利用により使用した金額を、ネット購入の際に主に使用した機器別(パソコン、スマートフォン・タブレット等)にみたのが第1-3-4図(2)である51。これをみると、相対的に高齢である世帯主がネット利用により使った金額は、その他の年齢の世帯主が使う金額と同程度か、それ以上である。

主に使用した機器別では、60歳以上の世帯主を除き、パソコンによる使用金額の方がスマートフォン・タブレット等の金額より高くなる傾向があり、より高額な商品を購入する際には、パソコンが利用されていることがうかがえる。また、最も多く購入に用いた機器については、年齢による差が非常に大きく(第1-3-4図(3))、39歳以下では約55%の世帯主が主にスマートフォン・タブレット等を利用したと回答しているが、同割合は世帯主の年齢が上昇すると減少していき、60歳以上の世帯主では14.6%となっている。

年齢が若い世代ではネットショッピングの利用割合が高いが、主にスマートフォン等を利用して、比較的少額の消費活動を行っている傾向がある。年齢が高くなるにつれ、ネットショッピングの利用割合は減少していくが、利用している人や世帯に限れば、主にパソコンを利用して、若い年代以上に消費支出をしている様子がみられる。今後、高齢者のITスキルの向上や、ITスキルを職場等でも使ってきた現役世代の高齢化が進めば、高齢世帯でもオンライン利用率が上昇し、インターネットを利用した消費活動がより増加していく可能性が考えられる。

ネット利用の拡大により、消費は保有からシェアへ

インターネットの利用の拡大は、ネットショッピングの拡大に寄与しただけでなく、インターネット上にあるプラットフォームを介して、モノ、空間、移動等を多くの人と共有して利用する仕組みであるシェアリングエコノミーといった新しいサービスの普及にもつながっている。シェアリングの対象となっているサービスについては、モノ、空間、スキル、移動、お金の5分類に整理することができる。それぞれの例として、モノはネット上で個人間の取引を行うフリマアプリや衣類等のレンタルサービス等、空間は住宅を活用した宿泊サービスを提供する民泊サービス等、スキルは家事代行・育児等、移動はカーシェアリング等、お金はネット上で不特定多数の人から資金を募るクラウドファンディング等が挙げられる(第1-3-5図(1)52

上記のうち、モノと移動に注目してその現状を確認してみたい。まず、モノのシェアリングとして、ネットを介したリユースであるネットオークションやフリマアプリが挙げられる53。2017年市場規模の前年比伸び率は、ネットオークションが3.2%であるのに対し、フリマアプリは58.4%と非常に高く、2017年の市場規模はフリマアプリがネットオークションを上回る結果となっている(第1-3-5図(2))。フリマアプリは、利用方法が簡単なこともあり、特に若い世代や女性において利用率が高くなっていることが指摘されている54。また、若年層において中古品に対する抵抗感がなくなっていることや、フリマアプリの利用者はモノを永続的に所有することにこだわらない傾向があるとの調査もあり55、若年層を中心に消費行動が変化してきている可能性が考えられる。

モノの所有にこだわらないという傾向は、カーシェアリングの市場が急拡大していることからも確認できる(第1-3-5図(3))。2010年にはカーシェアリングの車両台数は1300台程度であったが、2018年では3万台弱と2010年比で約23倍の増加となっている。また、会員数についても大幅に増加しており、2018年では約132万人と2010年比では約83倍である。カーシェアリングは、レンタカーと比べ手続きの容易さや短時間利用の便利さが特徴であり、乗用車についても所有からシェアへといった変化がみられている。

シェアリングエコノミーは3章でもその動向を確認するが、今後さらなる拡大が見込まれている分野である。所有からシェアへの消費者の行動変化は、財の購入や既存のサービスを代替する可能性と補完する可能性が指摘されている56。例えば、新品を購入する代わりにフリマアプリ等で安価な中古品を購入した場合、消費が低下する可能性がある一方、フリマアプリ等で気軽に商品を試し、気に入れば次回以降は新品を購入するといった新規需要が創出されることで、消費が活性化する可能性も考えられる。シェアリングエコノミーが消費全体に与える影響は、今後も注視していく必要がある。

2 ビッグデータ・AIを活用した消費分析

以下では、小売のPOSデータ及び新聞記事のテキストデータを用いて、AI技術の一つである、コンピュータにデータを解析・予測させる手法(機械学習)を活用した消費動向の分析について、最近の内閣府における取組と暫定的な分析結果を紹介する57

POSデータは高頻度・早期の利用に強み

スーパーやコンビニ等の小売店では、購入する際に商品をバーコードで読み込み、各商品の販売時点・価格・数量等の情報を収取・記録している。このようなシステムはPOS(point-of-sale)と呼ばれ、売上や在庫管理に役立てられている。ここでは、全国のスーパーマーケット約1,200店舗から収集された日用品・食料品(除く生鮮品)の売上高と価格に関するPOSデータを対象とし、消費動向を試験的に分析する58

POSデータを経済分析に利用することの利点としては、速報性が非常に高いことや、高頻度に観察が可能であることが指摘されているが59、マクロ分析に利用する際にはカバレッジが限定的である点等には留意する必要がある。今回分析に利用するPOSデータも、217品目分類が日次で利用できること(高頻度)や、その値が早期(数日後)に利用できること(速報性)に強みがある一方、POSデータの大部分を占める食料品等のシェアは消費の2割程度であり60、消費全体をカバーできるわけではない。

まず、日次データとしての強みを活かした分析例を紹介する。消費動向を把握する際には、天候がその重要な要因の一つであることが指摘されているが61、月次で消費と天候の分析を行うのは必ずしも容易ではない。そこで、日次で雨の日と晴れの日に分けてPOSデータの売上高・前年比62を平均すると(第1-3-6図(1))、合計で晴れの日は前年比+1.6%に対し、雨の日は前年比▲1.0%となっている63。曜日別にみても、すべての曜日において雨の日は売上高がマイナスとなる一方64、晴れの日は売上高がプラスとなっており、天候により消費者が外出を控えること等のために、売上高(消費額)が左右されていると考えられる。

また、高い速報性は足下の動向を把握するのに非常に有効である。例えば、2017年6月1日にはビールの安売り規制が行われたが、ビールの日次売上高・前年比の推移をみると(第1-3-6図(2))、2017年5月末にかけて駆け込みがみられ、5月31日には前年比183%となっている。しかし、6月以降の推移をみると、明確な反動減はみられていない。このような動向がほぼリアルタイムで観察可能であるため、制度変更等のイベントの際には、足下の状況を把握するのに非常に有効である。

POSデータを用いて足下のマクロ経済指標を予測する

次に、POSデータの強みを活かした分析例を紹介したい。通常、マクロ経済指標は、その月が終了してから1~2か月後に公表されるものが多いが、迅速な景気動向把握のためには、ある月が終わったら、すぐにその月のマクロ経済指標の値が予測できること(以下「ナウキャスト」という。)が望ましい。この点において、POSデータは速報性という強みをもっているが、カバレッジの低さもあり、単純にPOSデータの値を月次で比較しただけでは、ナウキャストを正確に行うことは困難である。

ただし、マクロ経済指標の動きと似通った動きを、POSデータの動きの中から抽出することができれば、カバレッジ等の問題を解消し、ナウキャストを行うことが可能となる。そこで、売上高のPOSデータを機械に学習させることで、特徴的な動きを抽出させ、経済産業省「商業動態統計」における「小売業計」の前年比をナウキャストできるかを試みた。また、小売業計には家電や衣類等の売上動向が気温等の天候により左右されやすい商品が含まれることや、天候データも速報性の高い情報であることを踏まえ、POSと天候データ65を併せて機械に学習させる分析も行った。機械学習の方法は、予測のパフォーマンスが高い学習方法の一つである「勾配ブースティング(gradient boosting)」と呼ばれる手法を用いている66

2007年1月~2016年12月までの10年間の月次のデータを機械に学習させ、2017年1月~2018年3月の小売業計の前年比をナウキャストさせ評価したところ、POSデータのみでは相関係数0.63であったが、天候データを加えると相関係数0.78 に上昇した。天候データを使うことで、気温等に敏感な商品の売上高動向等を補正することができたと考えられ、ここでも天候が消費動向に影響を与えていることが確認できる。

このPOSと天候データの両方を使ってナウキャストを行った結果を示したのが、第1-3-7図である。前年比の水準には差がみられるものの、前年比前月差をみると、方向感は概ね似たような動きをしていることから、大まかではあるが、小売業計の前年比について一定程度のナウキャストを行うことができたと考えられる。ただし、今回の分析でも水準の差に加え、2018年以降等で動きが異なる部分もみられることから、精度向上に向けては更なる分析を進めていく必要性がある67

POSデータから需要・供給曲線のシフトが明らかに

また、POSデータの利点の一つとして、217品目分類別に数量と価格の双方の情報がセットで利用可能であることが指摘できる。この利点を生かして、POSデータの価格変化が、需要と供給のどちらのショックにより起こったものかについて簡易的に試算することが可能となる68。経済学における一般的な右下がりの需要曲線と右上がりの供給曲線を想定すると、価格上昇は、需要曲線の右方シフト、または供給曲線の左方シフトによって生じる69。その際、需要曲線のシフトであれば数量は増加するが、供給曲線のシフトであれば数量は減少する。つまり、POSデータの価格が上昇した際、同時に数量も増えていれば需要ショック(需要曲線のシフト)、数量が減少していれば供給ショック(供給曲線のシフト)とみなすことが可能となる。

POSデータにおける217品目分類の価格・数量の動向70を、<1>価格上昇かつ数量増加、<2>価格上昇かつ数量減少、<3>価格低下かつ数量増加、<4>価格低下かつ数量減少の4つのカテゴリーに分割し、それぞれの割合をみたのが第1-3-8図(1)である。例えば、2008~09年にかけての世界金融危機の際には、価格上昇かつ数量増加の割合が低下し、価格低下かつ数量減少の割合が増加しているなど、時期により特徴的な動きがみられる。

上記の4つのカテゴリーのうち価格上昇かつ数量増加、価格低下かつ数量減少は需要曲線のシフト(需要要因)、価格上昇かつ数量減少、価格低下かつ数量増加は供給曲線のシフト(供給要因)に対応しているとみなすことができる。そこで、各品目分類それぞれの価格変化率を、需要要因と供給要因のグループに分けて統合することで、POSデータ全体の価格変化に対して、需要要因と供給要因の寄与をそれぞれ算出することができる。

分析結果を確認すると(第1-3-8図(2))、POSデータの価格変化には需要要因と供給要因の両方が影響していることが確認できる71。例えば、2008~09年にかけての世界金融危機をみると、需要要因の押し下げ寄与が高まっているが、原材料価格の低下等を反映して供給要因も同時に物価を押し下げていることがわかる。また、2013年以降の動向をみると、供給要因は、2015年までは原材料価格や輸入物価の動向等を反映しておおむね押上げに寄与していたものの、2016年以降は押し下げに寄与した。需要要因については、2013~2014年初にかけて押上げに寄与した一方、2016年にはマイナスに寄与した。

このように価格変化と同時に数量変化も確認することで、価格変化の背景が、消費者の購買意欲の変化によるものか、原材料価格の変化によるものか等、POSデータから示唆を得ることが可能となる。ただし、ここで確認ができたのはPOSデータが対象とする日用品・食料品の動きに限られる点には留意が必要である。

新聞記事のテキストデータは消費者マインドと連動

近年では、デジタル化されたテキストデータの利用が容易になったことから、テキストを用いた分析も活発化している72。定性的な情報を数値データに変換するため、分析手法によって結果が変わり得る等との課題があるものの、POS同様に速報性の高さ等から、既存の分析を補完する分析が可能となることが期待されている73

ここでは試験的に、消費者マインドに影響を及ぼすことが指摘されているニュース記事のテキストデータを利用して74、消費者マインドとの相関を紙面別に確認するとともに、ニュース記事と消費行動の分析も行うことで、テキスト情報が上記のPOSデータ等の他の分析を補完できる可能性があるのかについて考察する。

具体的には、景気の現状と先行きに対する評価とコメントがセットで利用できる内閣府「景気ウォッチャー調査」を利用し、ディープラーニング(深層学習)の手法として知られるRNN(Recurrent Neural Network)を用いて75、機械にどのようなコメントが景気認識に対して良い・悪いコメントであるのかを学習させた76。なお、学習は現状と先行きで別々に行い、学習の結果、景気ウォッチャー調査の新規コメントに対して93~95%の確率で正しく分類できるようになった77。学習が完了した機械に、2013~17年における18万件以上の新聞記事78を読み込ませ、それぞれの記事がポジティブ(ネガティブ)である確率を算出させる。これにより新聞記事のテキストデータを数値化することが可能となり(以下、作成した指標を「新聞センチメント指数」という。)、消費者マインドとの相関をみることができる。

経済面、社会面、政治面などの紙面別に新聞センチメント指数を作成し、消費者態度指数との相関をみると(第1-3-9図)、景気ウォッチャー調査の先行きで学習させた「経済面」、「マーケット商品面79」の新聞センチメント指数との相関が0.6と高くなっている。同じ「経済面」でも景気ウォッチャー調査の現状で学習させると、相関が半分程度になることから、消費者マインドは見通しも踏まえて形成されていることが示唆される。また、対象記事全体では相関が低いことから、消費者マインドは経済面に掲載されるような全般的な経済情勢の変化や、マーケット商品面に多く見られる価格変化等、特定の情報に影響を受ける傾向があると考えられる。

センチメントの改善より悪化が消費に大きな影響の可能性

POSデータ同様、上記で作成した新聞センチメント指数の強みとして高頻度であることが挙げられる。この強みを活かし、1週間程度の短期間内における新聞センチメントの変化と消費行動(POSの売上高の変化)の関係性について分析を行う。その際、ポジティブなニュースとネガティブなニュースとでは消費者マインドに対する影響は異なるとの研究結果もあることから80、新聞センチメント指数が前週と比較してプラス方向、マイナス方向に変化した際の影響を分けて(非対称性を考慮して)分析する。

まず、217品目分類のPOSデータ(売上高)のうち、消費者マインドの変化に敏感な品目を抽出すべく、新聞センチメント指数が利用可能な2013〜17年において、消費者態度指数と相関が高い上位10品目を選定した(第1-3-10図(1))。これら10品目のそれぞれの売上高変化と、非対称性を考慮した新聞センチメント指数の変化を週次ベースで回帰分析を行い81、新聞センチメント指数が改善した場合と悪化した場合とで、消費行動に与える影響が異なるかを検証する。新聞センチメント指数は、消費者態度指数との相関が高かった景気ウォッチャーの先行きコメントで学習させた経済面とマーケット商品面の2つを使用する。

10品目の推計結果のうち、新聞センチメント指数が1標準偏差変化した時のPOS売上高の変化が有意であった品目をプロットした(第1-3-10図(2)(3))。経済面では10品目のうち5品目、マーケット商品面では10品目のうち6品目で両者の間で有意な関係がみられた。プラスの方向とマイナスの方向を比較すると、両方が有意になったすべてのケースにおいて、マイナスの方向の係数が高くなっている。また、プラスの方向のみが有意になったケースは1つのみだが、マイナスの方向が有意になったケースは3つあり、総合すると新聞記事の内容がネガティブに変化した場合の方が購買行動に与える影響が高い可能性が示唆されている。

上記の分析を踏まえると、新聞等のテキストデータについても経済分析に対して有用な情報をもっている可能性がある。今後、POSデータに加え、こうしたテキスト情報も活用することで、ナウキャストの精度を向上させ、より迅速かつ的確な景気把握が可能となると考えられることから、引き続き、研究を進めていく必要がある。


(40)ここでのECとは「受発注がコンピュータネットワークシステム上で行われること」と定義されている。詳細は経済産業省(2018)を参照。
(41)総務省「通信利用動向調査」。また、藤田他(2018)は、2012年と2017年のサービス支出額を比較し、「通信料」の増加幅が最も大きく寄与しており、その要因として移動電話通信料やインターネット接続料の増加があることを指摘している。
(42)具体的には、13個の説明変数を利用して、サンプルの分割を繰り返し、分類目的(ネットショッピングの利用)の予測誤差を小さくしていく手法である。詳細は付注1-6を参照。
(43)総務省(2016)より、ネットショッピングを利用する理由やメリットの回答割合をみると、実店舗に出向かなくても買い物ができることが1位、24時間いつでも買物ができることが2位となっている。
(44)データは総務省「平成28年社会生活基本調査結果」を用いた。ここでは調査指定日において、ネットショッピングに使用した時間(商品やサービスを選んでいる時間を含む)があれば、ネットショッピングを利用したと解釈した。推計結果の詳細は付注1-6を参照。
(45)フルタイム・フレックスは、1週間のあらかじめ決められた労働時間が40時間程度の勤務。短時間勤務は、1週間のあらかじめ決められた労働時間がフルタイム・フレックスの人より短い勤務。
(46)総務省(2016)より、ネットショッピングを利用する理由やメリットの回答割合をみると、実店舗よりも安く買えることが3位、品揃えが豊富であることは4位となっている。
(47)支出金額の比較対象となる財・サービスと、ネット利用で購入した財・サービスとは、データの制約上、必ずしも対応していないことには留意する必要がある。例えば、家電であれば、支出金額の比較対象となるのは、冷蔵庫、エアコン、テレビ等の10品目であるが、ネット利用で購入した家電の有無はこの10品目に限らず、家電全般が対象となる。詳細は付注1-7を参照。
(48)GMOリサーチ(2017)「ネットショッピングに関する実態調査」(2016年12月調査)によると、ネットショッピング1回あたりの平均購入金額は、男女ともに「2,000~4,000円未満」が最多であり、比較的小さな金額の買物が多いことが指摘されている。
(49)Cavallo(2017)は、日本を含む10か国において、同じ商品のオンライン価格と実店舗価格を調査し、10か国合計で両者の価格が同じ商品割合は72%、オンライン価格の方が安い商品割合は18%、オンライン価格の方が高い商品割合は11%であったと報告している。調査時期は2014年12月~2016年3月。
(50)消費者庁(2016)は、オンラインで旅行予約する理由として、価格面よりもいつでも予約できるという利便性を評価する傾向があると指摘しており、ネット利用により旅行予約を行う動機は必ずしも価格ではないことが考えられる。
(51)サンプル数の関係から60~69歳と70歳以上の世帯主については統合して計算している。
(52)より具体的な事例は、総務省(2017)等を参照。
(53)ネットオークションは、オークション方式により入札完了期日になって最終的な価格が決定されるが、フリマアプリは、出品者が価格を提示し、買い手が応じれはその時点で取引が成立する等の相違点がある(経済産業省、2018)。
(54)リサイクル通信(2018)「(意識調査)フリマアプリ利用実態」によると、若い世代ほどフリマアプリの利用率が高く、10代女性の42.4%が現在利用していると回答しているほか、フリマアプリを使う理由としては、出品・購入共に「方法が簡単・シンプルだから」との回答が最も高い。
(55)メルカリ(2018)「「フリマアプリ利用者と非利用者の消費行動」に関する意識調査」によると、20代の半数以上は中古品に対して抵抗を感じていないほか、フリマアプリ利用者は非利用者と比較して「一時的に必要なものはレンタルなどで済ませたい」との回答割合が高い傾向にある。
(56)Van Welsum(2016)。
(57)本稿におけるビッグデータ・機械学習を利用した分析は概要のみを記載しているため、データや分析方法等の詳細は小寺他(2018)を参照されたい。
(58)日経メディアマーケティング株式会社が独自に収集しているPOSデータを利用している。1989年4月以降の日次データ。
(59)岡崎・敦賀(2015)を参照。
(60)内閣府「国民経済計算」によると、「食料・非アルコール飲料」及び「アルコール飲料・たばこ」が国内家計最終消費支出に占める割合は2016年で18%程度である。
(61)例えば、日本銀行(2016)のBOX4等。
(62)売上高は曜日により大きく金額が異なるため、POSデータの売上高・前年比の計算においては、同じ曜日で比較するために364日前比を用いている。
(63)雨の日の定義は第1-3-6図の備考2を参照。
(64)グラフからは判別しづらくなっているが、土曜日の雨の日の値は▲0.003%である。
(65)具体的には、平均気温、最高気温、最低気温、降雪量のデータを利用した。
(66)勾配ブースティングとは、目的変数の誤差に対して弱い予想モデル(ここでは線形モデル)の訓練を繰り返し行い、推定したモデルの結果を組み合わせることで最終的な予測モデルの推計精度を高める手法である。なお、分析においては、様々な機械学習の手法(ランダム・フォレスト等)を試したが、勾配ブースティングの精度が最も高かった。
(67)例えば、今回分析に利用したPOSデータは217品目分類の日次の前年比を単純平均により月次化したデータであるため、品目間や曜日間のウェイトが考慮できていない。
(68)分析に当たっては渡辺(2016)を参考にした。また、価格データは、購入価格の前年比(T指数)。指数の作成方法は、渡辺・渡辺(2013)を参照。
(69)ここでは簡素化のため、シフトするのは需要曲線か、供給曲線のどちらか一方のみと仮定する。
(70)価格・数量の変化は、3か月移動平均の前年比前月差により判断している。
(71)2005年1月~20018年3月の期間を通してみると供給要因の寄与が平均6割程度と相対的に大きくなっている。
(72)例えば、塩野(2018)、五島他(2017)等。
(73)岡崎・敦賀(2015)。また、Shapiro et al.(2018)は、ニュース記事から作成した指数をモデルに加えることで予測力が向上したと報告している。
(74)Doms and Morin(2004)等。
(75)具体的には、LSTM(Long Short Term Memory)層を導入したRNNを用いている。詳細は岡谷(2015)等を参照。
(76)景気ウォッチャー調査における「変わらない」を除き、「良い、良くなっている」をポジティブ、「悪い、やや悪くなっている」をネガティブとして学習させている。
(77)この正答率は山本・松尾(2016)による先行研究と同程度である。
(78)対象とした新聞記事は日本経済新聞(朝刊)である。ただし、消費者マインドに関係が薄いと考えられる分類の記事は除いている。
(79)例えば、肉の卸売値やチャーター料の変化等、価格変化の記事が多い。
(80)例えば、Soroka(2006)等。
(81)POSデータの売上高・前年比を被説明変数とし、説明変数に新聞センチメント指数、消費税ダミー等を使用して、1期までのラグ項も加味した回帰分析を行なっている。
[目次]  [戻る]  [次へ]