Path to でーたさいえんてぃすと

データサイエンスの勉強の過程を公開していきます。

ラーメン消費量・店舗数 × 血圧

 

仮説

都道府県別ラーメン消費量と血圧などの生活習慣病に関する検診データに相関関係があるのではないか?

 

 

使用データ

データ詳細
  • 消費量:令和元年(2019年)に、都道府県民1人が、1年間に外食で何杯のラーメン(中華そば)を食べているのかを掲載しています(1杯は醤油ラーメン)。今回のデータでは都道府県民1人あたりの支出金額(消費金額)を、主なラーメン消費量の解析対象としました。

  • 店舗数:タウンページから「ラーメン店」として登録されている店舗数を都道府県別に集計したデータです。都道府県ごとに人口が違うので、各都道府県の人口で除して人口10万人あたりの店舗数を算出して解析しています。

  • 収縮期血圧:NDBオープンデータに公開されている特定健診のデータです。都道府県ごとに、血圧180以上、160以上180未満、140以上160未満、130以上140未満、120以上130未満、120未満の人数が男女別に記載されています。これも都道府県ごとの人口で除算し、人口10万人あたりの人数を算出して解析しています。

 

 

解析の流れ

  1. データ整形
  2. 店舗数と消費量
    1. 相関関係を確認
    2. 線形回帰
  3. 都道府県別収縮期血圧人数と店舗数・消費量
    1. 相関関係・線形回帰
    2. 血圧別解析

 

 

結果

店舗数と消費量

都道府県における人口10万人あたりの店舗数とラーメン消費量(上でも説明したように都道府県民1人あたりの支出金額(消費金額))をメインに説明していきます。

相関関係を確認

図1 都道府県別ラーメンデータの相関係数

上の図は都道府県別ラーメン消費量のデータ_2019と都道府県別ラーメン店店舗数_2020のデータを元にした相関係数です。想像に難くないように、人口10万人あたり店舗数と金額には0.71という中程度〜強い正の相関が見られます。

線形回帰

図2 人口10万人あたり店舗数とラーメン消費量(金額)の関係

こちらの図は人口10万人あたり店舗数とラーメン消費量(金額)の関係を表した散布図および線形回帰分析を行った結果を示した図です。相関関係からも予想できるように、やはり各都道府県における人口10万人あたりの店舗数が多いと、都道府県民一人あたりの消費金額も多くなるようです。ただし、線形回帰分析の決定係数は0.501とあまり精度が良くないことは否めません…。

 

都道府県別収縮期血圧人数と店舗数・消費量

都道府県別・収縮期血圧の範囲(血圧180以上、160以上180未満、140以上160未満、130以上140未満、120以上130未満、120未満)別人数と店舗数・消費量の関係を見ていきます。

今回は比較的大きな違いが見られた血圧140以上と血圧120未満の男性データで比較してみます。

 

血圧140以上

図3 相関係数都道府県別収縮期血圧人数と店舗数・消費量(血圧140以上))

 

図4 散布図・線形回帰分析
都道府県別収縮期血圧人数と店舗数・消費量(血圧140以上))

都道府県別血圧140以上(高血圧)の人数とラーメン消費量(金額)の間の相関係数は0.626、都道府県別血圧140以上(高血圧)の人数と人口10万人あたり店舗数の間の相関係数は0.662でした。

 

 

血圧120未満

図5 相関係数都道府県別収縮期血圧人数と店舗数・消費量(血圧120未満))

 

図5 散布図・線形回帰分析
都道府県別収縮期血圧人数と店舗数・消費量(血圧120未満))

都道府県別血圧120未満(正常血圧)の人数とラーメン消費量(金額)の間の相関係数は0.288、都道府県別血圧120未満(正常血圧)の人数と人口10万人あたり店舗数の間の相関係数は0.162でした。

 

以上の結果をまとめると、

  • 都道府県別ラーメンデータとして、店舗数と消費量(金額)に相関関係あり(0.71など)
  • 都道府県別収縮期血圧人数と店舗数・消費量(男性/女性)に相関関係あり
    • 金額:0.626
    • 人口10万人あたり店舗数:0.662
  • 血圧140以上 vs 血圧120未満で比較すると、血圧140以上の方が相関が強い
    •  血圧140以上 vs 血圧120未満
      • 金額:0.626 vs 0.288
      • 人口10万人あたり店舗数:0.662 vs 0.162
    • 回帰直線の傾きを見るに、線形回帰の係数も大きい

のような結果になりました。

 

議論

以下に結果から推察されることを挙げてみます。

  • ラーメン消費量(金額)と人口10万人あたり店舗数が多いと、人口10万人あたり高血圧患者数も多いという相関関係がある
    • ただし因果関係ではないので、ラーメンが高血圧に与える影響がどれほど大きいかを定量化したわけではない
    • ラーメンなど、高塩分の食事を好む都道府県の風潮があると、高血圧患者が多い可能性

つまり、ラーメンの食べすぎが原因で高血圧患者が多いという可能性より、高塩分の食事を好む人達が多い都道府県では、当然高血圧患者も多いという可能性の方が高いと思われます。ただ、血圧140以上の人数と血圧120未満の人数を比較した際、明らかに相関係数の値が異なる(血圧140以上の人数の方が相関係数が大きい)という結果を定量化できたのは意味があることだと考えています。

 

限界点

以下に、今回の解析での限界点や不備について列挙します…。

  • データの年が揃えられていない
  • 人口10万人あたりを算出するとき、男女別に除算していない
  • 線形回帰の精度が良くない
  • 1杯あたりのラーメンの金額が考慮されていない
    • 例えば、1杯あたりのラーメンの値段が高い都道府県では、消費量が少なくても金額が高くなる可能性がある

 

 

以上です。

この前、ラーメン消費量第一位は何県、みたいなニュースをたまたま見たので、血圧とは関連あるのかなと思い、解析してみました。

他にもオープンデータはたくさんあるので、色々解析してみたいと思います。

 

 

 

参考サイト

https://region-case.com/rank-r1-ramen/

https://todo-ran.com/t/kiji/11806

第7回NDBオープンデータ(https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177221_00011.html)

https://www.stat.go.jp/data/nihon/02.html