首都圏ラジオ聴取データを常時radikoデータから推計へ [ラジオ]
スポンサードリンク
ビデオリサーチは、これまで、年6回、1週間の聴取率調査週間(いわゆるスペシャルウィーク)に、「ラジオ個人聴取率調査」を行ってきた。
その調査方法は、1,000人程度の無作為抽出の人に対する、紙またはWebによるアンケートによる。
よく、この「1,000人」という数値に対し、そんな数のアンケート調査が信用できるはずがない、という意見を言う人も多いが、そういう人は数学の統計の授業で寝ていた人なんだろうな。
母数に対しどのぐらいの数のサンプルを取れば、ある程度信頼がおける数値になるのか、統計学の長年の研究の積み重ねによる出てくるサンプル数を、直感だけで覆せる度胸には恐れ入る。
首都圏ラジオ聴取データ × radikoデータ~推計によるラジオ聴取データの365日化へ~ | ニュース || コーポレートサイト
それはさておき、そのビデオリサーチが、その聴取率調査データと、radikoが保有している「radikoのアクセス数データ」を用いて、その相関関係について研究を進めてきたそうで、その成果として、「radikoのアクセス数データ」をベースに、聴取率調査週間以外の期間の聴取率についても、推計することができる技術を開発したそうだ。
具体的な算出ロジックは、聴取率調査週間の聴取率と、同週のradikoデータの関係性を機械学習させ、その学習したパラメータに基づき、radikoデータから、聴取率調査週間以外の聴取率相当のラジオ聴取データを推計するのだそうだ。
この推計した聴取データを「ラジオ365データ(仮称)」と仮称する。
この「ラジオ365データ」は、聴取率調査週間が来るたびに機械学習を繰り返し、さらに精度を高めてゆくそうだ。
今後、この「ラジオ365データ」を、ラジオ局やスポンサーに対して提供するべく準備を進めるらしい。
「ラジオ365データ」に対しても、「radikoとラジオでは聴取者層も違うのだから、そんなもの信用ならない」「何でもAIと言えば正しいわけじゃない」などと、何も考えずに直感だけで一刀両断で切り捨てている人も少なくない。
私はそんなことはないと考える。自分が、もしこの事業の仕事を請け負ったとしたら、できる勝算があるからだ。
利用者数が伸び悩むラジコ 無料会員モデルの構築を目指す - ライブドアニュース
2019年3月の段階で、radikoの月間ユニークユーザー数は約700万人、radikoプレミアムの会員数は約57万人だという。
このうち、現在、会員登録時に、年齢や性別の入力が必要なradikoプレミアムの会員数だけでも、約57万人の母数がある。
しかも、約57万人というのは、アンケート調査による調査率調査より圧倒的に母数が多い上に、サンプルではなく実際のアクセス数である。
一方、ラジオの聴取率調査と、radikoのリスナーの年齢構成、男女比は、当然ながら異なる。
だから、radikoのアクセス数から単純に聴取率を求めても、従来の聴取率調査と一致する訳がない。
しかし、ラジオの聴取率調査のアンケートにおける、年齢別、男女別の分布は分かっており、radikoプレミアムの年齢別、男女別の分布も実数として分かっている。
ならば、まずは、radikoプレミアム会員の年齢構成&男女別のアクセス数を、従来の聴取率調査の年齢構成、男女比に合わせて補正してやり、その上で、従来の従来の聴取率調査結果と、radikoのアクセス数(実数)の相関を取ればいい。
おそらく、それを、radikoのスタート以来のデータで積み重ねてやってみたら、かなりの精度で、「radikoのアクセス数データ」から従来のアンケートによる聴取率が推計できるモデル(計算式)が、研究成果として分かったのだと思われる。
聴取率の推計モデルがある程度確立すれば、その細かなパラメータに対し、機械学習を行い、精度を高めるというのは、全く荒唐無稽の話ではなく、難しい話でもない。
さらに、この推計は、「radikoのアクセス数データ」の母数を増やせれば、精度を上げることもできるはず。
伸び悩む「ラジコ」、データ活用でブレークスルーはあるか
radikoが無料会員制度を導入しようとしている噂もあるが、狙いはこの辺にあると思われる。
radikoの導入しようとする無料会員制度については、まだ明らかになっていないので、あくまで推測だが、もし、従来の利用者の利便性を変えないとするなら、
・非会員は従来通り、エリア内放送&タイムフリーのみ聴ける
・無料会員は、全国のリアルタイム放送+エリア内放送&タイムフリーが聴ける
・プレミアく会員は、従来通り、全国のリアルタイム放送&タイムフリーが聴ける
という案も考えられるし、思い切って、現在の非会員に、サービスを引き続き利用したければ、無料会員への登録を必須とし、
・非会員は、エリア内のリアルタイム放送しか聴けなくなる
・無料会員は、エリア内放送&タイムフリーが聴ける
・プレミアく会員は、全国のリアルタイム放送&タイムフリーが聴ける
という制度変更もあり得るかも(こちらは、一時的にリスナー数を減らす危険性もある)。
そして、無料会員に登録する際、性別や年齢を入れさせる。
そうすると、現在のradikoプレミアムより何倍もの属性付きのサンプル数が確保できるから、聴取率の予測精度もさらに上げられるだろう。
何より、聴取率調査週間がサンプル調査なのに対し、「radikoのアクセス数データ」は実数である。しかも、毎日24時間データを取ることができるから、テレビと同様に、番組内の1分単位で聴取率の変化を分析でき、それにより、番組内容のきめ細かた改善もできるようになるだろう。
最終的には、両者の相関関係が信頼の置けるものと、ラジオ局やスポンサーが認識し始めたら、「radikoのアクセス数データ」から出る「ラジオ365データ」のデータで十分という話になり、調査にコストがかかるアンケートによる聴取率調査はいつか廃止になるかもしれない。
そうなれば、スペシャルウイークの期間だけ、やたらゲストやプレゼントを頑張るという不健全な現状もなくなることだろう。
今回の発表は、それほど重大な発表だと私は思っている。
関連記事:
radikoを巡るラジオ業界の動き:コンテンツって言い方、嫌いだけど:So-netブログ
スポンサードリンク
ビデオリサーチは、これまで、年6回、1週間の聴取率調査週間(いわゆるスペシャルウィーク)に、「ラジオ個人聴取率調査」を行ってきた。
その調査方法は、1,000人程度の無作為抽出の人に対する、紙またはWebによるアンケートによる。
よく、この「1,000人」という数値に対し、そんな数のアンケート調査が信用できるはずがない、という意見を言う人も多いが、そういう人は数学の統計の授業で寝ていた人なんだろうな。
母数に対しどのぐらいの数のサンプルを取れば、ある程度信頼がおける数値になるのか、統計学の長年の研究の積み重ねによる出てくるサンプル数を、直感だけで覆せる度胸には恐れ入る。
首都圏ラジオ聴取データ × radikoデータ~推計によるラジオ聴取データの365日化へ~ | ニュース || コーポレートサイト
それはさておき、そのビデオリサーチが、その聴取率調査データと、radikoが保有している「radikoのアクセス数データ」を用いて、その相関関係について研究を進めてきたそうで、その成果として、「radikoのアクセス数データ」をベースに、聴取率調査週間以外の期間の聴取率についても、推計することができる技術を開発したそうだ。
具体的な算出ロジックは、聴取率調査週間の聴取率と、同週のradikoデータの関係性を機械学習させ、その学習したパラメータに基づき、radikoデータから、聴取率調査週間以外の聴取率相当のラジオ聴取データを推計するのだそうだ。
この推計した聴取データを「ラジオ365データ(仮称)」と仮称する。
この「ラジオ365データ」は、聴取率調査週間が来るたびに機械学習を繰り返し、さらに精度を高めてゆくそうだ。
今後、この「ラジオ365データ」を、ラジオ局やスポンサーに対して提供するべく準備を進めるらしい。
「ラジオ365データ」に対しても、「radikoとラジオでは聴取者層も違うのだから、そんなもの信用ならない」「何でもAIと言えば正しいわけじゃない」などと、何も考えずに直感だけで一刀両断で切り捨てている人も少なくない。
私はそんなことはないと考える。自分が、もしこの事業の仕事を請け負ったとしたら、できる勝算があるからだ。
利用者数が伸び悩むラジコ 無料会員モデルの構築を目指す - ライブドアニュース
2019年3月の段階で、radikoの月間ユニークユーザー数は約700万人、radikoプレミアムの会員数は約57万人だという。
このうち、現在、会員登録時に、年齢や性別の入力が必要なradikoプレミアムの会員数だけでも、約57万人の母数がある。
しかも、約57万人というのは、アンケート調査による調査率調査より圧倒的に母数が多い上に、サンプルではなく実際のアクセス数である。
一方、ラジオの聴取率調査と、radikoのリスナーの年齢構成、男女比は、当然ながら異なる。
だから、radikoのアクセス数から単純に聴取率を求めても、従来の聴取率調査と一致する訳がない。
しかし、ラジオの聴取率調査のアンケートにおける、年齢別、男女別の分布は分かっており、radikoプレミアムの年齢別、男女別の分布も実数として分かっている。
ならば、まずは、radikoプレミアム会員の年齢構成&男女別のアクセス数を、従来の聴取率調査の年齢構成、男女比に合わせて補正してやり、その上で、従来の従来の聴取率調査結果と、radikoのアクセス数(実数)の相関を取ればいい。
おそらく、それを、radikoのスタート以来のデータで積み重ねてやってみたら、かなりの精度で、「radikoのアクセス数データ」から従来のアンケートによる聴取率が推計できるモデル(計算式)が、研究成果として分かったのだと思われる。
聴取率の推計モデルがある程度確立すれば、その細かなパラメータに対し、機械学習を行い、精度を高めるというのは、全く荒唐無稽の話ではなく、難しい話でもない。
さらに、この推計は、「radikoのアクセス数データ」の母数を増やせれば、精度を上げることもできるはず。
伸び悩む「ラジコ」、データ活用でブレークスルーはあるか
radikoが無料会員制度を導入しようとしている噂もあるが、狙いはこの辺にあると思われる。
radikoの導入しようとする無料会員制度については、まだ明らかになっていないので、あくまで推測だが、もし、従来の利用者の利便性を変えないとするなら、
・非会員は従来通り、エリア内放送&タイムフリーのみ聴ける
・無料会員は、全国のリアルタイム放送+エリア内放送&タイムフリーが聴ける
・プレミアく会員は、従来通り、全国のリアルタイム放送&タイムフリーが聴ける
という案も考えられるし、思い切って、現在の非会員に、サービスを引き続き利用したければ、無料会員への登録を必須とし、
・非会員は、エリア内のリアルタイム放送しか聴けなくなる
・無料会員は、エリア内放送&タイムフリーが聴ける
・プレミアく会員は、全国のリアルタイム放送&タイムフリーが聴ける
という制度変更もあり得るかも(こちらは、一時的にリスナー数を減らす危険性もある)。
そして、無料会員に登録する際、性別や年齢を入れさせる。
そうすると、現在のradikoプレミアムより何倍もの属性付きのサンプル数が確保できるから、聴取率の予測精度もさらに上げられるだろう。
何より、聴取率調査週間がサンプル調査なのに対し、「radikoのアクセス数データ」は実数である。しかも、毎日24時間データを取ることができるから、テレビと同様に、番組内の1分単位で聴取率の変化を分析でき、それにより、番組内容のきめ細かた改善もできるようになるだろう。
最終的には、両者の相関関係が信頼の置けるものと、ラジオ局やスポンサーが認識し始めたら、「radikoのアクセス数データ」から出る「ラジオ365データ」のデータで十分という話になり、調査にコストがかかるアンケートによる聴取率調査はいつか廃止になるかもしれない。
そうなれば、スペシャルウイークの期間だけ、やたらゲストやプレゼントを頑張るという不健全な現状もなくなることだろう。
今回の発表は、それほど重大な発表だと私は思っている。
関連記事:
radikoを巡るラジオ業界の動き:コンテンツって言い方、嫌いだけど:So-netブログ
![]() にほんブログ村 | ![]() 人気ブログランキングへ |
スポンサードリンク
どうもです。
ラジオ365データは精度が高まれば間違いなく最強のデータになるかもしれませんね。聴取率とは違うかもしれませんが、番組の全国ランキングが作成されて「日本一聴かれているラジオ番組」がわかるようになるのでしょうか?
by 関東のラジオ聴き (2019-07-16 00:17)
関東のラジオ聴き さん、こんにちは。
radikoの場合は、人口で割った「率」ではなく、実際のアクセス数が分かるのですから、絶対数として、日本一聞かれているラジオ番組って、分かるはずですよね。
是非公開して欲しいですね
by naniwa48 (2019-07-16 12:45)