おはようございます🌞
プライバシーテック研究所編集部です。
さて、今週も張り切っていきましょう!
先週配信した記事はこちら
【技術】合成データアルゴリズム table-GAN
Generative Adversarial Networks(GAN)をベースとして用いた、テーブルデータに対する汎用的な合成データの最初のアルゴリズムである 「table-GAN 」の解説記事となります。
GANについてのブログ記事はすでに公開しているので、参考にしてください。
ポイント
table-GANは、テーブルデータで合成データを作成する汎用的な最初のDeep Learningのモデルである。
table-GANは、k匿名化の手法と同程度の精度(モデル適合性)を示し、従来の手法より高い適合性を示した。
table-GANは、k匿名化の手法と比べてより高いプライバシー性を持ち、プライバシー性をコントロールすることができる。
【技術】表形式の合成データに関するサーベイ論文の紹介
表形式データに着目したサーベイ論文を参考に、表形式の合成データにおける代表的な生成方法と評価方法についての記事を公開しました。
ポイント
表形式のデータでは、離散値特徴量と連続値特徴量の混在やデータの特徴量の相関の弱さが理由で、有用な表形式のデータセットを合成することは困難であると認識されている。
表形式の合成データの生成方法は古典的アプローチ・深層学習によるアプローチ・その他のアプローチの3つに分類され、機械学習モデルや深層学習によるアプローチが主に使用されている。
表形式の合成データにおけるGANに基づいた生成方法は数多く提案されているが、それぞれの手法に長所と短所があるため、生成したい合成データの特徴を認識した上で適切な手法を選択する必要がある。
【ホワイトペーパーの宣伝】
Acompanyでは、定期的にホワイトペーパーを執筆、共有しています。プライバシー保護とデータ活用の両立に向けたアプローチや、Cookie規制による今後についての知見を公開しています。気になった方は下のボタンよりご確認ください!
現在公開中のホワイトペーパー
【イベントアーカイブ動画の宣伝】
プライバシーテック研究所では、過去に開催したイベントのアーカイブ動画を公開しています。
現在公開中のアーカイブ動画
【Acompanyの中の人を紹介する「アカントピック」】
プライバシーテック研究所を運営する、株式会社Acompanyのメンバー紹介のPodcastを公開しています。
ここまで読んでいただきありがとうございます🙌
プライバシーテック研究所では定期的にプライバシーテックに関する記事を更新しています!
またTwitter(@Acompany_co)もやっています!是非フォローください!最新トレンドのニュース解説を微力ながら展開しています