G検定のシラバスにおける「ディープラーニングの社会実装に向けて」に関連する事項を記載します。
プロジェクト管理
CRISP-DM
CRISP-DM (CRoss-Industry Standard Processing for Data Mining) は、機械学習やデータサイエンスのプロジェクトを進めるにあたり、指針となる 6 つの段階からなるモデルです。
MLOps
- Machine Learning と Operations を合成した造語です。
- DevOps から派生した概念です。
- AI を本番環境で開発しながら運用するまでの概念です。
- AI をビジネスに活用する際に必要となります。
- システム運用開始後も、継続して推論精度が高く安定したシステムとなるように開発運用のプロセスを回す必要があります。
オープンデータセット
- 画像処理
- 自然言語処理
- 音声処理
アノテーション
- 教師データの作成作業です。
- 通常は人間によって行われます。
XAI (Explainable AI)
- 出力に関する判断根拠や解釈を説明できるようなモデルの AI です。
フィルターバブル
インターネットの検索サイト等が、各ユーザが見たくないような情報をフィルタリングして遮断することにより、まるで自分が見たい情報の泡に包まれたようになることです。
法律と倫理
Privacy by Design (PbD)
開発段階からプライバシー侵害の予防を指向する考え方です。
Security by Design
開発段階からセキュリティに配慮します。
Value sensitive design
価値全般に配慮した設計思想です。
著作権法
- 論文や写真など著作物にあたるデータを利用する場合は、著作権者から許諾を得ることが必要です。
- ただし、日本の著作権法では、「情報解析の用に供する場合」に著作物を利用することが、営利・非営利を問わず適法とされています。
- インターネット上または他の媒体の写真を利用する際に、著作権者一人一人に許諾を得ずに、無断で複製しても適法となります。
- 第三者と共有、一般に販売、ネット上に公開 することも一定の条件下で適法です。
- 「著作権者の利益を不当に害する」場合はその限りではありません。
不正競争防止法
営業秘密にあたるデータや、限定提供データ。
個人情報保護法
- 購買履歴や位置情報などのパーソナルデータ。
- 個人情報を取り扱う際には、利用目的をできる限り特定しなければなりません。
- 利用目的が変更になる場合は、原則として事前の本人の同意が必要となります。
- また、利用目的を本人に通知する、または公表する必要があります。
機微情報
人種、犯罪の経歴、病歴 などのデータ。金融分野におけるデータの区分です。
「金融分野における個人情報保護に関するガイドライン」
機微情報について、利用や第三者提供だけでなく、取得についても原則禁止とされています。
個人情報保護法における「要配慮個人情報」の取り扱い原則よりも厳しい規律となっています。
「AI・データの利用に関する契約ガイドライン」
- 経済産業省が 2018年に策定しました。
- 2019年に改定版を公表しました。
匿名加工情報
個人情報保護法に記載されています。特定の個人を識別できないように、個人情報を加工した情報です。
仮名加工情報
- 2020年6月の個人情報保護法の改正によって提示されました。
- 匿名加工情報は、2015年の改正によって創設されました。
- その情報自体から特定の個人を識別できなければよく、他の情報と組み合わせることで、元の個人情報を復元できても良いとされます。
- 第三者への提供は禁止されていますが、委託先に提供することは許可されています。
「カメラ画像利活用ガイドブック」
- 経済産業省、総務省、IoT推進コンソーシアムが2017年に第一版を公開しました。
- 2018年に改定版を公開しました。
ELSI (Ethical, Legal and Social Implications)
- 倫理的、法的、社会的影響を一体のものとして検討する試みです。
- 生命科学の領域で使われていた用語ですが、AI開発でも重要視されるようになっています。
ACM FAT (Fairness, Accountability, and Transparency)
- FAT (Fairness, Accountability, and Transparency) は、プライバシーや公平性の問題について取り組む研究領域です。
- ACM は計算機科学の国際学会です。
- ACM FAT は ACM が主催しており、様々な研究発表や議論が行われています。
GDPR (General Data Protection Regulation)
- EU一般データ保護規則 (General Data Protection Regulation; GDPR)
- 2018年5月に運用が開始されました。
- EU 向けにサービスを提供する場合、日本企業であっても法的規制を受ける場合があります。
知的財産
- 収集・生成したデータや学習済みモデルは、一定の条件を持たせば知的財産として保護されます。
- 特許法、著作権法、不正競争防止法。
- AIが生み出した「作品」の権利や保護のあり方については、いまも議論が行われています。
蒸留
教師役の出力と同じようになるように、生徒用 AI のパラメータを調整していくことを繰返すことです。教師役の学習済みモデルのエッセンスが蒸留されて、生徒役に移ることになりますが、リバース・エンジニアリングにおける非破壊検査に近いものであり、技術的手段によっては阻止しにくいと言われています。
Partnership on AI (PAI)
- 2016年に組織されました。
- Amazon、Google、Facebook、IBM、Microsoft などアメリカのIT企業が中心となっています。
その他のガイドライン
- 「倫理的に調和された設計」
- 2019年、学術団体の IEEE。
- 「アシロマAI原則」
- Future of Life Institute (NPO法人)
- 技術開発における、安全性の検証や透明性の確保。
- 「信頼性を備えたAIのための倫理ガイドライン」
- 2019年4月、欧州委員会。
- 「AI白書」
- 2020年2月、欧州委員会。
- AIのレギュレーションの枠組みの方向性。
- 「北京AI原則」
- 2019年5月、中国政府。
- 民間部門におけるAI技術の開発等に関する10項目の原則
- 2020年1月、アメリカ政府。
- 「人間中心のAI社会原則」
- 2019年、日本の内閣府。
その他
データサイエンティストのスキルセット
- ビジネス力
- データサイエンス力
- データエンジニアリング力
ディープ・ブルー
1997年、チェス世界チャンピオンを破った IBM が開発した AI です。
ドローンの飛行規制
人または物件との間に 30m 以上の距離を保って飛行させることが必要です。そうでない場合は、国土交通大臣の承認が必要となります。
End-to-End Learning
ロボットの一連の動作を人手を介さずに、単一のニューラルネットワークで表現して学習します。
決定係数
回帰分析などで、データに対する推定された回帰式の当てはまりの良さを表します。
AAAI アメリカ人工知能学会
米国で開催されている、人口知能分野における国際学会の名称です。
グリッドサーチ
学習モデルに用いられるハイパーパラメータのチューニング方法の一つです。
関連記事
- 強化学習および深層強化学習 (G検定)G検定のシラバスにおける、強化学習および深層強化学習について記載します。 強化学習 方策 (policy) 強化学習で達成したいことは、報酬和を最大にする方策 (policy) π\piπ を学習することです。 状態 SSS、行動 AAA
- 機械学習の具体的手法 (G検定)G検定のシラバスにおける「機械学習の具体的手法」に関連する事項を記載します。 線形回帰 説明変数、目的変数 説明変数と目的変数が、直線や超平面といった、線形の関係にある状態を線形回帰とよびます。説明変数が 2つ以上の場合を重回帰とよびます。線形回帰を用いたモデルの学習は、教師あり学習です。 ![](/ugc/techimages/0b5d1f17-daae-4518-a7b6-d3e61
- 人工知能に関する一般事項 (G検定)G検定のシラバスにおける 「人工知能(AI)とは(人工知能の定義)」 「人工知能をめぐる動向」 「人工知能分野の問題」 に関連する事項を記載します。 エニアック (ENIAC) 1946年にアメリカのペンシルバニア大学で開発された、真空管を使った巨大な計算機です。 ダートマス会議 1956年にアメリカで開催されました。 ジョン・マッカーシーが、「人工知能」という言葉を
- ディープラーニングの手法 (G検定)G検定のシラバスにおける「ディープラーニングの概要」および「ディープラーニングの手法」に関連する事項を記載します。 シグモイド関数を用いた学習における勾配消失について ディープラーニングで用いられる活性化関数の一つに、シグモイド関数があります。 y=11+exp(−x)y = \frac{1}{1 + \exp(-x)} y=1+exp(−x)1シグモイド関数を用いて、以下のような合成関数を考...
- ディープラーニングの比較的新しいモデル (G検定)G検定に向けて、比較的新しいモデルについて記載します。 深層生成モデル 生成モデル 画像のデータセットがどのような分布になっているかを推測し、その分布に基づいて、元の画像と似たような画像データを生成するモデルです。 深層生成モデル ディープラーニングを取り入れた生成モデルのことです。 潜在空間 深層生成モデルでは、元データセットから画像が持つ潜在空間を