研究背景和意义

This commit is contained in:
estomm
2021-05-31 16:43:40 +08:00
parent fa8cf94dcc
commit 9bfe3271ce

View File

@@ -4,22 +4,42 @@
### 研究背景和意义
1. 恶意软件检测
2. 数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决
3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义
1. 恶意软件检测
1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。
2. 同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。
3. 这种为了从数据角度对机器学习模型进行提升思想,需要解决如下三个数据问题或者满足以下三个数据方面的需求。
2. 数据的需求,数据的问题:
1. 数据量扩充的需求 和 数据隐私保护的需求、(为什么要研究)
2. 数据隐私保护进一步提升(研究内容)
3. 数据无标签问题(研究的内容)
4. 数据非独立同分布的问题(研究内容)
5. ~~数据动态变化问题(研究内容)~~
3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面:
1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。
2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。
> 说实话,我主要是解决联邦学习中的问题,而非解决恶意软件检测的问题。为了解决数据中存在的问题,而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关?而非与联邦学习强相关。
>
> 训练数据+训练算法->训练模型->恶意软件检测。
>
> 通过概述训练算法,解决训练数据中的需求和存在的问题,从而改善训练模型的准确率。而非直接更改模型,增强恶意软件检测的结果。需要把这个东西说明。
>
> 以下是本文章的研究逻辑:
>
> 传统机器学习方法存在问题(研究背景)---->扩展数据、隐私保护、边缘设备计算能力(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护(研究目标)------>半监督、非独立同分布、隐私保护方法(研究内容)
### 研究现状
1. 恶意软件检测的机器学习方案
2. 恶意软件检测的联邦学习方案
3. 恶意软件检测与半监督学习的方案
4. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。
> 这里应该是本次研究对比的对象。
1. 恶意软件检测的机器学习和联邦学习方案
2. 当前解决恶意软件数据隐私保护问题的方案——传统的数据隐私保护方法的研究(差分隐私、数据加密)
3. 当前解决恶意软件数据无标签问题的方案——恶意软件检测与半监督学习的方案sephew、基准分类器
4. 当前解决恶意软件数据非独立同分布问题的方案——现有的非独立同分布数据方案prox
5. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。
### 研究内容
@@ -63,7 +83,6 @@
## 第六章:恶意软件检测算法的实验与结果
## 第七章:恶意软件检测系统构建
1. 训练控制模块
@@ -71,5 +90,4 @@
3. 训练展示模块
4. 实验结果对比模块
## 结论