diff --git a/工作日志/毕业设计.md b/工作日志/毕业设计.md index 3f515efa..4bbd6f85 100644 --- a/工作日志/毕业设计.md +++ b/工作日志/毕业设计.md @@ -4,22 +4,42 @@ ### 研究背景和意义 -1. 恶意软件检测 -2. 数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决 -3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义 +1. 恶意软件检测。 + + 1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。 + 2. 同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。 + 3. 这种为了从数据角度对机器学习模型进行提升思想,需要解决如下三个数据问题或者满足以下三个数据方面的需求。 +2. 数据的需求,数据的问题: + + 1. 数据量扩充的需求 和 数据隐私保护的需求、(为什么要研究) + 2. 数据隐私保护进一步提升(研究内容) + 3. 数据无标签问题(研究的内容) + 4. 数据非独立同分布的问题(研究内容) + 5. ~~数据动态变化问题(研究内容)~~ +3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面: + + 1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。 + 2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。 > 说实话,我主要是解决联邦学习中的问题,而非解决恶意软件检测的问题。为了解决数据中存在的问题,而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关?而非与联邦学习强相关。 > > 训练数据+训练算法->训练模型->恶意软件检测。 > > 通过概述训练算法,解决训练数据中的需求和存在的问题,从而改善训练模型的准确率。而非直接更改模型,增强恶意软件检测的结果。需要把这个东西说明。 +> +> 以下是本文章的研究逻辑: +> +> 传统机器学习方法存在问题(研究背景)---->扩展数据、隐私保护、边缘设备计算能力(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护(研究目标)------>半监督、非独立同分布、隐私保护方法(研究内容) ### 研究现状 -1. 恶意软件检测的机器学习方案 -2. 恶意软件检测的联邦学习方案 -3. 恶意软件检测与半监督学习的方案 -4. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。 +> 这里应该是本次研究对比的对象。 + +1. 恶意软件检测的机器学习和联邦学习方案。 +2. 当前解决恶意软件数据隐私保护问题的方案——传统的数据隐私保护方法的研究(差分隐私、数据加密) +3. 当前解决恶意软件数据无标签问题的方案——恶意软件检测与半监督学习的方案(sephew、基准分类器) +4. 当前解决恶意软件数据非独立同分布问题的方案——现有的非独立同分布数据方案(prox?) +5. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。 ### 研究内容 @@ -63,7 +83,6 @@ ## 第六章:恶意软件检测算法的实验与结果 - ## 第七章:恶意软件检测系统构建 1. 训练控制模块 @@ -71,5 +90,4 @@ 3. 训练展示模块 4. 实验结果对比模块 - ## 结论