研究背景和意义

2026-06-16 07:07:51 +08:00 · 2021-05-31 16:43:40 +08:00
parent fa8cf94dcc
commit 9bfe3271ce
1 changed files with 27 additions and 9 deletions
--- a/工作日志/毕业设计.md
+++ b/工作日志/毕业设计.md
@@ -4,22 +4,42 @@

 ### 研究背景和意义

-1. 恶意软件检测
-2. 数据的需求：数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决
-3. 针对以上背景，研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义
+1. 恶意软件检测。
+
+   1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢？肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习，获得机器学习模型，解决了数据量的问题和利用边缘设备的计算能力。
+   2. 同时传统的机器学习中，在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。
+   3. 这种为了从数据角度对机器学习模型进行提升思想，需要解决如下三个数据问题或者满足以下三个数据方面的需求。
+2. 数据的需求，数据的问题：
+
+   1. 数据量扩充的需求 和 数据隐私保护的需求、（为什么要研究）
+   2. 数据隐私保护进一步提升（研究内容）
+   3. 数据无标签问题（研究的内容）
+   4. 数据非独立同分布的问题（研究内容）
+   5. ~~数据动态变化问题（研究内容）~~
+3. 针对以上背景，研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面：
+
+   1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。
+   2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。

 > 说实话，我主要是解决联邦学习中的问题，而非解决恶意软件检测的问题。为了解决数据中存在的问题，而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关？而非与联邦学习强相关。
 >
 > 训练数据+训练算法->训练模型->恶意软件检测。
 >
 > 通过概述训练算法，解决训练数据中的需求和存在的问题，从而改善训练模型的准确率。而非直接更改模型，增强恶意软件检测的结果。需要把这个东西说明。
+>
+> 以下是本文章的研究逻辑：
+>
+> 传统机器学习方法存在问题（研究背景）---->扩展数据、隐私保护、边缘设备计算能力（研究的意义）---->研究联邦学习（研究方向）----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护（研究目标）------>半监督、非独立同分布、隐私保护方法（研究内容）

 ### 研究现状

-1. 恶意软件检测的机器学习方案
-2. 恶意软件检测的联邦学习方案
-3. 恶意软件检测与半监督学习的方案
-4. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。
+> 这里应该是本次研究对比的对象。
+
+1. 恶意软件检测的机器学习和联邦学习方案。
+2. 当前解决恶意软件数据隐私保护问题的方案——传统的数据隐私保护方法的研究（差分隐私、数据加密）
+3. 当前解决恶意软件数据无标签问题的方案——恶意软件检测与半监督学习的方案（sephew、基准分类器）
+4. 当前解决恶意软件数据非独立同分布问题的方案——现有的非独立同分布数据方案（prox？）
+5. 联邦学习的隐私保护、半监督学习、非独立同分布等开放问题的解决方案。

 ### 研究内容

@@ -63,7 +83,6 @@

 ## 第六章：恶意软件检测算法的实验与结果

-
 ## 第七章：恶意软件检测系统构建

 1. 训练控制模块
@@ -71,5 +90,4 @@
 3. 训练展示模块
 4. 实验结果对比模块

-
 ## 结论