diff --git a/Office/ppt/说明.md b/Office/ppt/说明.md new file mode 100644 index 00000000..b1681536 --- /dev/null +++ b/Office/ppt/说明.md @@ -0,0 +1,2 @@ +1. 多级列表表示文字层级 +2. 图形,可以表示递进关系 \ No newline at end of file diff --git a/工作日志/2020年11月29日-开题报告.md b/工作日志/2020年11月29日-开题报告.md index cca35e85..36cc129f 100644 --- a/工作日志/2020年11月29日-开题报告.md +++ b/工作日志/2020年11月29日-开题报告.md @@ -264,7 +264,33 @@ Android场景->恶意软件的研究+Android隐私保护的提出。 2. √威胁信息的定义以及生成的相关内容。 2. ×画图。蒋师兄发的那些图有点好看,可以模仿一下。因为有涉及到太多的原理算法相关的内容。可以日后做结题的时候这样画。 3. √做PPT。今天只需要完成PPT的框架。 -4. PPT的美化 -5. PPT讲稿 -6. 开题报告修改,添加图相关的描述。 +4. √PPT的美化 +5. √国内外研究现状处的表格问题 +6. √威胁信息生成的研究现状有明显的逻辑问题 +7. √隐私窃取攻击?模型窃取攻击?威胁模型存在严重问题 +8. √研究内容处的框图问题。 +9. √PPT文字太多 +10. √打印PPT讲稿问题 +11. √开题报告修改,添加图相关的描述。 +12. √文献综述修改,错字等内容检查。 +13. √系统提交材料。 +14. √打印开题的材料 + +------------------------------------ +PPT说明 + +* 颜色 + * 背景颜色:靛蓝 -20 + * 文字颜色:黑白 + * 文字特殊标注:靛蓝 0 + * 前景颜色:靛蓝 0 + * 线框颜色:靛蓝 +20 +* 字号 + * 目录32 + * 标题32 + * 一级24 + * 二级20 + * 三级16 + * 表格18 + * 参考文献14 diff --git a/工作日志/2020年12月18日-答辩完修改.md b/工作日志/2020年12月18日-答辩完修改.md new file mode 100644 index 00000000..c9f2158b --- /dev/null +++ b/工作日志/2020年12月18日-答辩完修改.md @@ -0,0 +1,115 @@ +# 基于联邦学习的Android恶意软件检测方法研究 + +## 1 论文选题的背景与意义1000字 +### 选题背景 +Android场景->恶意软件的研究->隐私保护的提出 + +1. 构建威胁情报共享系统。 +2. 恶意软件数据分析生成恶意软件情报。 +3. 使用联邦在线学习,训练恶意软件情报的自动生成模型。 + +### 选题意义 +> 应该描述存在的为,和解决这些问题的价值。而不是,用什么方案去解决这些问题。这应该是当前研究中有待解决的问题。 +> 不对,这里不应该指出研究中存在的问题,应该给出研究隐私保护、使用人工智能方法、特征提取、在线机器学习的方法的好处。 + +1. √在线学习机制,能够实时监控恶意软件的变化,掌握最新的恶意软件的情报。为恶意软件情报的利用提供高效、快捷、准确的生成方案。 +2. √联邦学习生成恶意软件的特征,保护用户或组织本地的隐私和数据。 +3. ×构建威胁情报共享系统,实现情报实时共享。增强威胁相应系统的响应速度。 +4. √恶意软件识别与人工智能方法的可解释研究,用来增强恶意软件检测与后续的防御工作。 +5. ×与威胁情报领域结合,从恶意软件特征->转换为恶意软件威胁情报->通过共享的方式->参与到恶意软件的分析和检测中->更好的识别恶意软件。 + +因此,研究在保护用户隐私的前提下,使用人工智能方案实现恶意软件特征的提取,具有理论价值与应用价值。 + +## 2 国内外研究现状及发展动态3000字 + +### 国内外研究现状 +* Android恶意软件的研究现状。 +* 机器学习算法可解释性研究现状。 +* 联邦学习算法的研究现状。 + + + +### 有待解决的问题 + +* 传统的方案忽视了隐私保护。无法解决隐私保护与机器学习应用的矛盾。 +* 传统的方案没有给出理论的解释,人们往往只能通过机器学习方法进行分类,却无法解释分类的结果。分类器往往无法部署应用。结合人工智能(机器学习)+可解释性,通过大数据分析得出。自动化构建。恶意软件特征提取方案。 +* 传统的方案无法保证病毒特征的更新。====>联邦在线学习系统,能够跟随最新识别出的病毒,更新联邦学习模型的特征。 +* 联邦学习应用存在的问题: + * 模型中毒 + * 模型隐私。前两个是训练过程中的威胁问题。 + * 用户本地无法提供模型标签。训练本身存在的问题,使用半监督学习,能够推断用户在本地的运行程序的标签。 + + +## 3 论文的研究目标和研究内容1000字 + +### 研究目标 +本课题对恶意软件检测与分析过程进行研究,旨在实现一个基于联邦学习的恶意软件检测与威胁信息生成系统,该系统具有如下特点: +1. 能够在保护用户隐私的前提下,完成深度神经网络模型的训练,模型在恶意软件检测中具有较好的性能和效果。 +2. 生成恶意软件的威胁信息,作为恶意软件判别的指标和依据,包括浅层特征和深层特征组合信息,威胁信息能够解释模型判别的原因。 +3. 能够在线学习新的恶意软件特征,处理具有新特征的恶意软件。 + + +### 研究内容 + +1. 基于深度神经网络的恶意软件检测模型。给出模型效果的评估方法。 +2. 基于神经网络解释方法的威胁信息生成方法 。给出解释方法的评估方法。 +3. 面向隐私保护的联邦在线学习方法。 + +## 4 关键技术和技术难点2000字 + +### 关键技术路线 +> 关键结束应该论述的是流程和原理,是解决问题的流程和原理,可以不与具体的方法挂钩,但是需要是所有方法通用的流程和步骤。 +---------------------------- +神经网络模型的关键技术 +* 神经网络建模技术(把技术流程和原理画出来) + * 特征生成技术(通过特征工程确定特征的维度,利用APK分析工具,提取恶意软件的特征) + * 模型构建技术(怎么建立神经网络模型,调整神经网络模型的参数) + * 模型评估方法(圆下曲线、F1结果) + + +---------------------------- +面向隐私保护的联邦在线学习方法的关键技术 +* 联邦在线学习技术(把技术流程和原理画出来) + * 隐私保护技术(防止模型窃取) + * 安全增强技术(防止模型中毒,来自恶意客户端的攻击,增强模型的鲁棒性和安全性) + * 联邦学习技术(各个步骤,如何实现联邦学习过程) + * 在线学习技术(需要搭建在线的学习系统,能够用户选择参与到训练计划当中,确定何时进行再次荀兰) + + +### 技术难点 + + + + + +## 5 论文的研究计划100字 + + + +------------------------------------- +开题答辩后的问题修改 + +1. √感觉我研究的内容,三个方法,都是模型训练的方法。用于改进模型训练过程中存在的问题。而不是恶意软件检测的方法,也不是检测过程中存在的问题。所以题目应该是“基于联邦学习的恶意软件检测方法研究吗”,研究的是恶意软件检测方法吗?研究的是恶意软件检测模型的构建的方法。(貌似没有什么问题) +2. √数据集的问题,需要指出数据集的相关研究。 +3. 突出隐私保护的方法 +4. Android恶意软件的特点指明(夏老师) + 1. √传统的恶意软件检测方法的说明,如何侵犯了用户隐私,如何进行代码变化 + 2. 恶意软件分析技术的说明。 +5. 系统架构图(熊老师 +6. 完成 + 1. 联邦学习 + 2. 半监督学习 + 3. 增量学习 + 4. 系统架构 + + +最大的教训就是,充分利用好自己身边的资源啊。老师师兄啥的,哪个都能给你点指点的,广泛地咨询,再动笔写。 + + +1. 联邦学习研究内容、技术和系统框架结构的明确。 +2. 半监督学习的算法和技术 +3. 增量学习的算法和技术。 + + +----------------------------- +特征敏感 \ No newline at end of file diff --git a/工作日志/2020年12月21日-开题后工作.md b/工作日志/2020年12月21日-开题后工作.md new file mode 100644 index 00000000..604f7437 --- /dev/null +++ b/工作日志/2020年12月21日-开题后工作.md @@ -0,0 +1,32 @@ +## 主要方面 +* 毕业设计 +* 实习就业 +* 生活娱乐 + +## 毕业设计 +1. 技术调研,三个方向的相关论文阅读技术范式确定。 +2. 基础知识,实现机器学习+深度学习的基本算法。并看李宏毅的教程和西瓜书。 +3. 数据集构建。相关数据集、反编译工具 +4. 特征提取和特征筛选 +5. 神经网络的构建与本地训练。效果评估,验证机器学习算法的有效性 +6. 联邦学习框架的实现。效果评估,验证联邦学习框架的准确率不会降低 +7. 威胁模型的应用。验证威胁抵抗效果 +8. 半监督学习的实现。验证半监督方法的有效性。 +9. 集中在线增量学习的实现,验证算法的有效性。 +10. 联邦在线半监督学习的实现。 +11. 最终的效果评估。 + +## 实习就业 + +1. LeetCode +2. kaggle +3. 参加实习与系统开发相关的工作 + +## 生活娱乐 + +1. 看书 +2. 旅行 +3. 电影番剧 +4. 游戏 + +