diff --git a/工作日志/2021年10月1日-十月份计划.md b/工作日志/2021年10月1日-十月份计划.md index 9d04ccc8..48846d17 100644 --- a/工作日志/2021年10月1日-十月份计划.md +++ b/工作日志/2021年10月1日-十月份计划.md @@ -1,33 +1,5 @@ ## 计划 -> 参考 -> 四月份计划、五月份计划、七月份计划 - - -### 数据处理(一周10.14-10.17) - -* [ ] 数据集静态特征处理(AndMal) - - -### 非独立同分布(一周10.18-10.24) -* [ ] 非独立同分布实验效果调整 - -### 隐私保护(一周10.25-10.30) - -* [ ] 隐私保护实验验证 - -### 系统构建(两周10.31-11.14) - -> 关于系统构建的说明 -> * - -* [ ] 服务注册与发现 -* [ ] 远程协同训练系统的实现 -* [ ] 前端界面实现 - - -### 论文专利(两周11.15-11.30) - ## 收获 diff --git a/工作日志/2021年10月28日-组会.md b/工作日志/2021年10月28日-组会.md new file mode 100644 index 00000000..1b56a11b --- /dev/null +++ b/工作日志/2021年10月28日-组会.md @@ -0,0 +1,3 @@ +## PPT + +> 离谱,从国庆节后到现在,居然玩耍了这么久。以后的生活会是怎么样的呢?想想后续该做什么事情。世事艰难。 diff --git a/工作日志/2021年11月17日-今日计划.md b/工作日志/2021年11月17日-今日计划.md new file mode 100644 index 00000000..e773aed4 --- /dev/null +++ b/工作日志/2021年11月17日-今日计划.md @@ -0,0 +1,17 @@ +## 任务 + +论文阅读(十篇) +* [ ] 基于深度学习的Android恶意软件检测:成果与挑战 +* [ ] 基于知识图谱的Android恶意家族多分类工具的设计和实现 +* [ ] 基于自适应学习技术的小样本分类、表征和检测 +* [ ] 基于PAC-Bayes的元学习算法研究 +* [ ] 具有隐私保护的云端移动恶意软件检测系统 +* [ ] Meta-Learning by Adjusting Priors Based on Extended PAC-Bayes Theory + + +## 收获 + +> 哪有那么多愁善感。简单的问题就用简单的方法解决好了。 +> 另外,我发现我终于可以认认真真,开始面对生活了。我想刚开始的热情已经退却了。我可以开始平平淡淡的生活了。绝不妥协,这一次,我就是要不用焦虑驱动自己学习。而是靠着理智和认真。我要现在就开始,在回家之前把所有的东西做完。有足够的能力和时间。开始吧。 +> 关于学习,关于做实验,关于这一个月的计划,明白就好。没有必要做的非常好。但是无论是模型还是特征提取都要有自己的特点。 +> woc,每天浪费这些时间,干嘛呢。真无聊啊。你觉得这样做的真的有意义吗。自己确实不应该在这样的事情上浪费时间了。好多事情,好想做事。 \ No newline at end of file diff --git a/工作日志/2021年11月4日-十一月份计划.md b/工作日志/2021年11月4日-十一月份计划.md new file mode 100644 index 00000000..c7c4388b --- /dev/null +++ b/工作日志/2021年11月4日-十一月份计划.md @@ -0,0 +1,32 @@ + + +> 参考 +> 四月份计划、五月份计划、七月份计划。 +> 开始执行具体的计划。 + + +### 数据处理11.8-11.14 + +* [ ] 恶意软件论文阅读 9-12月的论文阅读。提取关键信息。 +* [ ] 数据集特征提取和打标签 +* [ ] 模型建立&集中式机器学习 + + +### 非独立同分布实验11.15-11.21 +* [ ] 非独立同分布实验效果调整 + +### 隐私保护11.22-11.28 + +* [ ] 隐私保护实验验证 + +### 系统构建11.29-12.12 + +> 关于系统构建的说明 +> * + +* [ ] 服务注册与发现 +* [ ] 远程协同训练系统的实现 +* [ ] 前端界面实现 + + +### 论文专利12.12-1.1 diff --git a/工作日志/2021年11月5日-工作岗位.md b/工作日志/2021年11月5日-工作岗位.md new file mode 100644 index 00000000..91f70bb8 --- /dev/null +++ b/工作日志/2021年11月5日-工作岗位.md @@ -0,0 +1,73 @@ +## 个人分析 +> 有个人教会自己生活就好了,你还指望,她能帮你打理好工作,你有病吧。当个人吧,做点人事。 +> 总有一天,你会发现彼此都是普通人。 +### 需求 + +* 工资(40%) + * 总包40w以上,基础工资越高越好。 + * 年终奖+绩效奖金 +* 福利(10%) + * 户口(中等,可以走双一流学科,大部分企业应该都能够提供户口) + * 股票、签字费。可有可无 + * 五险一金(待遇基本一致) +* 平台(40%) + * 技术栈(java?C++?Go?) + * 业务内容 + * 发展前景 +* 环境(20%) + * 晋升空间 + * 工作环境(工位、饮食) + * 人文环境(加班、) + +## 需要考虑的公司 + +### IBM +* 岗位: +* 待遇: +* 优劣: +* 进度:拒绝 + + +### 美团 + +* 岗位: +* 待遇: +* 优劣: +* 进度: + +### 蚂蚁金服 + +* 岗位: +* 待遇: +* 优劣: +* 进度: + +### 字节跳动 + +* 岗位: +* 待遇: +* 优劣: +* 进度: + + +### 华为 + + + +* 岗位: +* 待遇: +* 优劣: +* 进度: + + +### 小米 + +* 岗位: + * 云计算-软件开发 +* 待遇: +* 优劣: +* 进度: + +* 完全明白我们的业务内容,估计也不会跑出这个范围。太偏业务了。想去做点底层技术,能够加深对技术理解的工作。 +* 大概能找到真正适合自己的地方。尝试一下吧。回来把这张表格填完。 +* 不要妄自菲薄,也不要过度用词。 \ No newline at end of file diff --git a/工作日志/2021年11月8日-今日计划.md b/工作日志/2021年11月8日-今日计划.md new file mode 100644 index 00000000..ea9c20b1 --- /dev/null +++ b/工作日志/2021年11月8日-今日计划.md @@ -0,0 +1,6 @@ +## 任务 + + +## 收获 + +> \ No newline at end of file diff --git a/工作日志/2021年8月9日-今日计划.md b/工作日志/2021年8月9日-今日计划.md index 01be017b..db10880e 100644 --- a/工作日志/2021年8月9日-今日计划.md +++ b/工作日志/2021年8月9日-今日计划.md @@ -1,3 +1,5 @@ + + ## 收获 diff --git a/工作日志/2021年9月9日-今日计划.md b/工作日志/2021年9月9日-今日计划.md index 3cad5352..8e9a0adc 100644 --- a/工作日志/2021年9月9日-今日计划.md +++ b/工作日志/2021年9月9日-今日计划.md @@ -10,7 +10,7 @@ 昨天看到一个名词,回避型依恋人格。你以为周围的人都那样,其实最如此的是自己。你的心里保护机制太强了,除了自己,你没办法信任任何人,然而,你多么想多么想多么想有那么一个可以信任的人呢?孤独,孤独是内心的拉扯,不是没有朋友,而是内心想孤立自己。 -“如果你想要和别人制造几班,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。 +“如果你想要和别人制造羁绊,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。 为什么过去的三个月,感觉那么舒服那么轻松,为什么从这周开始,就莫名其妙的又开始思考这些无用的东西?问题出在哪里?又开始孤独了,又想找个人依靠了?又想有个人可以分享生活了?没有人愿意和你成为那样的朋友,只有因为签订了契约迫不得已的人。最后还是会败给自己的冲动,呵,不过是再安慰自己一次,你很擅长这个。 diff --git a/工作日志/毕业设计.md b/工作日志/毕业设计.md index 45979bca..884427b6 100644 --- a/工作日志/毕业设计.md +++ b/工作日志/毕业设计.md @@ -4,40 +4,36 @@ ### 1.1 研究背景和意义 -1. 恶意软件检测。 - 1. (巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据 - 1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。 - 2. 同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。 - 3. 这种为了从数据角度对机器学习模型进行提升思想,需要解决如下三个数据问题或者满足以下三个数据方面的需求。 -2. 数据的需求,数据的问题: - - 1. 数据量扩充的需求 和 数据隐私保护的需求、(为什么要研究) - 2. 数据隐私保护进一步提升(研究内容) - 3. 数据非独立同分布的问题(研究内容) -3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面: +1. 安卓系统应用。 +2. 恶意软件泛滥。 +3. 恶意软件检测。基于机器学习的恶意软件检测方案(巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据。 +4. 隐私保护问题。 +5. 数据的需求和隐私保护的矛盾(当前恶意软件检测中存在的主要矛盾和问题)。数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。 +6. 最后提出基于联邦学习的恶意软件检测。结合恶意软件来说。数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决。恶意软件数据隐私保护进一步提升(研究内容)。恶意软件数据非独立同分布的问题(研究内容)。 +7. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面: 1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。 2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。 -4. android+恶意软件---->恶意软件检测---->基于机器学习的恶意软件检测方案 -5. 数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决 -6. 针对以上背景,研究基于深度学习的恶意软件检测模型构建方案有十分重要的意义 + 3. 增强恶意软件检测的能力。增强隐私保护能力。 > 说实话,我主要是解决联邦学习中的问题,而非解决恶意软件检测的问题。为了解决数据中存在的问题,而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关?而非与联邦学习强相关。 > -> 训练数据+训练算法->训练模型->恶意软件检测。 +> 原始数据+特征提取->训练数据+训练算法->训练模型->恶意软件检测。 > > 通过概述训练算法,解决训练数据中的需求和存在的问题,从而改善训练模型的准确率。而非直接更改模型,增强恶意软件检测的结果。需要把这个东西说明。 > > 以下是本文章的研究逻辑: > -> 传统机器学习方法存在问题(研究背景)---->扩展数据、隐私保护、边缘设备计算能力(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护(研究目标)------>半监督、非独立同分布、隐私保护方法(研究内容) +> 传统机器学习方法存在问题(研究背景)---->非独立同分布、隐私保护(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->非独立同分布、隐私保护(研究目标)------>非独立同分布、隐私保护方法(研究内容) ### 1.2 国内外研究现状 - -> 这里应该是本次研究对比的对象。 - #### 恶意软件的研究现状 +1. 数据集方案(当前流行的主流数据集、恶意软件数据集) +2. 特征提取方案() +3. 模型构建方案() +4. 缺乏保护隐私的方案 + #### 联邦学习的研究现状 * 联邦学习与非独立同分布问题 @@ -148,12 +144,34 @@ ### 6.2 系统详细设计 +> 存在多个功能模块。按子系统讲解。需要起个合理的名字。 +> 服务端子系统 +> * 服务注册和发现模块 +> * 客户端选择模块 +> * 控制服务模块 +> * 聚合服务模块(提供多种聚合服务) +> * 训练服务模块(提供多种训练类型的聚合,不同端) +> +> 控制端子系统 +> * 训练控制模块 +> * +> +> 客户端子系统 +> * 服务访问模块 +> * 模型训练模块 + + 1. 特征提取模块 2. 训练控制模块 3. 网络通信模块 4. 训练展示模块 5. 实验结果对比模块 +### 6.3 系统测试 +> 列出测试过程中的关键指标。 +1. 各个模块的功能测试 +2. 系统整体的集成测试 +3. 最终的界面展示 ## 第七章:结论 > 3个研究内容。 ### 基于贡献度和元学习的联邦学习算法