mirror of
https://github.com/Estom/notes.git
synced 2026-04-13 18:00:27 +08:00
生活也太有意思了
This commit is contained in:
@@ -1,33 +1,5 @@
|
||||
## 计划
|
||||
|
||||
> 参考
|
||||
> 四月份计划、五月份计划、七月份计划
|
||||
|
||||
|
||||
### 数据处理(一周10.14-10.17)
|
||||
|
||||
* [ ] 数据集静态特征处理(AndMal)
|
||||
|
||||
|
||||
### 非独立同分布(一周10.18-10.24)
|
||||
* [ ] 非独立同分布实验效果调整
|
||||
|
||||
### 隐私保护(一周10.25-10.30)
|
||||
|
||||
* [ ] 隐私保护实验验证
|
||||
|
||||
### 系统构建(两周10.31-11.14)
|
||||
|
||||
> 关于系统构建的说明
|
||||
> *
|
||||
|
||||
* [ ] 服务注册与发现
|
||||
* [ ] 远程协同训练系统的实现
|
||||
* [ ] 前端界面实现
|
||||
|
||||
|
||||
### 论文专利(两周11.15-11.30)
|
||||
|
||||
## 收获
|
||||
|
||||
|
||||
|
||||
3
工作日志/2021年10月28日-组会.md
Normal file
3
工作日志/2021年10月28日-组会.md
Normal file
@@ -0,0 +1,3 @@
|
||||
## PPT
|
||||
|
||||
> 离谱,从国庆节后到现在,居然玩耍了这么久。以后的生活会是怎么样的呢?想想后续该做什么事情。世事艰难。
|
||||
17
工作日志/2021年11月17日-今日计划.md
Normal file
17
工作日志/2021年11月17日-今日计划.md
Normal file
@@ -0,0 +1,17 @@
|
||||
## 任务
|
||||
|
||||
论文阅读(十篇)
|
||||
* [ ] 基于深度学习的Android恶意软件检测:成果与挑战
|
||||
* [ ] 基于知识图谱的Android恶意家族多分类工具的设计和实现
|
||||
* [ ] 基于自适应学习技术的小样本分类、表征和检测
|
||||
* [ ] 基于PAC-Bayes的元学习算法研究
|
||||
* [ ] 具有隐私保护的云端移动恶意软件检测系统
|
||||
* [ ] Meta-Learning by Adjusting Priors Based on Extended PAC-Bayes Theory
|
||||
|
||||
|
||||
## 收获
|
||||
|
||||
> 哪有那么多愁善感。简单的问题就用简单的方法解决好了。
|
||||
> 另外,我发现我终于可以认认真真,开始面对生活了。我想刚开始的热情已经退却了。我可以开始平平淡淡的生活了。绝不妥协,这一次,我就是要不用焦虑驱动自己学习。而是靠着理智和认真。我要现在就开始,在回家之前把所有的东西做完。有足够的能力和时间。开始吧。
|
||||
> 关于学习,关于做实验,关于这一个月的计划,明白就好。没有必要做的非常好。但是无论是模型还是特征提取都要有自己的特点。
|
||||
> woc,每天浪费这些时间,干嘛呢。真无聊啊。你觉得这样做的真的有意义吗。自己确实不应该在这样的事情上浪费时间了。好多事情,好想做事。
|
||||
32
工作日志/2021年11月4日-十一月份计划.md
Normal file
32
工作日志/2021年11月4日-十一月份计划.md
Normal file
@@ -0,0 +1,32 @@
|
||||
|
||||
|
||||
> 参考
|
||||
> 四月份计划、五月份计划、七月份计划。
|
||||
> 开始执行具体的计划。
|
||||
|
||||
|
||||
### 数据处理11.8-11.14
|
||||
|
||||
* [ ] 恶意软件论文阅读 9-12月的论文阅读。提取关键信息。
|
||||
* [ ] 数据集特征提取和打标签
|
||||
* [ ] 模型建立&集中式机器学习
|
||||
|
||||
|
||||
### 非独立同分布实验11.15-11.21
|
||||
* [ ] 非独立同分布实验效果调整
|
||||
|
||||
### 隐私保护11.22-11.28
|
||||
|
||||
* [ ] 隐私保护实验验证
|
||||
|
||||
### 系统构建11.29-12.12
|
||||
|
||||
> 关于系统构建的说明
|
||||
> *
|
||||
|
||||
* [ ] 服务注册与发现
|
||||
* [ ] 远程协同训练系统的实现
|
||||
* [ ] 前端界面实现
|
||||
|
||||
|
||||
### 论文专利12.12-1.1
|
||||
73
工作日志/2021年11月5日-工作岗位.md
Normal file
73
工作日志/2021年11月5日-工作岗位.md
Normal file
@@ -0,0 +1,73 @@
|
||||
## 个人分析
|
||||
> 有个人教会自己生活就好了,你还指望,她能帮你打理好工作,你有病吧。当个人吧,做点人事。
|
||||
> 总有一天,你会发现彼此都是普通人。
|
||||
### 需求
|
||||
|
||||
* 工资(40%)
|
||||
* 总包40w以上,基础工资越高越好。
|
||||
* 年终奖+绩效奖金
|
||||
* 福利(10%)
|
||||
* 户口(中等,可以走双一流学科,大部分企业应该都能够提供户口)
|
||||
* 股票、签字费。可有可无
|
||||
* 五险一金(待遇基本一致)
|
||||
* 平台(40%)
|
||||
* 技术栈(java?C++?Go?)
|
||||
* 业务内容
|
||||
* 发展前景
|
||||
* 环境(20%)
|
||||
* 晋升空间
|
||||
* 工作环境(工位、饮食)
|
||||
* 人文环境(加班、)
|
||||
|
||||
## 需要考虑的公司
|
||||
|
||||
### IBM
|
||||
* 岗位:
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:拒绝
|
||||
|
||||
|
||||
### 美团
|
||||
|
||||
* 岗位:
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:
|
||||
|
||||
### 蚂蚁金服
|
||||
|
||||
* 岗位:
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:
|
||||
|
||||
### 字节跳动
|
||||
|
||||
* 岗位:
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:
|
||||
|
||||
|
||||
### 华为
|
||||
|
||||
|
||||
|
||||
* 岗位:
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:
|
||||
|
||||
|
||||
### 小米
|
||||
|
||||
* 岗位:
|
||||
* 云计算-软件开发
|
||||
* 待遇:
|
||||
* 优劣:
|
||||
* 进度:
|
||||
|
||||
* 完全明白我们的业务内容,估计也不会跑出这个范围。太偏业务了。想去做点底层技术,能够加深对技术理解的工作。
|
||||
* 大概能找到真正适合自己的地方。尝试一下吧。回来把这张表格填完。
|
||||
* 不要妄自菲薄,也不要过度用词。
|
||||
6
工作日志/2021年11月8日-今日计划.md
Normal file
6
工作日志/2021年11月8日-今日计划.md
Normal file
@@ -0,0 +1,6 @@
|
||||
## 任务
|
||||
|
||||
|
||||
## 收获
|
||||
|
||||
>
|
||||
@@ -1,3 +1,5 @@
|
||||
|
||||
|
||||
## 收获
|
||||
|
||||
|
||||
|
||||
@@ -10,7 +10,7 @@
|
||||
|
||||
昨天看到一个名词,回避型依恋人格。你以为周围的人都那样,其实最如此的是自己。你的心里保护机制太强了,除了自己,你没办法信任任何人,然而,你多么想多么想多么想有那么一个可以信任的人呢?孤独,孤独是内心的拉扯,不是没有朋友,而是内心想孤立自己。
|
||||
|
||||
“如果你想要和别人制造几班,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。
|
||||
“如果你想要和别人制造羁绊,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。
|
||||
|
||||
为什么过去的三个月,感觉那么舒服那么轻松,为什么从这周开始,就莫名其妙的又开始思考这些无用的东西?问题出在哪里?又开始孤独了,又想找个人依靠了?又想有个人可以分享生活了?没有人愿意和你成为那样的朋友,只有因为签订了契约迫不得已的人。最后还是会败给自己的冲动,呵,不过是再安慰自己一次,你很擅长这个。
|
||||
|
||||
|
||||
56
工作日志/毕业设计.md
56
工作日志/毕业设计.md
@@ -4,40 +4,36 @@
|
||||
|
||||
### 1.1 研究背景和意义
|
||||
|
||||
1. 恶意软件检测。
|
||||
1. (巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据
|
||||
1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。
|
||||
2. 同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。
|
||||
3. 这种为了从数据角度对机器学习模型进行提升思想,需要解决如下三个数据问题或者满足以下三个数据方面的需求。
|
||||
2. 数据的需求,数据的问题:
|
||||
|
||||
1. 数据量扩充的需求 和 数据隐私保护的需求、(为什么要研究)
|
||||
2. 数据隐私保护进一步提升(研究内容)
|
||||
3. 数据非独立同分布的问题(研究内容)
|
||||
3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面:
|
||||
1. 安卓系统应用。
|
||||
2. 恶意软件泛滥。
|
||||
3. 恶意软件检测。基于机器学习的恶意软件检测方案(巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据。
|
||||
4. 隐私保护问题。
|
||||
5. 数据的需求和隐私保护的矛盾(当前恶意软件检测中存在的主要矛盾和问题)。数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。
|
||||
6. 最后提出基于联邦学习的恶意软件检测。结合恶意软件来说。数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决。恶意软件数据隐私保护进一步提升(研究内容)。恶意软件数据非独立同分布的问题(研究内容)。
|
||||
|
||||
7. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面:
|
||||
1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。
|
||||
2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。
|
||||
4. android+恶意软件---->恶意软件检测---->基于机器学习的恶意软件检测方案
|
||||
5. 数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决
|
||||
6. 针对以上背景,研究基于深度学习的恶意软件检测模型构建方案有十分重要的意义
|
||||
3. 增强恶意软件检测的能力。增强隐私保护能力。
|
||||
|
||||
> 说实话,我主要是解决联邦学习中的问题,而非解决恶意软件检测的问题。为了解决数据中存在的问题,而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关?而非与联邦学习强相关。
|
||||
>
|
||||
> 训练数据+训练算法->训练模型->恶意软件检测。
|
||||
> 原始数据+特征提取->训练数据+训练算法->训练模型->恶意软件检测。
|
||||
>
|
||||
> 通过概述训练算法,解决训练数据中的需求和存在的问题,从而改善训练模型的准确率。而非直接更改模型,增强恶意软件检测的结果。需要把这个东西说明。
|
||||
>
|
||||
> 以下是本文章的研究逻辑:
|
||||
>
|
||||
> 传统机器学习方法存在问题(研究背景)---->扩展数据、隐私保护、边缘设备计算能力(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护(研究目标)------>半监督、非独立同分布、隐私保护方法(研究内容)
|
||||
> 传统机器学习方法存在问题(研究背景)---->非独立同分布、隐私保护(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->非独立同分布、隐私保护(研究目标)------>非独立同分布、隐私保护方法(研究内容)
|
||||
|
||||
### 1.2 国内外研究现状
|
||||
|
||||
> 这里应该是本次研究对比的对象。
|
||||
|
||||
#### 恶意软件的研究现状
|
||||
|
||||
1. 数据集方案(当前流行的主流数据集、恶意软件数据集)
|
||||
2. 特征提取方案()
|
||||
3. 模型构建方案()
|
||||
4. 缺乏保护隐私的方案
|
||||
|
||||
#### 联邦学习的研究现状
|
||||
|
||||
* 联邦学习与非独立同分布问题
|
||||
@@ -148,12 +144,34 @@
|
||||
|
||||
|
||||
### 6.2 系统详细设计
|
||||
> 存在多个功能模块。按子系统讲解。需要起个合理的名字。
|
||||
> 服务端子系统
|
||||
> * 服务注册和发现模块
|
||||
> * 客户端选择模块
|
||||
> * 控制服务模块
|
||||
> * 聚合服务模块(提供多种聚合服务)
|
||||
> * 训练服务模块(提供多种训练类型的聚合,不同端)
|
||||
>
|
||||
> 控制端子系统
|
||||
> * 训练控制模块
|
||||
> *
|
||||
>
|
||||
> 客户端子系统
|
||||
> * 服务访问模块
|
||||
> * 模型训练模块
|
||||
|
||||
|
||||
1. 特征提取模块
|
||||
2. 训练控制模块
|
||||
3. 网络通信模块
|
||||
4. 训练展示模块
|
||||
5. 实验结果对比模块
|
||||
|
||||
### 6.3 系统测试
|
||||
> 列出测试过程中的关键指标。
|
||||
1. 各个模块的功能测试
|
||||
2. 系统整体的集成测试
|
||||
3. 最终的界面展示
|
||||
## 第七章:结论
|
||||
> 3个研究内容。
|
||||
### 基于贡献度和元学习的联邦学习算法
|
||||
|
||||
Reference in New Issue
Block a user