生活也太有意思了

This commit is contained in:
Estom
2021-11-22 10:51:32 +08:00
parent 33987d501d
commit 534a527c3d
9 changed files with 171 additions and 48 deletions

View File

@@ -1,33 +1,5 @@
## 计划
> 参考
> 四月份计划、五月份计划、七月份计划
### 数据处理一周10.14-10.17
* [ ] 数据集静态特征处理AndMal
### 非独立同分布一周10.18-10.24
* [ ] 非独立同分布实验效果调整
### 隐私保护一周10.25-10.30
* [ ] 隐私保护实验验证
### 系统构建两周10.31-11.14
> 关于系统构建的说明
> *
* [ ] 服务注册与发现
* [ ] 远程协同训练系统的实现
* [ ] 前端界面实现
### 论文专利两周11.15-11.30
## 收获

View File

@@ -0,0 +1,3 @@
## PPT
> 离谱,从国庆节后到现在,居然玩耍了这么久。以后的生活会是怎么样的呢?想想后续该做什么事情。世事艰难。

View File

@@ -0,0 +1,17 @@
## 任务
论文阅读(十篇)
* [ ] 基于深度学习的Android恶意软件检测成果与挑战
* [ ] 基于知识图谱的Android恶意家族多分类工具的设计和实现
* [ ] 基于自适应学习技术的小样本分类、表征和检测
* [ ] 基于PAC-Bayes的元学习算法研究
* [ ] 具有隐私保护的云端移动恶意软件检测系统
* [ ] Meta-Learning by Adjusting Priors Based on Extended PAC-Bayes Theory
## 收获
> 哪有那么多愁善感。简单的问题就用简单的方法解决好了。
> 另外,我发现我终于可以认认真真,开始面对生活了。我想刚开始的热情已经退却了。我可以开始平平淡淡的生活了。绝不妥协,这一次,我就是要不用焦虑驱动自己学习。而是靠着理智和认真。我要现在就开始,在回家之前把所有的东西做完。有足够的能力和时间。开始吧。
> 关于学习,关于做实验,关于这一个月的计划,明白就好。没有必要做的非常好。但是无论是模型还是特征提取都要有自己的特点。
> woc每天浪费这些时间干嘛呢。真无聊啊。你觉得这样做的真的有意义吗。自己确实不应该在这样的事情上浪费时间了。好多事情好想做事。

View File

@@ -0,0 +1,32 @@
> 参考
> 四月份计划、五月份计划、七月份计划。
> 开始执行具体的计划。
### 数据处理11.8-11.14
* [ ] 恶意软件论文阅读 9-12月的论文阅读。提取关键信息。
* [ ] 数据集特征提取和打标签
* [ ] 模型建立&集中式机器学习
### 非独立同分布实验11.15-11.21
* [ ] 非独立同分布实验效果调整
### 隐私保护11.22-11.28
* [ ] 隐私保护实验验证
### 系统构建11.29-12.12
> 关于系统构建的说明
> *
* [ ] 服务注册与发现
* [ ] 远程协同训练系统的实现
* [ ] 前端界面实现
### 论文专利12.12-1.1

View File

@@ -0,0 +1,73 @@
## 个人分析
> 有个人教会自己生活就好了,你还指望,她能帮你打理好工作,你有病吧。当个人吧,做点人事。
> 总有一天,你会发现彼此都是普通人。
### 需求
* 工资40%
* 总包40w以上基础工资越高越好。
* 年终奖+绩效奖金
* 福利10%
* 户口(中等,可以走双一流学科,大部分企业应该都能够提供户口)
* 股票、签字费。可有可无
* 五险一金(待遇基本一致)
* 平台40%
* 技术栈javaC++Go
* 业务内容
* 发展前景
* 环境20%
* 晋升空间
* 工作环境(工位、饮食)
* 人文环境(加班、)
## 需要考虑的公司
### IBM
* 岗位:
* 待遇:
* 优劣:
* 进度:拒绝
### 美团
* 岗位:
* 待遇:
* 优劣:
* 进度:
### 蚂蚁金服
* 岗位:
* 待遇:
* 优劣:
* 进度:
### 字节跳动
* 岗位:
* 待遇:
* 优劣:
* 进度:
### 华为
* 岗位:
* 待遇:
* 优劣:
* 进度:
### 小米
* 岗位:
* 云计算-软件开发
* 待遇:
* 优劣:
* 进度:
* 完全明白我们的业务内容,估计也不会跑出这个范围。太偏业务了。想去做点底层技术,能够加深对技术理解的工作。
* 大概能找到真正适合自己的地方。尝试一下吧。回来把这张表格填完。
* 不要妄自菲薄,也不要过度用词。

View File

@@ -0,0 +1,6 @@
## 任务
## 收获
>

View File

@@ -1,3 +1,5 @@
## 收获

View File

@@ -10,7 +10,7 @@
昨天看到一个名词,回避型依恋人格。你以为周围的人都那样,其实最如此的是自己。你的心里保护机制太强了,除了自己,你没办法信任任何人,然而,你多么想多么想多么想有那么一个可以信任的人呢?孤独,孤独是内心的拉扯,不是没有朋友,而是内心想孤立自己。
“如果你想要和别人制造几班,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。
“如果你想要和别人制造羁绊,就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。
为什么过去的三个月,感觉那么舒服那么轻松,为什么从这周开始,就莫名其妙的又开始思考这些无用的东西?问题出在哪里?又开始孤独了,又想找个人依靠了?又想有个人可以分享生活了?没有人愿意和你成为那样的朋友,只有因为签订了契约迫不得已的人。最后还是会败给自己的冲动,呵,不过是再安慰自己一次,你很擅长这个。

View File

@@ -4,40 +4,36 @@
### 1.1 研究背景和意义
1. 恶意软件检测
1. (巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据
1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力
2. 同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题。结合恶意软件来说
3. 这种为了从数据角度对机器学习模型进行提升思想,需要解决如下三个数据问题或者满足以下三个数据方面的需求
2. 数据的需求,数据的问题:
1. 数据量扩充的需求 和 数据隐私保护的需求、(为什么要研究)
2. 数据隐私保护进一步提升(研究内容)
3. 数据非独立同分布的问题(研究内容)
3. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面:
1. 安卓系统应用
2. 恶意软件泛滥。
3. 恶意软件检测。基于机器学习的恶意软件检测方案(巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。)尽管机器学习服务取得了成功,但它们的有效性在很大程度上依赖于大量的数据
4. 隐私保护问题
5. 数据的需求和隐私保护的矛盾(当前恶意软件检测中存在的主要矛盾和问题)。数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢?肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习,获得机器学习模型,解决了数据量的问题和利用边缘设备的计算能力。同时传统的机器学习中,在数据搜集过程中侵犯隐私的问题
6. 最后提出基于联邦学习的恶意软件检测。结合恶意软件来说。数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决。恶意软件数据隐私保护进一步提升(研究内容)。恶意软件数据非独立同分布的问题(研究内容)。
7. 针对以上背景,研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面:
1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。
2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。
4. android+恶意软件---->恶意软件检测---->基于机器学习的恶意软件检测方案
5. 数据的需求:数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决
6. 针对以上背景,研究基于深度学习的恶意软件检测模型构建方案有十分重要的意义
3. 增强恶意软件检测的能力。增强隐私保护能力。
> 说实话,我主要是解决联邦学习中的问题,而非解决恶意软件检测的问题。为了解决数据中存在的问题,而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关?而非与联邦学习强相关。
>
> 训练数据+训练算法->训练模型->恶意软件检测。
> 原始数据+特征提取->训练数据+训练算法->训练模型->恶意软件检测。
>
> 通过概述训练算法,解决训练数据中的需求和存在的问题,从而改善训练模型的准确率。而非直接更改模型,增强恶意软件检测的结果。需要把这个东西说明。
>
> 以下是本文章的研究逻辑:
>
> 传统机器学习方法存在问题(研究背景)---->扩展数据、隐私保护、边缘设备计算能力(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护(研究目标)------>半监督、非独立同分布、隐私保护方法(研究内容)
> 传统机器学习方法存在问题(研究背景)---->非独立同分布、隐私保护(研究的意义)---->研究联邦学习(研究方向)----->联邦学习中存在的一系列问题----->非独立同分布、隐私保护(研究目标)------>非独立同分布、隐私保护方法(研究内容)
### 1.2 国内外研究现状
> 这里应该是本次研究对比的对象。
#### 恶意软件的研究现状
1. 数据集方案(当前流行的主流数据集、恶意软件数据集)
2. 特征提取方案()
3. 模型构建方案()
4. 缺乏保护隐私的方案
#### 联邦学习的研究现状
* 联邦学习与非独立同分布问题
@@ -148,12 +144,34 @@
### 6.2 系统详细设计
> 存在多个功能模块。按子系统讲解。需要起个合理的名字。
> 服务端子系统
> * 服务注册和发现模块
> * 客户端选择模块
> * 控制服务模块
> * 聚合服务模块(提供多种聚合服务)
> * 训练服务模块(提供多种训练类型的聚合,不同端)
>
> 控制端子系统
> * 训练控制模块
> *
>
> 客户端子系统
> * 服务访问模块
> * 模型训练模块
1. 特征提取模块
2. 训练控制模块
3. 网络通信模块
4. 训练展示模块
5. 实验结果对比模块
### 6.3 系统测试
> 列出测试过程中的关键指标。
1. 各个模块的功能测试
2. 系统整体的集成测试
3. 最终的界面展示
## 第七章:结论
> 3个研究内容。
### 基于贡献度和元学习的联邦学习算法