生活也太有意思了

2026-04-13 18:00:27 +08:00 · 2021-11-22 10:51:32 +08:00
parent 33987d501d
commit 534a527c3d
9 changed files with 171 additions and 48 deletions
--- a/工作日志/2021年10月1日-十月份计划.md
+++ b/工作日志/2021年10月1日-十月份计划.md
@@ -1,33 +1,5 @@
 ## 计划

-> 参考
-> 四月份计划、五月份计划、七月份计划
-
-
-### 数据处理（一周10.14-10.17）
-
-* [ ] 数据集静态特征处理（AndMal）
-
-
-### 非独立同分布（一周10.18-10.24）
-* [ ] 非独立同分布实验效果调整
-
-### 隐私保护（一周10.25-10.30）
-
-* [ ] 隐私保护实验验证
-
-### 系统构建（两周10.31-11.14）
-
-> 关于系统构建的说明
-> * 
-
-* [ ] 服务注册与发现
-* [ ] 远程协同训练系统的实现
-* [ ] 前端界面实现
-
-
-### 论文专利（两周11.15-11.30）
-
 ## 收获


--- a/工作日志/2021年10月28日-组会.md
+++ b/工作日志/2021年10月28日-组会.md
@@ -0,0 +1,3 @@
+## PPT 
+
+> 离谱，从国庆节后到现在，居然玩耍了这么久。以后的生活会是怎么样的呢？想想后续该做什么事情。世事艰难。
--- a/工作日志/2021年11月17日-今日计划.md
+++ b/工作日志/2021年11月17日-今日计划.md
@@ -0,0 +1,17 @@
+## 任务
+
+论文阅读（十篇）
+* [ ] 基于深度学习的Android恶意软件检测：成果与挑战
+* [ ] 基于知识图谱的Android恶意家族多分类工具的设计和实现
+* [ ] 基于自适应学习技术的小样本分类、表征和检测
+* [ ] 基于PAC-Bayes的元学习算法研究
+* [ ] 具有隐私保护的云端移动恶意软件检测系统
+* [ ] Meta-Learning by Adjusting Priors Based on Extended PAC-Bayes Theory
+
+
+## 收获
+
+> 哪有那么多愁善感。简单的问题就用简单的方法解决好了。
+> 另外，我发现我终于可以认认真真，开始面对生活了。我想刚开始的热情已经退却了。我可以开始平平淡淡的生活了。绝不妥协，这一次，我就是要不用焦虑驱动自己学习。而是靠着理智和认真。我要现在就开始，在回家之前把所有的东西做完。有足够的能力和时间。开始吧。
+> 关于学习，关于做实验，关于这一个月的计划，明白就好。没有必要做的非常好。但是无论是模型还是特征提取都要有自己的特点。
+> woc，每天浪费这些时间，干嘛呢。真无聊啊。你觉得这样做的真的有意义吗。自己确实不应该在这样的事情上浪费时间了。好多事情，好想做事。
--- a/工作日志/2021年11月4日-十一月份计划.md
+++ b/工作日志/2021年11月4日-十一月份计划.md
@@ -0,0 +1,32 @@
+
+
+> 参考
+> 四月份计划、五月份计划、七月份计划。
+> 开始执行具体的计划。
+
+
+### 数据处理11.8-11.14
+
+* [ ] 恶意软件论文阅读 9-12月的论文阅读。提取关键信息。
+* [ ] 数据集特征提取和打标签
+* [ ] 模型建立&集中式机器学习
+
+
+### 非独立同分布实验11.15-11.21
+* [ ] 非独立同分布实验效果调整
+
+### 隐私保护11.22-11.28
+
+* [ ] 隐私保护实验验证
+
+### 系统构建11.29-12.12
+
+> 关于系统构建的说明
+> * 
+
+* [ ] 服务注册与发现
+* [ ] 远程协同训练系统的实现
+* [ ] 前端界面实现
+
+
+### 论文专利12.12-1.1
--- a/工作日志/2021年11月5日-工作岗位.md
+++ b/工作日志/2021年11月5日-工作岗位.md
@@ -0,0 +1,73 @@
+## 个人分析
+> 有个人教会自己生活就好了，你还指望，她能帮你打理好工作，你有病吧。当个人吧，做点人事。
+> 总有一天，你会发现彼此都是普通人。
+### 需求
+
+* 工资（40%）
+  * 总包40w以上，基础工资越高越好。
+  * 年终奖+绩效奖金
+* 福利（10%）
+  * 户口（中等，可以走双一流学科，大部分企业应该都能够提供户口）
+  * 股票、签字费。可有可无
+  * 五险一金（待遇基本一致）
+* 平台（40%）
+  * 技术栈（java？C++？Go？）
+  * 业务内容
+  * 发展前景
+* 环境（20%）
+  * 晋升空间
+  * 工作环境（工位、饮食）
+  * 人文环境（加班、）
+
+## 需要考虑的公司
+
+### IBM
+* 岗位：
+* 待遇：
+* 优劣：
+* 进度：拒绝
+
+
+### 美团
+
+* 岗位：
+* 待遇：
+* 优劣：
+* 进度：
+
+### 蚂蚁金服
+
+* 岗位：
+* 待遇：
+* 优劣：
+* 进度：
+
+### 字节跳动
+
+* 岗位：
+* 待遇：
+* 优劣：
+* 进度：
+
+
+### 华为
+
+
+
+* 岗位：
+* 待遇：
+* 优劣：
+* 进度：
+
+
+### 小米
+
+* 岗位：
+  * 云计算-软件开发
+* 待遇：
+* 优劣：
+* 进度：
+
+* 完全明白我们的业务内容，估计也不会跑出这个范围。太偏业务了。想去做点底层技术，能够加深对技术理解的工作。
+* 大概能找到真正适合自己的地方。尝试一下吧。回来把这张表格填完。
+* 不要妄自菲薄，也不要过度用词。
--- a/工作日志/2021年11月8日-今日计划.md
+++ b/工作日志/2021年11月8日-今日计划.md
@@ -0,0 +1,6 @@
+## 任务
+
+
+## 收获
+
+> 
--- a/工作日志/2021年8月9日-今日计划.md
+++ b/工作日志/2021年8月9日-今日计划.md
@@ -1,3 +1,5 @@
+
+
 ## 收获


--- a/工作日志/2021年9月9日-今日计划.md
+++ b/工作日志/2021年9月9日-今日计划.md
@@ -10,7 +10,7 @@

 昨天看到一个名词，回避型依恋人格。你以为周围的人都那样，其实最如此的是自己。你的心里保护机制太强了，除了自己，你没办法信任任何人，然而，你多么想多么想多么想有那么一个可以信任的人呢？孤独，孤独是内心的拉扯，不是没有朋友，而是内心想孤立自己。

-“如果你想要和别人制造几班，就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。
+“如果你想要和别人制造羁绊，就要承受流泪的风险”不制造羁绊就不会流泪。所以你选择逃避。

 为什么过去的三个月，感觉那么舒服那么轻松，为什么从这周开始，就莫名其妙的又开始思考这些无用的东西？问题出在哪里？又开始孤独了，又想找个人依靠了？又想有个人可以分享生活了？没有人愿意和你成为那样的朋友，只有因为签订了契约迫不得已的人。最后还是会败给自己的冲动，呵，不过是再安慰自己一次，你很擅长这个。

--- a/工作日志/毕业设计.md
+++ b/工作日志/毕业设计.md
@@ -4,40 +4,36 @@

 ### 1.1 研究背景和意义

-1. 恶意软件检测。
-   1. （巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。）尽管机器学习服务取得了成功，但它们的有效性在很大程度上依赖于大量的数据
-   1. 数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢？肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习，获得机器学习模型，解决了数据量的问题和利用边缘设备的计算能力。
-   2. 同时传统的机器学习中，在数据搜集过程中侵犯隐私的问题。结合恶意软件来说。
-   3. 这种为了从数据角度对机器学习模型进行提升思想，需要解决如下三个数据问题或者满足以下三个数据方面的需求。
-2. 数据的需求，数据的问题：
-
-   1. 数据量扩充的需求 和 数据隐私保护的需求、（为什么要研究）
-   2. 数据隐私保护进一步提升（研究内容）
-   3. 数据非独立同分布的问题（研究内容）
-3. 针对以上背景，研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面：
+1. 安卓系统应用。
+2. 恶意软件泛滥。
+3. 恶意软件检测。基于机器学习的恶意软件检测方案（巴拉巴拉介绍一对机器学习、深度学习在恶意软件检测领域的应用。）尽管机器学习服务取得了成功，但它们的有效性在很大程度上依赖于大量的数据。
+4. 隐私保护问题。
+5. 数据的需求和隐私保护的矛盾（当前恶意软件检测中存在的主要矛盾和问题）。数据成为限制机器学习算法的主要瓶颈。那么广大数据在哪里呢？肯定分散在用户设备上。所以我们提出了基于边缘学习联合学习的分布式机器学习方案。直接在拥有用户的本地设备上进行学习，获得机器学习模型，解决了数据量的问题和利用边缘设备的计算能力。同时传统的机器学习中，在数据搜集过程中侵犯隐私的问题。
+6. 最后提出基于联邦学习的恶意软件检测。结合恶意软件来说。数据的需求：数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决。恶意软件数据隐私保护进一步提升（研究内容）。恶意软件数据非独立同分布的问题（研究内容）。

+7. 针对以上背景，研究基于机器学习的恶意软件检测模型构建方案有十分重要的意义。这种意义主要体现在以下几个方面：
   1. 扩展了机器学习模型获取数据的范围。利用了边缘设备的计算能力。
   2. 解决了集中式学习搜集数据困难、搜集数据过程中会侵犯用户隐私的问题。
-4. android+恶意软件---->恶意软件检测---->基于机器学习的恶意软件检测方案
-5. 数据的需求：数据隐私保护的需求、数据无标签问题的解决、数据非独立同分布训练模型、数据动态变化问题的解决
-6. 针对以上背景，研究基于深度学习的恶意软件检测模型构建方案有十分重要的意义
+   3. 增强恶意软件检测的能力。增强隐私保护能力。

 > 说实话，我主要是解决联邦学习中的问题，而非解决恶意软件检测的问题。为了解决数据中存在的问题，而非恶意软件相关的问题。如何让解决的问题与恶意软件检测进行强相关？而非与联邦学习强相关。
 >
-> 训练数据+训练算法->训练模型->恶意软件检测。
+> 原始数据+特征提取->训练数据+训练算法->训练模型->恶意软件检测。
 >
 > 通过概述训练算法，解决训练数据中的需求和存在的问题，从而改善训练模型的准确率。而非直接更改模型，增强恶意软件检测的结果。需要把这个东西说明。
 >
 > 以下是本文章的研究逻辑：
 >
-> 传统机器学习方法存在问题（研究背景）---->扩展数据、隐私保护、边缘设备计算能力（研究的意义）---->研究联邦学习（研究方向）----->联邦学习中存在的一系列问题----->无标签、非独立同分布、隐私保护（研究目标）------>半监督、非独立同分布、隐私保护方法（研究内容）
+> 传统机器学习方法存在问题（研究背景）---->非独立同分布、隐私保护（研究的意义）---->研究联邦学习（研究方向）----->联邦学习中存在的一系列问题----->非独立同分布、隐私保护（研究目标）------>非独立同分布、隐私保护方法（研究内容）

 ### 1.2 国内外研究现状
-
-> 这里应该是本次研究对比的对象。
-
 #### 恶意软件的研究现状

+1. 数据集方案（当前流行的主流数据集、恶意软件数据集）
+2. 特征提取方案（）
+3. 模型构建方案（）
+4. 缺乏保护隐私的方案
+
 #### 联邦学习的研究现状

 * 联邦学习与非独立同分布问题
@@ -148,12 +144,34 @@


 ### 6.2 系统详细设计
+> 存在多个功能模块。按子系统讲解。需要起个合理的名字。
+> 服务端子系统
+> * 服务注册和发现模块
+> * 客户端选择模块
+> * 控制服务模块
+> * 聚合服务模块（提供多种聚合服务）
+> * 训练服务模块（提供多种训练类型的聚合，不同端）
+> 
+> 控制端子系统
+> * 训练控制模块
+> * 
+> 
+> 客户端子系统
+> * 服务访问模块
+> * 模型训练模块
+
+
 1. 特征提取模块
 2. 训练控制模块
 3. 网络通信模块
 4. 训练展示模块
 5. 实验结果对比模块

+### 6.3 系统测试
+> 列出测试过程中的关键指标。
+1. 各个模块的功能测试
+2. 系统整体的集成测试
+3. 最终的界面展示
 ## 第七章：结论
 > 3个研究内容。
 ### 基于贡献度和元学习的联邦学习算法