mirror of
https://github.com/oldratlee/translations.git
synced 2026-04-09 05:27:48 +08:00
统一引号使用『』
This commit is contained in:
@@ -118,7 +118,7 @@
|
||||
|
||||
支持多种流量分配类型的主要目的一方面是为了保持处理的一致性,另外也希望可以覆盖到所有可能的情况,比如因时间变化而表征出来的不同特征。基于这些原因,我们以特定的顺序对不同的流量分配类型进行分流:用户`id`,`cookie`,`cookie`日期,随机。一旦这个请求被某高优先级分配方式抽中后,其它低优先级的分配方式将忽略这个请求(图3),虽然这个顺序最大化地了一致性,但它也有一个缺点,比如,在同一层中1%的`cookie`取模流量会比1%的随机流量大,在极端情况下,我们会遇到流量饥饿问题。在实践中,一层之中一般只应有一种分流类型,实验和对比实验必须使用相同的分流类型,最主要的影响是不同的分流类型实验需要不同的样本量(见5.2.1节)。
|
||||
|
||||
在通过流量分配类型选择一部分流量后,**分流条件**(`condition`)通过仅分配特定条件的流量给实验或域,以达到更高效利用流量的目的。比如,一个实验仅仅改变来自日语的查询,那么实验配置中只抽取日语的流量。我们可以基于地区,语言,浏览器等信息设置流量抽样条件。有了分流条件,一个只使用“日语”流量的实验,和一个只使用英语流量的实验,可以使用相同的`cookie`取模。另一个使用分流条件的场景是灰度测试新代码(代码是通过二进制推送发布的),比如,在一股小流量上测试新代码,以保证新代码没有`bug`,并与预测一致,然后才能放到大流量环境中(灰度环境中,通过错误日志和实验监控方式检查`bug`)。为了支持这种使用场景,我们提供了以机器或数据中心为分流条件的分配方式,它进一步限制了一个实验的流量。虽然灰度实验无法代替严格的测试,但它们是一个有用的补充,因为它既限制了潜在的错误,并且它让新的代码在真实环境中运行,从而可以遇到各种在测试环境中很难构造的真实请求。
|
||||
在通过流量分配类型选择一部分流量后,**分流条件**(`condition`)通过仅分配特定条件的流量给实验或域,以达到更高效利用流量的目的。比如,一个实验仅仅改变来自日语的查询,那么实验配置中只抽取日语的流量。我们可以基于地区,语言,浏览器等信息设置流量抽样条件。有了分流条件,一个只使用『日语』流量的实验,和一个只使用英语流量的实验,可以使用相同的`cookie`取模。另一个使用分流条件的场景是灰度测试新代码(代码是通过二进制推送发布的),比如,在一股小流量上测试新代码,以保证新代码没有`bug`,并与预测一致,然后才能放到大流量环境中(灰度环境中,通过错误日志和实验监控方式检查`bug`)。为了支持这种使用场景,我们提供了以机器或数据中心为分流条件的分配方式,它进一步限制了一个实验的流量。虽然灰度实验无法代替严格的测试,但它们是一个有用的补充,因为它既限制了潜在的错误,并且它让新的代码在真实环境中运行,从而可以遇到各种在测试环境中很难构造的真实请求。
|
||||
|
||||

|
||||
**图3**:决定请求进入域、层、实验的逻辑
|
||||
@@ -246,7 +246,7 @@ _Kohavi_ 假设实验与对照实验有相同的大小,比如 <img src="http:/
|
||||
|
||||
* 错误配置的实验变少了,尽管我们仍偶尔会遇到日志的问题(反事实)或是诡异的错误/失败情况。
|
||||
* 被遗忘的实验变少了(比如,有进行了实验,却之后忘记了分析实验)。
|
||||
* “究竟你是用什么指标衡量CTR的”或是“你用的是什么过滤器”的讨论减少了,有一个权威的分析工具,讨论的重点现在仅在于对指标进行解释,而不是确保指标的定义和计算都是合理的。
|
||||
* 『究竟你是用什么指标衡量CTR的』或是『你用的是什么过滤器』的讨论减少了,有一个权威的分析工具,讨论的重点现在仅在于对指标进行解释,而不是确保指标的定义和计算都是合理的。
|
||||
* 更好的合理性检查,比如有预时期来确保实验所用的流量是没有问题的。
|
||||
|
||||
显然理想的结果是上述问题都不存在,但是考虑到我们有更多的实验者,而上述问题即在下降,这已经是一个不错的结果。
|
||||
|
||||
Reference in New Issue
Block a user