You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

行程数据集日均真实平均里程计算方法的选择及原理咨询

行程数据集日均真实平均里程计算方法的选择及原理咨询

嗨,Anna,这个问题其实戳中了简单算术平均加权平均的核心差异,咱们来拆解清楚哪种方法更贴合你要的“真实”日均里程:

先搞懂两种方法的本质

  • 方法一:先算单行程日均再取简单平均
    你先给每个行程算出miles per day,再对这些值求平均,本质是把每个行程当成了同等重要的样本——不管这个行程持续1天还是100天,它在平均计算里的权重都是一样的。

    拿你的例子来看,Trip1持续30天(占总天数的61%),但它和只持续3天的Trip3在这个计算里各占25%的权重,这就会让短行程的日均数据过度影响最终结果,偏离了“日均里程”的真实含义。

  • 方法二:总里程除以总天数 SUM(miles)/SUM(days)
    这个方法是把每一天当成了一个独立样本,自动给天数多的行程赋予了更高的权重——毕竟30天的行程对整体日均的影响,本来就应该是3天行程的10倍。

    回到你的例子,总里程780英里,总天数49天,算出的15.9mi/day,反映的是所有行程覆盖的每一天里,平均每天行驶的英里数,这才是真正意义上的“日均里程”。

哪种方法更适合你的需求?

如果你想知道的是:

  • 整个行程周期内,平均每天跑多少英里:选方法二,这是最贴合“日均里程”定义的结果,尤其是当不同行程的天数差异较大时,它能准确反映整体的行驶效率。
  • 每个行程的日均里程的平均值(比如想统计“平均每个行程每天跑多少”):才用方法一,但这和你要的“真实日均里程”不是同一个概念。

关于负日均里程的情况

哪怕存在负的miles per day值,方法二依然是更合理的选择——比如一个持续10天的负里程行程,对整体日均的影响,显然应该比只持续1天的负里程行程大10倍,方法二会自动考虑这个权重差异,而方法一还是会把它们当成同等权重的样本,结果会失真。

备注:内容来源于stack exchange,提问作者Anna

火山引擎 最新活动